那曲檬骨新材料有限公司

0
  • 聊天消息
  • 系統消息
  • 評論與回復
登錄后你可以
  • 下載海量資料
  • 學習在線課程
  • 觀看技術視頻
  • 寫文章/發帖/加入社區
會員中心
創作中心

完善資料讓更多小伙伴認識你,還能領取20積分哦,立即完善>

3天內不再提示

細說SPI主機發送性能最大化實現方案

先楫半導體HPMicro ? 2023-07-31 23:03 ? 次閱讀

一、背景

在《先楫hpm6000的SPI外設使用四線模式操作讀寫華邦flash》一文中介紹了先楫SPI外設是為flash器件而生的控制器,但是樓主在該篇文章讀寫flash的頁是用的poll輪詢讀寫spi fifo的接口,并沒用DMA來進行加速優化。本篇就是基于SPI配合DMA實現理論速度性能。

二、問題點

(一) SPI FIFO poll阻塞發送無法發揮SPI理論速度性能

使用spi poll阻塞的時候,雖然能實現數據的完整傳輸,但是傳輸的時間并不能達到理想傳輸速度,比如SPI四線模式下,30M的SPI SCLK時鐘,理論可以達到15MB/S速度。但實際測量當中并未達到該性能。從邏輯分析儀看到,發送flas一頁數據,也就是256字節,從開始傳輸到結束傳輸的時間需要37.034us,合計為6.91MB/S,與理論速度相差了2到3倍的距離。


53e38048-2fb3-11ee-bbcf-dac502259ad0.png

從波形上看,導致這個速度達不到原因就在于,每個字節之間存在了一定的間隔時間,這些間隔的累積導致傳輸時間變長,導致總的時間變長,進而速度遠遠跟不上。

5418fe94-2fb3-11ee-bbcf-dac502259ad0.png

(二)使用了DMA仍然有SPI SCLK時鐘不連續問題

從(一)的問題可以看出,要想達到理論速度,必須消除每個字節的SCLK間隔,縮短傳輸時間。這時候需要DMA來加持速度性能,但實際上,在使用了相關配置之后,速度雖然有些提升,但還是存在些許間隔產生。


在這里的例子驗證條件是:SPI SCLK時鐘頻率為50M,主機發送512字節。理論傳輸速度可以25MB/S.從邏輯分析儀可看到,間隔有所縮短,但依然存在字節間隔。512字節傳輸需要45.97us,合計為11.173MB/S。距離25MB/S也有兩倍的差距。

5442dd9a-2fb3-11ee-bbcf-dac502259ad0.png

三、解決問題

在二問題的所有描述當中,速度達不到理想性能,歸根到底是字節之間產生間隔累積形成。

所以我們的問題解決點是:再配合DMA,進行其他優化。達到理想速度性能。


(一) 使用AHB SRAM(內存32KB空間)作為數據交互RAM。

在HPM6000系列中,AHB/APB外設總線連接了一個內存為32KB空間的AHB SRAM,與之同時連接的也有DMA控制器之一HDMA。


從官方文檔可知,AHB SRAM和HDMA以及SPI外設同樣位于AHB/APB外設總線中,AHB SRAM是專門給HDMA進行低延時訪問的內存,也是SPI進行DMA低延時傳輸保證。

5481dde2-2fb3-11ee-bbcf-dac502259ad0.png

在上面的DMA搬運中,待發送的數據放在AXI SRAM中。那么把這發送的數據放在AHB SRAM,看下會不會有所提升。

54ac15c6-2fb3-11ee-bbcf-dac502259ad0.png

從以下邏輯分析儀結果看出,傳輸512字節,相比放在AXI_SRAM中,在AHB_SRAM只需要22.97us,縮短了23us, 合計22MB/S,提高了兩倍速度性能。當仍與25MB/S理想速度有些許差距。

54c34318-2fb3-11ee-bbcf-dac502259ad0.png

通過放大波形查看,有些字節依然產生間隔,這也是導致速度沒達到理想速度的原因。

54daedba-2fb3-11ee-bbcf-dac502259ad0.png

(二)使用DMA的burst突發傳輸

先楫的DMA,對于源地址數據來說,支持突發傳輸。例如傳輸位寬為8,設置burst數量為4,那么就是相當一次DMA請求設置了4個節拍,連續傳輸4個字節。是單次傳輸的4倍效率。在這里來說,待發送的數據就是源地址數據。

5504adee-2fb3-11ee-bbcf-dac502259ad0.png

先楫的SPI控制器有四個字的FIFO數據空間,每個FIFO是32位。SPI請求DMA搬運是通過發送FIFO閾值請求。從效率上來看,最好是一次請求中能把FIFO數據全部搬運。從上面的優化流程來看,都設置為了默認,TX FIFO閾值設置為了0,也就是只要TXFIFO有一個為空就請求一次,DMA的源數據burst數量為0,也就是相當設置了1個節拍的突發傳輸,傳輸寬度為8位,一次DMA請求就塞給一次FIFO,等待FIFO完全塞滿后這時候沒法請求,所以會導致一次周期的間隔,當DMA收到請求后連這樣能解釋上面為何每隔四個字節會產生間隔的原因。

553c9e70-2fb3-11ee-bbcf-dac502259ad0.png

所以這里我們可以SPI的TXFIFO閾值為3,當出現一個空位的時候就請求一次,設置burst數量為2,也就是四個字節,一次請求搬運四個字節。通過邏輯分析儀可看到:


配合(一)的方案,傳輸512字節,只需要20.468us,合計為25MB/S左右,接近了理想速度性能了。

5591a99c-2fb3-11ee-bbcf-dac502259ad0.png

放大波形查看,也能看到SCLK時鐘連續了。

55b32838-2fb3-11ee-bbcf-dac502259ad0.png

(三)壓榨性能(使用SPI的字節合并merge功能)

先楫官方手冊說明的是SPI時鐘可以80M,保守是40M。在四線模式下,SPI時鐘SCLK為80M,相比單線來說可以提高四倍性能傳輸,也就是可以達到40MB/S。


但是在實際操作的時候,分頻SPI SCLK頻率到66M,又出現了SCLK時鐘不連續的情況,導致與理想速度不符合。

55d5be02-2fb3-11ee-bbcf-dac502259ad0.png

仔細翻下官方手冊,可以知道SPI有個寄存器是TRANSFMT,有一個位是DATAMERGE,對于描述如下:

55f75526-2fb3-11ee-bbcf-dac502259ad0.png

特別說明的是,由于SPI的數據FIFO是32位,這個功能只在數據單位長度為8位的時候有效,而且合并的數據量需要以四的整數倍。如此來說,在配置DMA的時候,傳輸寬度可以從8位變到32位,傳輸的帶寬也能提高了四倍。那么我們這樣配置下,邏輯分析儀結果如下:

在66M的SPI SCLK時鐘下,邏輯分析儀抓到的SCLK能保持連續,并且數據能對得上。512字節耗時15.352us,合計33MB/S左右,與理論速度33MB/S接近。


564514f0-2fb3-11ee-bbcf-dac502259ad0.png

80M的SPI SCLK頻率,傳輸512字節,耗時12.794us,合計40MB/S左右,也能滿足預期40MB/S速度。

566b762c-2fb3-11ee-bbcf-dac502259ad0.png

SCLK波形也能保持連續。

568a2266-2fb3-11ee-bbcf-dac502259ad0.png

四、號外(單線SPI總線可以達到120M)

四線模式既然能達到80M,那么樓主想試下80M的單線,也是沒問題的,效果如下:

56aeecc2-2fb3-11ee-bbcf-dac502259ad0.png

再嘗試一把,把SPI SCLK分頻到120M,只是稍微有點間隔,但單線SPI也是沒問題的。

56c8aec8-2fb3-11ee-bbcf-dac502259ad0.png

五、總結

對于先楫這個SPI外設來說,配合DMA,SPI的數據FIFO以及相關SPI配置,能達到手冊描述的性能。無論是四線模式還是二線模式還是單線模式,都能到達80M的SPI時鐘性能。


對于SCLK不連續的問題在于DMA搬運和SPI傳輸不同步造成,導致傳輸間隔中斷,特別是SPI頻率越來越高的情況下。解決同步問題就不會有SCLK不連續的問題存在。

以上內容來自先楫開發者原創分享。

我們始終相信開發者共創的力量。先楫社區堅持開源共享、互惠互利,貼近每一個開發者,一步一個腳印,一點一滴積累,為成為更好的我們而不斷努力。

聲明:本文內容及配圖由入駐作者撰寫或者入駐合作網站授權轉載。文章觀點僅代表作者本人,不代表電子發燒友網立場。文章及其配圖僅供工程師學習之用,如有內容侵權或者其他違規問題,請聯系本站處理。 舉報投訴
  • 主機
    +關注

    關注

    0

    文章

    1010

    瀏覽量

    35306
  • 時鐘
    +關注

    關注

    11

    文章

    1746

    瀏覽量

    131798
  • SPI
    SPI
    +關注

    關注

    17

    文章

    1721

    瀏覽量

    92116
  • dma
    dma
    +關注

    關注

    3

    文章

    566

    瀏覽量

    100953
收藏 人收藏

    評論

    相關推薦

    EE-19:最大化DSP-21xx系列DSP(不包括ADSP-218x)的引導內存效率

    電子發燒友網站提供《EE-19:最大化DSP-21xx系列DSP(不包括ADSP-218x)的引導內存效率.pdf》資料免費下載
    發表于 01-14 16:09 ?0次下載
    EE-19:<b class='flag-5'>最大化</b>DSP-21xx系列DSP(不包括ADSP-218x)的引導內存效率

    EE-365:在ADSP-CM40x混合信號控制處理器上實現ADC采樣速率最大化

    電子發燒友網站提供《EE-365:在ADSP-CM40x混合信號控制處理器上實現ADC采樣速率最大化.pdf》資料免費下載
    發表于 01-13 16:52 ?0次下載
    EE-365:在ADSP-CM40x混合信號控制處理器上<b class='flag-5'>實現</b>ADC采樣速率<b class='flag-5'>最大化</b>

    光伏發電如何實現能效最大化

    光伏發電實現能效最大化是一個綜合性的問題,需要從多個方面入手。以下是一些關鍵措施: 一、選用優質設備 太陽能板 :選用具有高光電轉化效率和穩定性的太陽能板是基礎。例如,單晶硅太陽能板通常比多
    的頭像 發表于 12-05 11:06 ?376次閱讀

    運營商如何實現差異化連接

    如今,運營商正置身于一場關于如何極致釋放5G投資的高難度挑戰。本期《信觀察》將聚焦于如何通過“差異化連接”推動基于性能的服務,進而實現可擴展、可持續的解決方案,助力運營商將5G投資的價值“最大
    的頭像 發表于 11-18 14:38 ?2440次閱讀

    spi master接口的fpga實現

    前言 當你器件的引腳賊少的時候,需要主機和從機通信,spi就派上了用場,它可以一對多,但只是片選到的從機能和主機通信,其他的掛機。 spi:serial peripheral inte
    的頭像 發表于 11-16 10:35 ?575次閱讀
    <b class='flag-5'>spi</b> master接口的fpga<b class='flag-5'>實現</b>

    KM振動分析與動平衡服務實現工廠設備效率最大化

    振動儀
    KM預測性維護專家
    發布于 :2024年10月16日 15:57:14

    擴展塢使用技巧:如何最大化你的筆記本電腦接口能力

    最大化您的筆記本電腦接口能力,以下是一些實用的擴展塢使用技巧: 了解您的需求:在購買擴展塢之前,明確您需要哪些類型的端口(如HDMI, USB-C, RJ45等)以及是否需要充電功能,以選擇最適合
    的頭像 發表于 10-08 10:52 ?680次閱讀

    液冷充電槍線最大化提高充電效率

    法法易提供的液冷充電槍線可以最大化的提升充電效率,讓大家的充電時間進一步縮短。? 液冷充電槍線使用液體循環來冷卻電纜,以避免因高溫而導致電纜損壞或充電速度減緩。而且液冷充電槍線采用銅芯導線和耐高溫、耐磨損、
    的頭像 發表于 09-11 14:25 ?486次閱讀

    Renesa RA如何使用SPI實現高速比特流的發送

    有些特殊的外設會使用基于SPI模式,發送連續比特流來傳輸數據。本文主要介紹對于Renesa RA,如何使用SPI實現高速比特流的發送
    的頭像 發表于 07-22 14:38 ?1607次閱讀
    Renesa RA如何使用<b class='flag-5'>SPI</b>來<b class='flag-5'>實現</b>高速比特流的<b class='flag-5'>發送</b>

    wifi的發送支持DMA嗎?

    wifi的發送支持DMA嗎? send(),這個函數是阻塞的嗎?怎么發送可以最大化發送頻率?我想在發送完成后處理一些東西,可不可以設置
    發表于 06-24 07:33

    請問esp32c3 spi slave從機端不能實時發送數據嗎?

    都是預先填充sendbuf,在阻塞等待spi主機發起,數據能正常發送 能否實現spi_slave_transmit等待,事件觸發,填充s
    發表于 06-21 08:15

    STM32作為主機,通過SPI進行數據交互,發送數據的時候出現亂碼怎么解決?

    我們使用ESP32-pico-mini與STM32DIY一款電子產品。使用ESP32做從機,STM32作為主機,通過SPI進行數據交互,當時鐘頻率為40MHz時,從STM32到ESP32傳輸音頻
    發表于 06-12 06:20

    PCB設計優化指南:如何最大化EMC性能效果?

    電源平面與GND平面相鄰,平面間距離很小,有最佳的磁通抵消效果和低的電源平面阻抗。主電源及其對應的地布在4、5層,層厚設置時,增大S2-P之間的間距,縮小P-G2之間的間(相應縮小G1-S2層之間的間距),以減小電源平面的阻抗,減少電源對S2的影響。
    發表于 04-08 14:22 ?1443次閱讀
    PCB設計優化指南:如何<b class='flag-5'>最大化</b>EMC<b class='flag-5'>性能</b>效果?

    STM32G070 SPI主機只接收模式關閉SPI使能后為什么還有時鐘輸出?

    使用STM32G070,一個板子實現主機只接收,另一個板子實現從機只發送,通信波形上發現主機SPI
    發表于 03-28 07:08

    SPI雙機通信中,時鐘信號由主機提供,那么從機向主機發送數據時需要時鐘信號嗎?

    SPI雙機通信中,時鐘信號由主機提供,那么從機向主機發送數據時需要時鐘信號嗎?從機是怎樣通知主機產生時鐘信號的?
    發表于 03-14 06:49
    网上百家乐官网哪里| 大发888在线娱乐合作伙伴| 微信百家乐群二维码| 大发888娱乐城客服lm0| 钟山县| 最新娱乐城送体验金| 百家乐官网庄家提成| E世博百家乐官网的玩法技巧和规则| 澳门百家乐下三路| 威尼斯人娱乐城不打烊| 足球比分| 财神百家乐官网娱乐城| 逍遥坊百家乐官网的玩法技巧和规则 | 大发888游戏平台17| 长乐坊百家乐官网娱乐城| 百家乐官网群| 水果机上分器| 长乐坊百家乐官网娱乐城| 百家乐官网系统分析器| 百家乐有什么打法| 南通棋牌游戏金游世界| 百家乐官网专用台布| 百家乐英皇娱乐场开户注册| 御匾会娱乐城| 百家乐官网玩法| 边城棋牌中心| 百家乐官网baccarat| 威尼斯人娱乐城注册送彩金 | 百家乐官网ag厅投注限额| 百家乐是片人的吗| 大发888 迅雷快传| 百家乐官网群1188999| 赢家百家乐的玩法技巧和规则 | 最好的百家乐官网游戏平台1| 百家乐连跳趋势| 百家乐官网怎样发牌| 百家乐投注技巧建议| 明珠| 订做百家乐官网桌子| 百家乐2棋牌作弊软件| 平潭县|