那曲檬骨新材料有限公司

0
  • 聊天消息
  • 系統消息
  • 評論與回復
登錄后你可以
  • 下載海量資料
  • 學習在線課程
  • 觀看技術視頻
  • 寫文章/發帖/加入社區
會員中心
創作中心

完善資料讓更多小伙伴認識你,還能領取20積分哦,立即完善>

3天內不再提示

FPGA設計中如何在寬頻噪聲環境,尋找到目標特征數據?

丫丫119 ? 來源:未知 ? 作者:肖冰 ? 2019-09-25 06:50 ? 次閱讀

1、背景

數字信號處理是現代通信、雷達和電子對抗設備的重要組成部分。在實際應用中,利用數字信號處理技術對接收數據進行處理,不僅可以實現高精準的目標定位和目標跟蹤,還能夠將目標識別、目標成像、精確制導、電子對抗等功能進行拓展,實現多種業務的一體化集成。

在現代雷達系統中,隨著有源相控陣和數字波束形成(DBF)技術的廣泛應用,接收前端存在大量的數據需要并行處理,并需要保證高性能和低延遲的特點。雷達日益復雜的應用環境,讓雷達系統具備自適應于探測目標和環境的能力,數字信號處理部分也需要使用多種更加復雜的算法,并且可以做到算法模塊化,以及通過軟件配置功能模塊的參數,實現軟件定義的功能。更大的數據處理帶寬能夠使雷達獲得更高的分辨率,更高的工作頻率使得雷達可以小型化,能夠在更小的平臺上安裝,這樣對于硬件平臺實現也有低功耗的要求。

在電子對抗設備中,可以在最短的時間內對多個威脅目標進行快速分析和響應,同樣需要數字信號處理的相關算法具備高實時,高動態范圍和自適應的特點。如何在寬頻噪聲的環境中尋找到目標的特征數據,如何在寬帶范圍內制造虛假目標實現全覆蓋,數字信號的處理性能是至關重要的設計因素。

加速云的SC-OPS和SC-VPX產品,針對5G通信和雷達的數字信號處理的要求,結合Intel最新14nm工藝的Stratix10 FPGA系列,提供了一套完整的硬件和軟件相結合的解決方案。SC-OPS產品作為單獨的硬件加速卡,通過PCIe插卡的方式實現與主機的通信功能,還可以通過多卡級聯的方式實現數字信號的分布式處理方案。SC-VPX產品是由FPGA業務單板、主控板和機箱組成的VPX系統。借助于FPGA可編程的特性,加速云提供了高性能數學加速庫FBLAS和FFT的RTL級IP,具有高性能和算法參數可配置的特點實現了多重信號分類(MUSIC)和自適應數字波束形成(ADBF)的核心算法,提高了5G通信和雷達在對抗干擾方面的性能。為了方便客戶使用高層語言開發,加速云提供基于FPGA完整的OpenCL異構開發環境,快速實現用戶自定義的信號處理加速方案。

圖1、加速云SC-OPS和SC-VPX產品

2、方案組成

2.1 基于SC-OPS產品的系統架構圖

圖2、SC-OPS產品系統框圖

基于SC-OPS產品的系統分別由硬件資源層,算法實現層和應用層三部分組成。

SC-OPS加速卡作為主要的硬件平臺,采用IntelStratix10 GX2800 FPGA器件,集成2753KLE資源和9.2TFLOPS單精度浮點計算能力。單板支持2個40/100G光口或電口,支持板間通信以及設備間級聯。板卡支持8個DDR4-2400MHz 72bits位寬的內存通道(ES支持2133MHz),以及PCIeGen3 16Lane的主處理器通信接口

通過在主機內插入一張或多張SC-OPS加速卡的形式,可以實現不同性能的硬件集成。以一機八卡服務器為例,整機具備73.6TFLOPS的單精度浮點計算能力,并具有納秒級低延時特性,可應用于高性能的數字信號處理的解決方案。加速云在算法實現層提供了基于FPGA邏輯實現的高性能數學加速庫FBLAS,FFT,MUSIC和ADBF核心算法,以上功能模塊都是以IP形式提供,并提供相應的API接口函數,通過PCIe接口實現在應用層的調用,從而可以搭建軟件定義雷達系統,實現超高性能高靈活的雷達仿真平臺。對于更加關注于自定義算法實現的用戶來說,加速云還可以支持面向OpenCL的FPGA異構平臺開發環境,提供了SC-OPS板卡對應的BSP,用戶只需要自行編寫OpenCL Kernel和Host程序,即可以快速的實現相關算法的二次開發。

2.2 基于SC-VPX產品的系統架構圖

圖3、SC-VPX產品系統框圖

基于SC-VPX產品的系統,與SC-OPS相比,區別在于硬件平臺實現。SC-VPX系統由5塊FPGA業務單板,1塊X86主控板和6U標準VPX機箱組成。其中FPGA業務單板采用板載XEON-DX86主控和1~2片Stratix10 GX2800 FPGA器件的方案,集成2753K*2 LE資源和9.2 *2 TFLOPS單精度浮點計算能力。每片FPGA支持4個DDR4-2400MHz 72bits位寬的內存通道。前面板支持8個17.5Gbps光口,背板提供32個10.3125Gbps的高速接口,支持業務單板之間的全mesh高速互聯網絡,X86主控板與業務單板之間采用PCIe和GE的雙控通信方案。

用戶可以選擇加速云提供的主控板和多塊FPGA業務單板,整機最高可以支持92TFLOPS單精度浮點處理能力,配合相關算法IP,實現多種數字信號處理的算法或者分布式實現大容量數據處理的算法。由于SC-VPX整套系統都是符合OpenVPX的標準,用戶可以添加其他各種功能板卡,包括AD/DA板、RapidIO交換板、存儲板等,結合加速云的主控板和FPGA業務單板,組建成一套完整的信號接收處理雷達系統,無論是應用于相關產品還是科研,都可以幫助用戶實現系統級的解決方案。

3、系統優勢

3.1優異的能效比

能效比是評估數字信號處理時一個關鍵的指標,即GFLOPS per Watt。表1中羅列了各類設備平臺的數字信號處理能力的能效比,加速云采用IntelStratix10 FPGA的方案具備最優的能效比。

類型 系列 單精度浮點
運算能力
功耗 能效比
FPGA IntelStratix10 9.2TFLOPS 120W 76.6 GFLOPS/W
FPGA IntelArria10 1.5TFLOPS 30W 50 GFLOPS/W
DSP TITMS320C6678 160GFLOPS 15W 10.6 GFLOPS/W
GPU NVIDIA Tesla P40 12T FLOPS 250W 48 GFLOPS/W
CPU 至強12核(IntelXEONE5-2697) 219GFLOPS 130W 1.68 GFLOPS/W

表1、各平臺數字信號處理能力效能比的對比

3.2 FPGA IO靈活可編程

FPGA最大的特點在于IO可編程,可以提供各種高速和低速IO的協議標準,匹配用戶實現多樣系統互聯的要求。比如SC-OPS板卡的2個高速互聯接口,分別可以配置為40GE,100GE或SRIO的標準。SC-VPX FPGA業務單板的背板提供32個10.3125Gbps的高速接口支持與背板間的全mesh網絡接口,分別可以配置為10GE,40GE或SRIO的標準。

3.3高性能的算法IP

加速云基于FPGA平臺上提供了數字信號處理相關算法的IP,IP的性能決定了數字信號處理系統的性能,包括動態范圍,信號損耗,信噪比,延時等因素。

以信號處理中常用的FFT傅里葉變換為例,相比最新的DSP平臺,加速云提供的RTL級IP,使用FPGA符合IEEE 754標準的單精度浮點數字信號處理(DSP)單元,可以實現更低的計算時間。

FFTSize PerformanceofComputingFFT (time, ms) using TMS320C6678
1 core 2 cores 4 cores 8 cores
16K 0.473 0.261 0.159 0.131
FFT Size Performance of Computing FFT (time, ms) using FPGA
1 PE 2 PEs 4 PEs 8 PEs
16K 0.16 0.04 0.01 0.003

表2、DSP和FPGA平臺實現FFT算法的計算時間對比

以下是加速云提供的基于FPGA實現高性能數學加速庫FBLAS的相關性能。可以看出,借助FPGA天然的并行處理的優勢,加速云提供的算法IP,可以幫助用戶實現數字信號處理系統的快速優化,極大縮短了用戶產品Time-to-Market的時間。

算法名稱 參數 數據格式 處理性能
矩陣求逆 144*144維復數 FP32 120us
矩陣求逆 72*72維復數 FP32 53.6us
矩陣求逆 24*24維復數 FP32 10.32us
矩陣求逆 12*12維復數 FP32 3.76us
矩陣QR分解 64*64維復數 FP32 46.41us
矩陣QR分解 16*16維復數 FP32 4.99us
矩陣QR分解 8*8維復數 FP32 2.5us
特征值分解(基于QR分解,16次迭代) 64*64維復數 FP32 5200us
特征值分解(基于QR分解,16次迭代) 16*16維復數 FP32 150us
特征值分解(基于QR分解,16次迭代) 8*8維復數 FP32 65us
協方差矩陣(快拍數K=256,通道數N=8) 8維復向量 FP32 30us
協方差矩陣(快拍數K=256,通道數N=16) 16維復向量 FP32 60us
協方差矩陣(快拍數K=256,通道數N=64) 64維復向量 FP32 128us
線性方程求解 200維 FP64 420us

表3、FPGA實現高性能數學加速庫FBLAS性能示例

3.4完整的OpenCL異構開發環境

加速云SC-OPS和SC-VPX產品都可以支持面向OpenCL的FPGA異構平臺開發環境,提供全面的數學庫支持,解決了傳統FPGA遇到的時序收斂、DDR存儲器管理以及PCIe主處理器接口等難題。另外加速云也支持將高性能算法IP作為定制化組件,與OpenCLKernel集成在一起,提供靈活的算法配置解決方案。

4、應用案例

4.1多重信號分類(MUSIC)

MUSIC算法是經典的空間譜估計算法,實現波達方向估計(DOA)的相關應用。在電子偵察和電子對抗等對實時性要求嚴格的領域中,如何選用合適的平臺實現并滿足系統的響應處理速度,成為了設計者頗為頭疼的問題。整個MUSIC算法計算復雜度和靈活度都很大,而且電子對抗系統都有浮點處理的要求,所以大多用戶會采用DSP處理器的方案,處理時間停留在ms量級。加速云采用Intel集成全新浮點計算單元的FPGA,全硬件實現了基于MUSIC算法的空間譜估計DOA全部算法(MUSIC算法是基于加速云高性能數學加速庫FBLAS搭建的,所有組成IP都可以單獨調用)。相比DSP處理器,極大提升了MUSIC算法的實時性,超過10倍以上的性能改進。

圖4、FPGA實現MUSIC算法的處理流程

MUSIC算法實現的相關性能如下:

·特征值和特征向量的數值相對Matlab中EIG函數計算結果的偏差均小于10-5
·算法實現以單精度浮點為主,結合部分雙精度浮點
·全部處理時間<120us(TI6678的處理時間是ms級)

4.2自適應數字波束形成(ADBF)

隨著有源相控陣雷達的廣泛應用,如何有效增強期望信號和抑制無用信號,也是設計者需要考慮的問題。ADBF技術利用天線陣元的采樣數據,自適應更新信號的權值,使陣列天線形成特定的期望形狀。由于天線陣元通道數量大,需要實現海量數據的計算,相關平臺實現必須具有高集成度、高數據吞吐率和高數據并行計算的特點。

圖5、DBF原理示意圖

加速云借助高性能數學加速庫FBLAS,通過高維數的矩陣求逆的算法,完全在FPGA內實現了ADBF的算法。

ADBF算法實現的相關性能如下:

方位維天線方向圖 俯仰維天線方向圖

算法名稱 數據格式 性能指標(單拍) 性能指標(連續) 功耗
方位維運算 FP32 455us 245us 30W
俯仰維運算 FP32 335us 148us 30W

5、結論

通過參與了國內眾多實際雷達數字信號處理相關產品或是科研的研發和技術合作,加速云累計了大量的經驗,在此基礎上推出的SC-OPS和SC-VPX產品及高性能數學加速庫FBLAS、多重信號分類(MUSIC)、自適應數字波束形成(ADBF)等IP庫,可以幫助用戶實現系統級的解決方案。通過持續推出高密度高性能硬件平臺,高性能RTL級加速IP,配合高性能分布式軟件搭建高性能、低延時靈活配置的軟件定義平臺,推動了雷達和電子對抗設備向更先進設備的演變。

聲明:本文內容及配圖由入駐作者撰寫或者入駐合作網站授權轉載。文章觀點僅代表作者本人,不代表電子發燒友網立場。文章及其配圖僅供工程師學習之用,如有內容侵權或者其他違規問題,請聯系本站處理。 舉報投訴
  • FPGA
    +關注

    關注

    1630

    文章

    21798

    瀏覽量

    606022
  • Stratix
    +關注

    關注

    1

    文章

    31

    瀏覽量

    23688
  • 數字信號處理

    關注

    15

    文章

    563

    瀏覽量

    46001
  • 雷達
    +關注

    關注

    50

    文章

    2966

    瀏覽量

    118022
收藏 人收藏

    評論

    相關推薦

    LabVIEW無法找到任何目標設備該怎么辦?

    嗨,我正在嘗試在FPGA LabVIEW的一個新項目中添加digilent的geneys板,但顯然LabVIEW無法找到任何目標設備..我不知道這是否可能可能有驅動但我不能
    發表于 10-29 09:19

    何在低端FPGA實現DPA的功能?

    FPGA,動態相位調整(DPA)主要是實現LVDS接口接收時對時鐘和數據通道的相位補償,以達到正確接收的目的。那么該如何在低端FPGA
    發表于 04-08 06:47

    Python和Keras在訓練期間如何將高斯噪聲添加到輸入數據呢?

    模型的魯棒性。 這在訓練數據有限或具有很大可變性時特別有用,因為模型被迫學習對輸入的小變化具有魯棒性的特征。以下是如何在訓練期間向圖像添加高斯噪聲
    發表于 02-16 14:04

    基于 FPGA目標檢測網絡加速電路設計

    第一部分 設計概述 /Design Introduction目前主流的目標檢測算法都是用CNN來提取數據特征,而CNN的計算復雜度比傳統算 法高出很多。同時隨著CNN不斷提高的精度,其網絡深度與參數
    發表于 06-20 19:45

    基于噪聲環境下的MFCC特征提取

    在語音識別系統,如何在含有噪聲的語音信號中提取其良好的特征參數是系統的關鍵問題之一。本文通過采用自適應濾波來濾除語音信號的高斯白
    發表于 12-12 13:46 ?24次下載

    基于小波分析的車輛噪聲特征提取方法

       特征提取是聲目標識別的關鍵。由于車輛噪聲信號的非平穩特性,傳統特征提取方法有很大局限性。介紹小波分析方法在車輛噪聲
    發表于 12-31 17:16 ?0次下載

    噪聲寬頻帶放大器電路圖

    噪聲寬頻帶放大器電路圖
    發表于 04-08 09:23 ?1139次閱讀
    低<b class='flag-5'>噪聲</b><b class='flag-5'>寬頻</b>帶放大器電路圖

    Protel在線教程:在PCB如何找到(尋找)元件封裝

    Protel在線教程:在PCB如何找到(尋找)元件封裝
    發表于 04-22 09:04 ?3959次閱讀
    Protel在線教程:在PCB<b class='flag-5'>中</b>如何<b class='flag-5'>找到</b>(<b class='flag-5'>尋找</b>)元件封裝

    基于局部特征匹配的目標跟蹤研究

    針對目標跟蹤特征提取和匹配問題進行分析,提出了一種基于局部特征匹配的目標跟蹤方法,該算法基于Shape Context進行
    發表于 12-06 15:15 ?32次下載
    基于局部<b class='flag-5'>特征</b>匹配的<b class='flag-5'>目標</b>跟蹤研究

    目標跟蹤目標匹配的特征融合算法研究

    基于特征融合的目標跟蹤,目標特征由于某些干擾導致準確度較低?;谪惾~斯框架的特征融合算法進行
    發表于 07-25 15:15 ?0次下載

    基于OpenCV的室內環境下多目標跟蹤

    室內環境下多運動目標跟蹤的核心問題是目標的快速識別和準確匹配! 目標的快速識別關鍵在于目標對象的特征
    發表于 09-23 17:12 ?0次下載

    寬頻魚雷自導目標回波模擬仿真

    目標模擬器是魚雷 自導系統設計的重要儀器 。該 文的 目的是給出寬頻水下 目標 回波信號模擬的軟件仿真流程 ,為 實際 應用 目標模擬器
    發表于 10-25 18:27 ?26次下載

    基于SIFT特征匹配的運動目標檢測及跟蹤方法

    檢測階段,首先提取兩幀帶檢測圖像的SIFT特征點并進行特征匹配,然后計算兩幀圖像之間的幾何變換矩陣,從而實現圖像的幾何對齊。再將幾何對齊后的兩幅圖像進行差分,并在差分圖像尋找SAD最
    發表于 01-09 16:17 ?1次下載

    基于FPGA寬頻帶數字鎖相環的設計與實現簡介

    基于FPGA寬頻帶數字鎖相環的設計與實現簡介說明。
    發表于 06-01 09:41 ?26次下載

    多尺度卷積特征融合的SSD目標檢測

    提取的方法以提高對小目標的檢測能力,再對高層特征層進行特征提取以改善目標的檢測效果。最后,利用SSD模型中原有的多度卷積檢測方法,將改進的
    發表于 06-11 16:21 ?11次下載
    大发888客户端| 大发888在线赌场网站| 棋牌游戏源码| 百家乐官网二号博彩正网| 百家乐官网软件代理| 六合彩百家乐有什么平码| 大发888的促销代码| 百家乐官网在线投注系统| 24山向| 爱拼网| 太阳城百家乐公司| 大发888 游戏下载| 博彩网导航| 百家乐官网制胜法宝| 怎样看百家乐路纸| 永胜博娱乐| 百家乐官网具体怎么收费的| 百家乐软件| 百家乐官网园小区户型图| 伟易博百家乐现金网| 大发888官方sscptdf88yb| 百家乐官网视频游戏账号| 开心8百家乐现金网| 88娱乐城2官方网站| 亚洲百家乐官网的玩法技巧和规则 | 大发888娱乐官方网站| 百家乐官网百家乐官网论坛| 大玩家百家乐官网现金网| 百家乐牌路分析仪| 咸阳市| 百家乐视频麻将游戏| 财神娱乐城| 百家乐玩法秘诀| 瑞丰备用网址| 真人百家乐技巧| 大发888娱乐场zb8| 彩票| 百家乐官网游戏新| 大发888真钱赌场娱乐网规则| 搓牌百家乐官网技巧| 网络百家乐赚|