那曲檬骨新材料有限公司

0
  • 聊天消息
  • 系統消息
  • 評論與回復
登錄后你可以
  • 下載海量資料
  • 學習在線課程
  • 觀看技術視頻
  • 寫文章/發帖/加入社區
會員中心
創作中心

完善資料讓更多小伙伴認識你,還能領取20積分哦,立即完善>

3天內不再提示

Xilinx助力計算平臺滿足CNN的嵌入式AI要求

e9Zb_gh_8734352 ? 來源:未知 ? 作者:胡薇 ? 2018-10-22 16:03 ? 次閱讀

隨著智能安全、機器人無人駕駛汽車等應用越來越依靠嵌入式人工智能技術來提高性能,交付全新的用戶體驗,傳統計算平臺上的推斷引擎很難在有限的功耗、時延和物理尺寸限制下滿足實際要求。推斷引擎必須滿足嚴格定義的推斷精度,還受限于總線寬度,而且存儲器難以為最佳速度、效率和芯片面積進行調整優化。我們需要靈活應變的計算平臺來滿足運行一流卷積神經網絡 (CNN) 的嵌入式 AI 的要求。

放眼未來,適應于更多前沿神經網絡的靈活性是我們的主要關注點。今天廣受歡迎的 CNN 正加速被新型的先進架構所取代。然而,傳統的 SoC 設計要使用當前的神經網絡架構知識,從開發開始到未來部署通常需要大約三年時間。RNN 或 Capsule Network 等新型神經網絡可能會讓傳統 SoC 變得低效,也難以提供保持競爭力所需的性能。

嵌入式 AI 要滿足最終用戶期望,特別是要跟上可預見的未來不斷提升的需求,就必須采用更加靈活的自適應計算平臺。我們可利用用戶可配置的多核片上系統 (MPSoC) 器件,整合主應用處理器和可擴展的可編程邏輯結構,包含可配置的存儲器架構和滿足可變精度推斷所需的信號處理技術,從而滿足上述要求。

推 斷 精 度

在傳統的 SoC 中,決定性能的特性如存儲器架構和計算精確度等是固定的。最小值通常為 8 位,由核心 CPU 定義,不過就給定的算法而言最佳精度可能更低。MPSoC 支持可編程邏輯優化至晶體管層面,這就能根據需要讓推斷精度降低到 1 位。此外,這類器件還包含成千上萬可配置的 DSP slice,能高效處理乘積累加 (MAC) 計算。

能自由優化推斷精度,根據平方律提供剛好滿足需求的計算效率,也就是說單位的運算用 1 位核心執行,相對于用 8 位核心完成相同計算而言,所需的邏輯僅為 1/64。此外,MPSoC 能讓推斷精度針對神經網絡的每層做出不同優化,從而以最大的效率提供所需的性能。

存 儲 器 架 構

除了通過改變推斷精度來提高計算效率之外,配置可編程片上存儲器的帶寬和結構能進一步提高嵌入式 AI 的性能和效率。定制 MPSoC 相對于運行相同推斷引擎的傳統計算平臺而言,片上存儲器可能達到 4 倍多,存儲器—接口帶寬可能達到 6 倍。存儲器的可配置性使得用戶能減少瓶頸,并優化芯片資源的利用率。此外,典型的子系統只有有限的片上集成高速緩存,必須與片外存儲設備頻繁交互,這就會增加時延和功耗。在 MPSoC 中,大多數存儲器交換都在片上進行,這就會大幅提高速度,而且相對于片外存儲器交互而言功耗降低超過 99%。

芯 片 面 積

解決方案的尺寸也越來越重要,特別就采用移動 AI 的無人機、機器人或無人/自動駕駛汽車而言尤其如此。MPSoC 的 FPGA 結構上實現的推斷引擎可能僅占用傳統 SoC 八分之一的芯片面積,這就能讓開發人員在更小的器件中構建功能更強大的引擎。

此外,MPSoC 器件系列為設計人員提供了實現推斷引擎的豐富選擇,能支持最節能、成本效率最高、面積占用最小的方案,從而滿足系統性能要求。一些通過汽車應用認證的部件具備硬件功能安全特性,達到業界標準的 ISO 26262 ASIL-C 安全規范,這對自動駕駛應用而言至關重要。比如賽靈思的 Automotive XA Zynq UltraScale+ 系列采用 64 位四核 ARM Cortex-A53 和雙核 ARM Cortex-R5 處理系統以及可擴展的可編程邏輯結構,這就能在單個芯片上整合控制處理、機器學習算法和安全電路,同時提供故障容錯功能。

今天,嵌入式推斷引擎可用單個 MPSoC 器件實現,功耗低至 2 瓦,這對移動機器人或自動駕駛汽車而言都是比較合適的功耗水平。傳統計算平臺即便現在也無法用這么低的功耗運行實時 CNN 應用,未來也不太可能在更嚴格的功耗限制條件下滿足更快響應和更復雜功能的日益嚴格的要求。基于可編程 MPSoC 的平臺能夠提供更高的計算性能,更高的效率,也能在 15瓦以上的功率水平下減小面積和減輕重量。

如果開發人員不能在自己的項目中輕松地實現這些優勢,那么這種可配置型多平行計算架構的優勢就僅限于學術領域。成功需要適當的工具來幫助開發人員優化目標推斷引擎的實現。為了滿足有關需求,賽靈思不斷擴展開發工具生態系統和機器學習軟件堆棧,并與專業合作伙伴合作,一起簡化和加速計算機視覺和視頻監控等應用的實現。

面 向 未 來 的 靈 活 性

利用 SoC 的可配置性為手頭應用創建最佳平臺,也使得 AI 開發人員能夠靈活地跟上神經網絡架構快速發展演進的要求。業界可能遷移到新型神經網絡的可能性,對于平臺開發人員來說是一個巨大的風險。可重配置的 MPSoC 通過重配置并用當前最先進的策略來構建最高效的處理引擎,能夠讓開發人員靈活地響應神經網絡架構方式的變化。

AI 越來越多地嵌入到各種設備中,包括工業控制、醫療設備、安全系統、機器人和自動駕駛汽車等。利用可編程邏輯結構的 MPSoC 器件的靈活應變加速技術,是提供保持競爭力所需的快速響應和高級功能的關鍵。

聲明:本文內容及配圖由入駐作者撰寫或者入駐合作網站授權轉載。文章觀點僅代表作者本人,不代表電子發燒友網立場。文章及其配圖僅供工程師學習之用,如有內容侵權或者其他違規問題,請聯系本站處理。 舉報投訴
  • Xilinx
    +關注

    關注

    71

    文章

    2171

    瀏覽量

    122148
  • 人工智能
    +關注

    關注

    1796

    文章

    47683

    瀏覽量

    240302

原文標題:Xilinx助力人工智能新型領域的應用

文章出處:【微信號:gh_873435264fd4,微信公眾號:FPGA技術聯盟】歡迎添加關注!文章轉載請注明出處。

收藏 人收藏

    評論

    相關推薦

    基于Xilinx ZYNQ7000 FPGA嵌入式開發實戰指南

    電子發燒友網站提供《基于Xilinx ZYNQ7000 FPGA嵌入式開發實戰指南.pdf》資料免費下載
    發表于 12-10 15:31 ?2次下載

    Neousys宸曜發布Alder Lake N緊湊型可擴展嵌入式計算平臺

    強固型嵌入式計算平臺廠商Neousys宸曜科技發布了一款緊湊型可擴展嵌入式計算平臺Nuvo-28
    的頭像 發表于 12-10 14:54 ?302次閱讀
    Neousys宸曜發布Alder Lake N緊湊型可擴展<b class='flag-5'>嵌入式</b><b class='flag-5'>計算</b><b class='flag-5'>平臺</b>

    什么是嵌入式?一文讀懂嵌入式主板

    在現代科技浪潮中,嵌入式技術已成為支撐各種智能設備和系統運行的核心力量。那么,究竟什么是嵌入式嵌入式系統,顧名思義,是將計算機的硬件和軟件嵌入
    的頭像 發表于 10-16 10:14 ?1586次閱讀

    嵌入式主板是什么意思?嵌入式主板全面解析

    嵌入式主板,通常被稱為嵌入式系統的核心組件,是一種用于控制和數據處理的計算機硬件,其設計旨在嵌入特定設備中執行專門任務。嵌入式主板如同是設備
    的頭像 發表于 09-30 10:05 ?980次閱讀

    AMD分析嵌入式邊緣AI的發展

    隨著人工智能( AI )技術廣泛應用于各行各業,從云到邊緣的解決方案逐漸成為信息技術領域新的熱點。嵌入式邊緣 AI 在當今的各種邊緣應用中能夠大幅提升作業人員的生產力,帶動整個 AI
    的頭像 發表于 09-18 09:30 ?374次閱讀
    AMD分析<b class='flag-5'>嵌入式</b>邊緣<b class='flag-5'>AI</b>的發展

    嵌入式系統的未來趨勢有哪些?

    嵌入式系統是指將我們的操作系統和功能軟件集成于計算機硬件系統之中,形成一個專用的計算機系統。那么嵌入式系統的未來趨勢有哪些呢? 1. 人工智能與機器學習的整合 隨著現代人工智能(
    發表于 09-12 15:42

    開啟全新AI時代 智能嵌入式系統快速發展——“第六屆國產嵌入式操作系統技術與產業發展論壇”圓滿結束

    航空計算技術研究所研究員崔西寧做了“AI時代的機載嵌入式操作系統”專題報告。 崔西寧回顧了機載軟件技術發展歷程,介紹機載智能計算的演進之路,分享了天脈操作系統現狀和發展計劃。 圖3
    發表于 08-30 17:24

    恩智浦加速嵌入式AI創新應用開發

    AI應用飛速發展的今天,如何能夠將AI嵌入式系統開發有機結合起來,營造新的開發生態,打造與眾不同的創新用例,一直是嵌入式開發者追求的目標。
    的頭像 發表于 08-27 09:46 ?884次閱讀

    嵌入式軟件開發與AI整合

    嵌入式軟件開發與AI整合是當前技術發展的重要趨勢之一。隨著人工智能技術的快速發展,嵌入式系統越來越多地集成了AI算法,以實現更復雜的智能功能。以下是關于
    的頭像 發表于 07-31 09:25 ?835次閱讀
    <b class='flag-5'>嵌入式</b>軟件開發與<b class='flag-5'>AI</b>整合

    深度學習算法在嵌入式平臺上的部署

    隨著人工智能技術的飛速發展,深度學習算法在各個領域的應用日益廣泛。然而,將深度學習算法部署到資源受限的嵌入式平臺上,仍然是一個具有挑戰性的任務。本文將從嵌入式平臺的特點、深度學習算法的
    的頭像 發表于 07-15 10:03 ?1698次閱讀

    EVASH Ultra EEPROM:助力ChatGPT等AI應用的嵌入式存儲解決方案

    EVASH Ultra EEPROM:助力ChatGPT等AI應用的嵌入式存儲解決方案
    的頭像 發表于 06-26 18:13 ?966次閱讀

    AI引爆邊緣計算變革,塑造嵌入式產業新未來AI引爆邊緣計算變革,塑造嵌入式產業新未來——2024研華嵌入式

    中國北京,2024年5月30日?- 2024年研華嵌入式產業合作伙伴會議在北京·中關村皇冠假日酒店成功舉辦,現場參會嘉賓逾300人。會議以“AI引爆邊緣計算變革,塑造嵌入式產業新未來”
    發表于 05-31 13:53 ?379次閱讀
    <b class='flag-5'>AI</b>引爆邊緣<b class='flag-5'>計算</b>變革,塑造<b class='flag-5'>嵌入式</b>產業新未來<b class='flag-5'>AI</b>引爆邊緣<b class='flag-5'>計算</b>變革,塑造<b class='flag-5'>嵌入式</b>產業新未來——2024研華<b class='flag-5'>嵌入式</b>

    簡談Xilinx Zynq-7000嵌入式系統設計與實現

    設計。 最大優點可實現硬件加速: 設計者可以根據需求在硬件實現和軟件實現之間進行權衡,使所設計的嵌入式系統滿足最好的性價比要求,例如,在實現一個嵌入式系統設計時,當使用軟件實現
    發表于 05-08 16:23

    簡談Xilinx Zynq-7000嵌入式系統設計與實現

    需求在硬件實現和軟件實現之間進行權衡,使所設計的嵌入式系統滿足最好的性價比要求,例如,在實現一個嵌入式系統設計時,當使用軟件實現算法成為整個系統性能的瓶頸時,設計人員可以選全可編程So
    發表于 04-10 16:00

    嵌入式fpga是什么意思

    嵌入式FPGA是指將FPGA技術集成到嵌入式系統中的一種解決方案。嵌入式系統是一種為特定應用而設計的計算機系統,它通常包括處理器、內存、外設接口等組件,并且被
    的頭像 發表于 03-15 14:29 ?1385次閱讀
    百家乐开户首选| 大发888 这类平台| 百家乐官网视频小游戏| 百家乐下注瀛钱法| 91百家乐官网的玩法技巧和规则 | 网上百家乐有没有假| 正网皇冠开户| 加多宝百家乐官网的玩法技巧和规则 | 新世纪百家乐官网现金网| 百家乐怎样做弊| 博彩e族| 网上玩百家乐技巧| 百家乐代理合作| 百家乐桌子10人| 乌鲁木齐县| 百家乐游戏机价格| 蒙城县| 网络百家乐证据| 百家乐官网隔一数打法| 打百家乐最好办法| 百家乐官网怎么投注| 全景网百家乐的玩法技巧和规则 | 布加迪百家乐的玩法技巧和规则 | 百家乐在线怎么玩| 真钱棋牌游戏| 百家乐游戏客户端| 百家乐官网书包| 大发888有银钱的吗| 狮威百家乐官网赌场娱乐网规则| 波音娱乐城送彩金| 百家乐怎么对冲打| 网上百家乐官网解码器| 362百家乐的玩法技巧和规则| 百家乐官网学院| 德州扑克2| 哪里有百家乐赌博网站| 百家乐官网看点打法| 金博士百家乐的玩法技巧和规则| 百家乐官网7赢6| 棋牌类玩具| 百家乐百胜注码法|