VirtexTM-5系列產品的推出,使得Xilinx公司再一次成為向FPGA客戶提供新技術和能力的主導力量。過渡至65納米工藝的FPGA具備采用更小尺寸工藝所帶來的傳統優勢:低成本、高性能和更強的邏輯能力。盡管這些優勢能夠為高級系統設計帶來激動人心的機會,但65 納米工藝節點本身也帶來了新的挑戰。
例如,在為產品選擇FPGA時,功耗的考慮變得越來越重要。很可能下一代設計會需要在功耗預算不變(或更小)的情況下,集成更多的特性和實現更高的性能。在本文中,我將分析功耗降低所帶來的好處。還將介紹 Virtex-5器件中所使用的多種技術和結構上的革新,它們能提供功耗最低的解決方案,并且不會在性能上有任何折扣。
降低功耗的好處
低功耗的FPGA設計所帶來的優勢不僅是能滿足器件工作的散熱要求。雖然滿足元件指標對于性能和可靠性十分重要,但如何實現這一點對于系統成本和復雜性都有著巨大的影響。
首先,降低FPGA的功耗使你能夠使用更便宜的電源,這樣的電源使用的元件數量較少,并且占用的 PCB 面積也較小。高性能的電源系統的成本通常為每瓦0.5 到1美元。低功耗的 FPGA 直接降低了系統的整體成本。
其次,由于功耗直接與散熱相關,低功耗使你能夠使用更簡單、更便宜的熱量管理解決方案。在很多情況下,設計者將不再需要散熱器,或者只需要更小、更便宜的散熱器。最后,由于低功耗工作意味著更少的元件和更低的器件溫度,因此將提高整個系統的可靠性。器件工作溫度每降低10℃,就相當于元件壽命提高了兩倍,因此對于需要高可靠性的系統而言,控制功耗和溫度十分重要。
功耗:挑戰和解決方案
FPGA (或任何半導體器件)中的總功耗等于靜態功耗和動態功耗之和。靜態功耗主要由晶體管的泄漏電流引起,即晶體管即使在邏輯上被關斷時,從源極“泄漏”到漏極或通過柵氧“泄漏”的小電流。動態功耗是器件核心或 I/O 在開關過程中消耗的能量,與頻率相關。
靜態功耗
在縮小晶體管尺寸時(例如,從90納米到65納米),泄漏電流將會增大。新工藝結點所使用的短溝長和薄柵氧使電流更容易從晶體管的溝道區或通過柵氧泄漏。
在90納米Virtex-4系列產品中,Xilinx公司使用了“三柵極氧化層”的工藝技術,向Xilinx?電路設計者提供了一種強有力的阻止漏電工具。在前幾代FPGA中,使用兩種柵氧厚度:薄柵氧用于FPGA核心中高性能、低工作電壓的晶體管,而厚柵氧用于I/O模塊中尺寸較大,需要承受大電壓的晶體管。
簡單地來說,“三柵極氧化層”指增加一種中間厚度柵氧的晶體管,它的漏電比薄柵氧的核心晶體管要小得多。
“中間柵氧”的晶體管用在器件核心外圍非關鍵性能的電路(像設置存儲器)或不需要對變化的柵壓進行快速開關響應的電路(像傳輸門)中。薄柵氧、漏電最大的晶體管只保留在需要快速開關速度的路徑部分。
結果,總的器件漏電被大大減小,同時性能仍能比上一代FPGA有很大提高。三柵極氧化層工藝使Virtex-4器件比競爭性90納米FPGA在靜態功耗上平均減少了超過70%。這一結果非常成功,因此Virtex-5系列產品中大量使用了這一技術,在65納米工藝結點上降低漏電。
雖然業界預測65 納米器件的靜態功耗將會有大幅度提高,但是圖1顯示了三柵極氧化層工藝使65 納米 Virtex 器件在
最壞(溫度最高)工作條件下達到了與尺寸相當的90納米Virtex-4器件相同水平的靜態功耗。因此,Virtex-5系列產品和競爭性高性能FPGA產品相比,在靜態功耗方面具有真正的優勢。
圖1 85℃時的靜態功耗比較
動態功耗
動態功耗為65納米FPGA帶來一些其它方面的挑戰。動態功耗的公式為:
動態功耗 = CV2f
其中C是結點開關時的電容,V是電源電壓,f 是開關頻率。65納米工藝節點使FPGA的邏輯能力和性能比傳統器件有
了顯著提高,也就是說更多的結點工作在更高的頻率上。如果其它方面的條件不變,動態功耗將會增大。
但是,對于65納米工藝節點的動態功耗而言,也有一個好消息:FPGA核心的電源電壓(V)和結點電容(C)通常在
每一代新工藝中都會下降,從而使得動態功耗比上一代FPGA有所下降。
Virtex-5器件中, 核心電源電壓(VCCINT)從Virtex-4中所使用的1.2V下降到1.0V。由于寄生電容變小(與更小的晶
體管相關),以及邏輯塊間的互聯線長度變短、電容變小,使結點電容減小。此外,Virtex-5器件在金屬互聯層之間使用了一種介電常數較低的材料。
Virtex-5器件的平均結點電容比
Virtex-4器件大約減小了15%。加上電壓降低帶來的好處,至少相當于將Virtex-5器件的核心動態功耗降低了35-40%。
除“工藝尺寸縮小”到65 納米所帶來的固有的35-40%的動態功耗降低外,Virtex-5器件的架構創新,還能進一步降低每個設計的功耗。大多數可增加動態功耗有的結點電容,是由邏輯功能間的互連線引起的。新型Virtex-5 架構在兩個方面從根本上減小了連線電容:
? Virtex-5的可配置邏輯模塊(CLB) 是基于6 輸入查找表(6-LUT) 邏輯結構的,在以前的器件中是使用4 輸入查找
表。這意味著在每個 LUT 中能夠實現更多的邏輯,相當于較少的邏輯級,從而降低了對邏輯功能之間大電容連線的需求。
? Virtex-5的互聯結構目前包括了對角線對稱的連線,意味著每個CLB與所有相鄰的模塊(包括處于對角線位置的模
塊)之間都有直接的“單一”連接。當邏輯功能之間需要連接時,這一連接更有可能成為總電容最小的“單一”連接,而
以往的互聯結構對于相同的連接問題可能會需要兩個或更多結點。
6-LUT結構和改進的互聯模式,通過降低平均結點電容來降低核心的動態功耗,效果遠遠超過僅使用65納米工藝所
帶來的改進。圖2 顯示了來自標準設計的核心動態功耗的測量結果,其中每個Virtex-5器件和Virtex-4器件中都有
1024個8 位計數器。這些實際的測量結果顯示,工藝和結構上的共同優化所帶來的動態功耗的降低超過了50%。
圖 2 計數器標準設計的動態功耗比較
硬IP模塊
Virtex-5器件中包含的硬IP模塊(專門用來實現一些常用功能的電路)的數量,超過業界其他任何一款 FPGA。相比使用通用FPGA邏輯而言,使用搭載這些模塊的FPGA設計來實現這些功能,可進一步降低功耗。
與FPGA結構不同,這些專用的模塊中只有實現所要求的功能必需的晶體管。并且沒有可編程的互聯,因此互聯電容最小。較少的晶體管和較小的結點電容能降低靜態和動態功耗。從而使這些專用模塊在實現相同功能的同時,功耗只有使用通用FPGA結構的十分之一。
除增加新型的專用模塊外,Virtex-4器件中融合的很多模塊,在Virtex-5器件中都被重新設計,以增加新的特性,提高性能,降低功耗。例如,Virtex-4系列中18-Kb的block RAM存儲器在Virtex-5器件中被增加到了36-Kb;每個block RAM能被分成兩個獨立的18-Kb的存儲器,以便向下兼容Virtex-4的設計。
有趣的是,從功耗的角度來看,每個18-Kb的子模塊由兩個9-Kb的物理存儲陣列構成。對于大多數的block RAM配置,任何對于block RAM的讀寫請求一次只需要訪問9-Kb物理存儲器中的一個。因此其余的9-Kb存儲器能在不被訪問時被有效地“關斷”。在過渡至65納米工藝所帶來的功耗降低的基礎上,這種結構又使功耗進一步降低了50%。這一對于9-kB模塊的“乒乓”訪問是新的block RAM結構所固有的,這就意味著使用這項功能不需要用戶或軟件來進行控制。它
能動態并自動地進行,使所有使用block RAM的設計降低了大量的功耗,并且不會影響模塊的性能。
Virtex-5器件中專用的DSP元件也進行了大量的改進,以實現更多的功能,提高性能,并降低功耗。在片與片的比較中,新型的Virtex-5 DSP片的功耗比Virtex-4 DSP片的功耗降低了大約40%。這主要歸功于前面所討論的65納米工藝中電壓和電容的減小。
然而,由于Virtex-5 DSP片具有更強的功能和更廣泛的接口,許多DSP運算通過利用這些附加的功能進一步降低了功耗。在許多情況下,當使用新型DSP片的全部功能時,總功耗最高可降低75%。請記住即使你不是在設計一個DSP產品,也能使用DSP片來實現標準的邏輯功能(計數器、加法器、桶式移位器),這樣會比在標準FPGA邏輯中實現同樣
的功能節省功耗。
最后介紹的經過改進的專用模塊是Virtex-5系列的LXT平臺,其中包括了幾吉位的串行收發機,能以高達3.125Gbps的速率工作。這些 “SERDES” 模塊在實現時著重考慮了低功耗需求。每個Virtex-5 LXT器件中的全雙工收發機在3.125Gbps的速度下的總功耗小于100毫瓦,與Virtex-4串行收發機相比降低了大約75%。
結論
Xilinx公司悠久的創新歷史能夠追溯到20多年前第一塊FPGA的發明。因此Xilinx公司理所當然地成為第一家在深亞微米技術中將降低功耗作為首要任務的公司。與Virtex-4系列產品一樣,Virtex-5器件也采用了一系列工藝和架構上的革新,力求在提供盡可能低的功耗的同時,仍然使性能提高30%或更多。
如圖3所示,Virtex-5系列產品的靜態功耗與Virtex-4器件相當,但比競爭性FPGA具有明顯的優勢。作為唯一的65納米 FPGA,Virtex-5器件核心的動態功耗比市場上其它高性能FPGA低至少35-40%。像新型6-LUT和對角線對稱的互聯等架構上的革新,使實際核心動態功耗進一步降低了50%或以上。此外,利用數量空前的專用模塊進一步降低了功耗。
圖3 典型設計中現有FPGA的功耗比較
評論
查看更多