即便放眼整個IC行業(yè),像Chris Rowen博士這般愛談技術(shù),同時又可以講得如此深入淺出的,著實少見。他幾乎經(jīng)歷過微處理器的所有起起伏伏,前世今生。他是RISC架構(gòu)的奠基人之一,分別參與了Intel和MIPS公司的大躍進時代,如今,又帶著一種全新SoC架構(gòu)的理念,在或多或少地改變著我們的數(shù)字時代。
1、我看過您寫的“復(fù)雜SoC設(shè)計”,非常喜歡的第8章(Chris Rowen:“SOC設(shè)計的未來”哈哈)。恩您還記得。因為你的所有預(yù)言都應(yīng)驗了,這非常有趣。所以我的問題是,您如何看待再6年之后的SoC設(shè)計,或者說和SoC設(shè)計有關(guān)的那些技術(shù)趨勢?
Chris Rowen :哇,這個問題還不賴!我認為這個市場的大方向還是相當(dāng)清楚的??纯词袌鰧用娴幕沮厔?,再看看技術(shù)層面的基本趨勢,你就可以看到他們在哪里重合。就技術(shù)而言,你會發(fā)現(xiàn)摩爾定律(Moore’s Law)作為經(jīng)濟驅(qū)動力的事實。但是摩爾定律真正有趣的部分在于,第一,是“集成度(Density)持續(xù)提高”。每隔2年半或者3年,硅密度就要提高一倍,這意味著近一倍成本的降低,讓射頻產(chǎn)品中的數(shù)字模塊集成度越來越高。這也意味著,各種系統(tǒng)都在規(guī)模(Scale)上變得越來越小。所以無論是電腦亦或消費電子設(shè)備,每一個系統(tǒng)的目的都是集成于同一塊芯片。這就變得有趣起來。因為在過去,你可以生產(chǎn)通用(Generic)存儲器,通用處理器,通用射頻,諸如此類,然后一股腦兒放在一塊兒,建一個非常牛逼的專用(Specific)系統(tǒng)。但是在今天,事情都顛過來了。你更希望把一坨不同的功能集合到一塊芯片上。當(dāng)然在這個意義上,你還是得搞出一塊專用芯片。但是挑戰(zhàn)變大了,因為芯片本身需要更加專注于某一個特殊應(yīng)用,而應(yīng)用處理器、內(nèi)部總線等等其他玩意兒,也要變得更小更強更快!
另一件吊詭的事就是,摩爾定律并沒有在晶體管層面帶來太多的功率改進。在過去,當(dāng)東西變小了,功率自然就降低了,所以工程師也壓根不需要操心什么芯片架構(gòu)(Architecture)。而現(xiàn)在,如果工程師想要優(yōu)化功耗,首先就要優(yōu)化架構(gòu)。他得考慮我怎么著才能更有效地完成這個計算?譬如用更少的晶體管門或者運算周期,甚至在這個任務(wù)不運行的時候關(guān)閉掉相應(yīng)子系統(tǒng)。總之,這活兒變智能(Intelligent)了。
所以舉個例子啊,比如你想做個手機,就必須要注意區(qū)分不同的使用場景,譬如聽音樂、看YouTube視頻、發(fā)短信、上網(wǎng),或者煲電話,這些都是完全不同的情景。你得關(guān)掉所有沒用的子系統(tǒng)。更細心,更積極。因此對于芯片設(shè)計師(Chip Architect)或者系統(tǒng)設(shè)計師來說,這是最好的時代。因為有這么多的事兒可做。但對于一個晶體管工人(Transistor Guy)而言,這可真是最壞的時代啊!一切都已經(jīng)上升,已經(jīng)上升到系統(tǒng)或者應(yīng)用的級別。這就是技術(shù)領(lǐng)域正在發(fā)生的大事件。
2、未來幾年市場方面的變化呢?
Chris Rowen :說到市場。我認為最大的趨勢是一切都已經(jīng)移動起來,因為人們的生活方式已經(jīng)徹底改變了。當(dāng)你可以隨身攜帶那么多的設(shè)備,就會希望能夠持續(xù)地連接到互聯(lián)網(wǎng) 上。這種影響不僅表現(xiàn)在設(shè)備上,還表現(xiàn)在無線基礎(chǔ)設(shè)施,以及云計算上。而且經(jīng)濟層面的機會,將會隨之變得非常,非常深遠。因為你會看到,譬如在這種設(shè)備(Chris拿起手里的iPhone開始演示)的層面,無線連接的帶寬起碼還要提高30倍。為了獲得足夠豐富的娛樂體驗,我們或許需要幾十甚至幾百兆比特的帶寬。在世界每一個地區(qū),高端用戶越來越多。中國就是一個鮮活的例子。不光如此。在印度、南美、非洲、加勒比海地區(qū),人人都希望持續(xù)不斷地連接到互聯(lián)網(wǎng)。
所以,你必須很好地設(shè)定人們?nèi)找嬖鲩L的期望值?,F(xiàn)在有10倍的寬帶人口增長每個人都有30倍的寬帶需求,因此就有了300倍的寬帶要求。而系統(tǒng)的每 個層面都需要滿足這種需求。對于無線基礎(chǔ)設(shè)施制造商來說,他們的機會是巨大的。譬如華為。但是制造商是沒可能贏得300倍收入的。有可能獲得更多的收入, 但不是三百倍以上。因此,他們必須在得到大幅增加帶寬的同時,大幅降低資金成本(Capital Cost)和經(jīng)營成本(Operate Cost)。
3、那么接下來在SoC設(shè)計上會有什么事情發(fā)生?
Chris Rowen :你可以看下無線基站作為例子。傳統(tǒng)意義而言,它們是昂貴的。你可以找些通用芯片、通用DSP、通用FPGA??墒墙裉?,為了滿足對帶寬的要求,您需要更 多的高度定制的SoC,芯片平臺和軟件的需求也上升很快。所以這將使集成度更高,每塊芯片上集成更多的DSP,而每塊DSP上嵌入更多的軟件程序,甚至是 軟件內(nèi)容的爆炸性發(fā)展。
有趣的是,每部分網(wǎng)絡(luò)基礎(chǔ)設(shè)施(Network Infrastructure)的功耗都是巨大的。那么即便為綠色節(jié)能考慮,減少為更加緊密集成的系統(tǒng)都是異常重要的?;緦⒚黠@變小,這意味著整個基站 都可變成塔頂?shù)囊粋€小盒子,而不是……裝在塔頂可是簡單很多。
當(dāng)然在系統(tǒng)層面,你一旦降低成本以后降低功耗也就水到渠成。所以這兩者之間是一個非常良性的關(guān)系。關(guān)鍵是硅晶圓的集成。這也是Tensilica會 如此迅速成長成為世界領(lǐng)先的DSP內(nèi)核供應(yīng)商之一的原因。
甚至可以看到這種變化體現(xiàn)到了云計算上。因為現(xiàn)在你需要300倍的帶寬,也就相應(yīng)地對視頻服務(wù)、視頻壓縮、互聯(lián)網(wǎng)數(shù)據(jù)庫搜索、社會網(wǎng)絡(luò),如此等等, 都提出了更高的需求。而所有這些事情,真的都是很復(fù)雜的應(yīng)用程序呢。
不過有趣的是,他們都是些并行的應(yīng)用程序。這是個好消息。因為在計算機業(yè)已經(jīng)發(fā)生的一件事情便是,單個微處理器的速度已經(jīng)很難再提高了。Intel在1990年,戲劇性地發(fā)現(xiàn)了單處理器性能呈指數(shù)增長的改善。但是他們也旋即發(fā)現(xiàn)當(dāng)處理器頻率達到約3.5到4GHz的時候,功率密度(Power Density)遇到了瓶頸。于是,他們開始嘗試多核技術(shù)。
還好人民群眾想做的事,基本都是天然就可以并行處理的。所以,你在做互聯(lián)網(wǎng)數(shù)據(jù)庫檢索(Internet Database Search)的時候,確實可以設(shè)置多內(nèi)核、多芯片,甚至多系統(tǒng)。因為你的查詢請求通常將被發(fā)往多個地點。所以在互聯(lián)網(wǎng)云計算的領(lǐng)域,運用多核的機會無比 廣闊。
而且確實存在是一個問題,就是你如何在有效的MIPS指令內(nèi)獲得足夠低的功耗?;蛘哒f,如何在設(shè)計電池壽命最長的移動設(shè)備,和最可擴展的服務(wù)器之間 取得關(guān)聯(lián)?因為所有都和功耗有關(guān),而非峰值的性能。
4、那么Tensilica是如何來克服在功耗上的挑戰(zhàn)的?和競爭對手比起來又有何區(qū)別?
Chris Rowen :舉個例子。Tensilica贊同為特定的任務(wù)去優(yōu)化處理器。優(yōu)化流水線(Pipeline),優(yōu)化接口,優(yōu)化設(shè)計層面,然后把多個內(nèi)核放在一起,以建 立一個多核系統(tǒng)。這種優(yōu)化的能力將產(chǎn)生巨大的影響。我會在今天下午的會上談到這個稱作Turbo解碼器的專用(Specialized)處理器。Turbo是一種特殊的算法,可以從嘈雜的噪聲中提取有用信息,在一個工作循環(huán)(cycle)內(nèi),這個解碼器可以執(zhí)行大約3萬次,哦對的沒錯3萬次RISK指令。是的,通用的壓縮(Compression)處理器只能執(zhí)行一次指令,而這個專用處理器可以執(zhí)行3萬次。當(dāng)然這是一個極端的例子,只是想表 明當(dāng)你知道你的問題在哪里,你就可以做出很多令人難以置信的事情。并行,并因此難以置信的高效率。
同樣的原則可以適用于各個層面,適用于各種其他門類的專用DSP、無線接收器,適用于基帶和音頻的通用DSP,也適用于客戶意欲進行視頻處理或其他圖形壓縮、安全操作、網(wǎng)絡(luò)協(xié)議處理,以及廣泛應(yīng)用于射頻的深嵌入式控制(Deeply Embedded Control)。
Tensilica特別集中精力于那些能夠?qū)iT優(yōu)化的能力,以及真正方便使用多核的能力。而因此,我們從那些傳統(tǒng)的CPU老家伙們中區(qū)別了出來。譬 如Intel、ARM、MIPS,或者其他什么人。他們都面臨一個相同的物理問題,摩爾定律在給了他們更多的晶體管之后,卻沒有給他們更好的功率控制,對不對?
他們很少去考慮并行的問題。而與之相反,我們在應(yīng)用層面非常努力地工作,以期尋找到解決方案。在云計算那段,我們確實可以將任務(wù)分割成很多子任務(wù), 但是當(dāng)我在這里玩游戲(Chris又一次拿起手里iPhone開始演示),我真的被限制了。你看,一個手指只能玩一樣?xùn)|西哈。因此在應(yīng)用處理器的層面,你 真的無法得到啥好處。MIPS、ARM,甚至還有Intel,都面對著這樣一個無法在當(dāng)前硅科技下有效完成多任務(wù)的問題。而那是我們擅長的。
我們看到這個市場在迅速增長,去年的出貨量增長了大約70%。然后我們會試圖進入所有的DPP(Data-Plane Processor)領(lǐng)域,包括DSP、音頻視頻、安全,以及深嵌入式控制,這其實和應(yīng)用處理器的范疇離得很遠。所以啊,我們常常會發(fā)現(xiàn)自己和MIPS、ARM或Intel出現(xiàn)在同一塊芯片上。你知道吧,其實我們就是工廠的工人啊(Chris突然哈哈大笑)!因為有這么多不同的處理器,在Date-Plane里又有這么多不同的任務(wù),那些小而高效的處理器會有很多機會,很多接口(Socket)。
這種對于應(yīng)用處理器或者接口的互補性,甚至于可以讓應(yīng)用處理器在執(zhí)行類似于信號處理這種實時任務(wù)的時候,也完全關(guān)閉。或者比如多媒體應(yīng)用,應(yīng)用處理 器當(dāng)然可以去做,但是如果我們優(yōu)化專用音頻DSP的話,將獲得4到5倍的效率。尺寸更小,單位時間內(nèi)的吞吐量卻更大。而且可以用如此多的音視頻處理器夠你 選擇。所以幾乎任何時刻,系統(tǒng)設(shè)計師或者SoC設(shè)計師都可以通過區(qū)別應(yīng)用場景的方式,來決定卸載(Off Load)哪個處理器。
這也是為什么我認為我們可以在音頻方面取得這么大的成功。當(dāng)你正在設(shè)計一個手機,或者閱讀顯示器,或者機頂盒,或者數(shù)字電視,或者數(shù)碼相機,你會 說,啊,這里有一種場景需要我做大量音頻的工作。于是,把那種卸載很自然地就被設(shè)計到到基本構(gòu)架里去了。
而且,我們可以為應(yīng)用層面的處理器自動生成軟硬件,尤其是基于音頻和基帶的非常全面的軟件庫(Software Libraries)。因此,不管是老手還是菜鳥,在我們的店鋪里都能找到他們所有需要的軟硬件解決方案,以幫助他們最快地進入市場。集成音頻、集成基 帶,或者其他各種功能。
5、那么Tensilica有什么具體的應(yīng)用嗎?
Chris Rowen :今天下午,我將討論一下移動電話。這是一個巨大的市場,一個可以滿足之前所說帶寬需求的市場。特別是從當(dāng)前正從3G向4G升級,大家都聚焦在LTE身 上。不僅因為LTE看上去很像是最后標(biāo)準的勝者,也因為它非常像WiMax。我們已經(jīng)能夠提供參考設(shè)計,幫助客戶建立他們自己定義的多核LTE手機,在市 場中搶得先機。這只是一個我們進入領(lǐng)域的實例。
我們也在做一個很類似的數(shù)字電視解調(diào)器。因為有人希望既為移動應(yīng)用又為起居室設(shè)計一種通用的數(shù)字電視接收器。這里有個很大的問題,就是全世界在視頻 領(lǐng)域有好多不同的標(biāo)準和概念,而每個人都真心希望擁有一塊可以解決一切的視頻芯片。我們準備來設(shè)計一塊。其實應(yīng)用一樣的原理,就是找些DSP和專用核,優(yōu) 化最密集的任務(wù),并充分利用我們最重要的能力——生成處理器的功率效率非常小,以及和世上最穩(wěn)定的通用DSP一樣易于編程的軟件工具。昨天晚上客戶還和我 們說,DSP如此招人待見的最主要原因就是可編程。譬如TI的那些DSP。我們同樣在努力使編譯器更強大,使程序模型簡單,使程序員更不操心。我們還微處 理器的流水線設(shè)計上增強了視覺效果。這種架構(gòu)下要還能生成不正確的代碼,也怪難的。
因此,我們擁有一個非常高效的處理器。但是效率(Efficiency)這個詞值得商榷。傳統(tǒng)意義上而言,效率就是指最少的門數(shù)、最小的功耗,巴拉 巴拉。但效率也是將產(chǎn)品推向市場的時間。需要多少工程師才能部署好這個系統(tǒng)?每行代碼的成本是多少?每個工程師小時(Engineer Hour)所能帶來的收入?除了硅片層面的效率以外,這些同樣是測量效率的重要參數(shù)。我認為我們在這兩面都推動得很好。剛才討論的那種架構(gòu),也特別適合在 大量出貨的領(lǐng)域。移動設(shè)備、客廳設(shè)備、數(shù)碼相機,這些都是我們做得非常好的地方。這幾個領(lǐng)域四大廠商中的三位,十大廠商中的六個都是我們的客戶。
我們主要是在DPP方面擁有很強的知識積累,但同樣的影響也已經(jīng)開始在云計算上面出現(xiàn)。當(dāng)然,現(xiàn)在云計算的變化還比較慢,部分原因是它并非對功耗如 此敏感,但我認為整體上還是會有影響的。
評論
查看更多