首頁 計劃 > 正文

專訪英特爾中國研究院院長:中國半導體市場將大爆發,用開源對決英偉達

“如果沒有中國客戶的訂單,英特爾在俄亥俄州建設工廠等項目的必要性就會大大降低。”英特爾CEO帕特·基辛格,在游說拜登政府放棄對華半導體新限制政策時直言不諱。

英特爾原本計劃投資至少2000億美元,在美國俄亥俄州哥倫布市外新建“全球最大芯片制造基地”,如果美國繼續加強對華芯片出口限制,全球最大的半導體制造商之一的英特爾可能要因此丟掉約三分之一的營收。

英特爾研究院副總裁、英特爾中國研究院院長宋繼強博士在接受《深網》專訪時稱,中國有許多其他國家無法復制的新增機遇,這跟中國的標準化建設,還有中國電動車產業的一枝獨秀相關。“不光英特爾,其他在中國有相對重量級業務的公司,都要努力抓住中國市場新展現出來的機遇。”


(相關資料圖)

據報道,日前,英特爾與深圳合作,在南山區啟動設立了一個新的科技創新中心,以加強與中國的商業關系,并幫助中國初創企業發展。而美國半導體公司AMD首席執行官也在電話會議上表示,決定效仿英偉達調整芯片規格,以維持對華出口。

在和拜登政府表明立場前,帕特·基辛格還來了趟中國。這是他近三個月來第二次訪華,行程頗緊。

帕特·基辛格一面四處拜訪,參加第十四輪中美工商領袖和前高官對話、趕赴英特爾成都工廠20周年生日會、拜訪了新華三、超聚變等多家客戶;一面吹響反擊英偉達的號角,推出與英偉達A100、H100 GPU對打,專供中國市場的Gaudi2深度學習加速器芯片,與英偉達爭奪中國大模型市場。

ChatGPT點燃了新一波人工智能(AI)熱潮,也讓全球AI芯片市占率超90%的英偉達身價水漲船高,達萬億市值。英偉達CEO黃仁勛甚至放言:CPU已經是過去式,而GPU才是未來。言下之意,英特爾(全球最大的CPU制造商)已是過去式,英偉達才是未來。

在英偉達不斷攻城略地的同時,英特爾也在思考破局之道,AI時代的排兵布陣之法。

“在這一波大模型浪潮當中,什么樣的硬件更好并沒有定論。”宋繼強告訴《深網》,GPU并非大模型唯一的硬件選擇,半導體廠商更重要的戰場在軟件生態上。芯片可能花兩三年時間就做出來了,但是要打造芯片生態需要花兩倍甚至三倍的時間。英特爾的開源生態oneAPI比閉源的英偉達CUDA發展可能更快。

宋繼強認為,“半導體的好日子還在后面,英特爾還要繼續推動摩爾定律的發展。萬億晶體管的時代是一定會到來的,否則真的支撐不了未來需要把AI、虛擬現實、元宇宙這些都整合在一起的數字化時代。”

某種意義上,從成本和市場需求來看,單靠英偉達遠遠無法支撐下一輪的技術革命。

在與《深網》的專訪中,宋繼強分享了英特爾對大模型硬件選擇的思考、半導體行業未來趨勢預測以及對中國發展新機遇的理解。以下是《深網》對話宋繼強實錄整理,在不影響其原意的基礎上有所調整刪減。 

“做大模型不一定要用GPU”

《深網》:做大模型,一定要用GPU嗎?英偉達CEO黃仁勛認為CPU已經是過去式,而GPU才是未來。過去半年中,做大模型和想做大模型的公司也都在盡量囤更多的高性能GPU。

宋繼強:在這一波大模型浪潮當中,什么樣的硬件更好并沒有定論。

現在仍在早期,大家都在比我的模型有多大?多少參數在訓練?硬件能不能支持它快速訓練完?還沒有真正到相對穩定,開始去做真正的部署、優化,甚至做一些裁剪到客戶端去做相應的應用的那個階段。

就像當年深度學習一樣,2013、2014年剛剛開始的時候,大家都在比誰能把這個模型做到1000層,每層還很寬。后來沒人在乎了,變成比誰能用更好的性價比落地,把真正的應用業務做起來。

現在是大模型發展初期,因為GPU本身相對靈活的設計,又有這些計算資源和大容量內存,它剛好可以用來做大模型的加速。

但我們很快會看到,在大模型這塊有很多種不同的、可以加速的硬件會出現。

現在如果對于AI的負載要求不那么強,又不想專門去買一個GPU或者AI加速卡,可以用英特爾的CPU完成AI運算。如果需要更大規模的AI加速,可以外接一個獨立顯卡或者再加一個AI加速卡,英特爾Gaudi2就是一種AI加速卡。

我實際上就是想說明針對AI這么廣泛的領域,對硬件的加速需求是多種多樣的。

《深網》:AI對硬件的需求是多樣化的,但更多人擁擠在GPU這條道路上。

宋繼強:這很正常。因為技術突破會來一波商業機會,大家都有可能在這里勝出,所以不管是投資還是產業的資源都會匯聚,把這件事情做大。看誰可以真正做出好的成果、做出好的技術方案。對做大模型的初創企業來說,現在大算力的計算芯片是一個有限資源,大家都去搶也是很正常的。

大家做GPU,當然是很好的嘗試,但硬件做出來之后,它的軟件能不能很好的嵌入到常用的開發生態里,就變得非常關鍵。         

“搭建應用生態比做硬件更難”

《深網》:做GPU的難點不在硬件,在軟件生態搭建上?就像技術上做一個手機操作系統不難,難的是建立和安卓一樣龐大的應用生態。

宋繼強:芯片領域一直都有這樣一個問題:芯片可能花兩三年時間就做出來了,但是你要打造芯片的生態需要花兩倍甚至三倍的時間。

現在AI加速卡這個級別的GPU,從設計到能力來講,都沒有很高的門檻,很多團隊確實可以做。問題是做出來之后,怎么能讓它真正被用好。現在比較多的情況是一些公司會針對英偉達CUDA的某一個版本做一個自己的對接轉換,這樣實際上會有一定的滯后性,生態上會受一些牽制。

所以做GPU一定要想好怎么樣在軟件這一塊發力,不要讓生態碎片化。最好是說大家雖然都做各種各樣不同的GPU,但軟件能夠保持一個通用開放的標準,這就會事半功倍。否則10家做出10個GPU,每一家都有自己的開發包、開發環境,到最后用戶誰的也不敢用,因為畢竟都是初創公司,對未來的路線圖、成熟度都是有疑問的。

《深網》:英特爾oneAPI和英偉達CUDA相比優勢是什么?如何說服已經在用CUDA的廠家轉用oneAPI?

宋繼強:CUDA是封閉的平臺(閉源),oneAPI是開放的(開源),這個差別很多。

oneAPI實際上是一個開放的產業標準,英特爾是主要的發起方和貢獻者。截止2022年3月,已經有近70家企業和科研高校表示支持oneAPI的架構和開發。你可以用英特爾提供的庫,也可以不用,可以找自己合適的版本用,也可以自己開發一個版本。

所以oneAPI能夠對接很多種不同的硬件,不需要管到底運行在誰家的硬件上。CPU可以是英特爾的、AMD、國產的,GPU也可以是來自英偉達、英特爾、AMD、寒武紀等等。這樣可以保證應用開發出來之后,再過十年上面的程序也不用改,底下這些硬件可以更新迭代,每三年一換都沒有問題。

CUDA花了差不多十年的時間,才真正讓它變成了一個可以在很多領域應用的軟件生態。

oneAPI到現在已經做了4年了,也升級了好幾個版本,它可能發展會比CUDA快一些,因為它畢竟是很多廠商一起貢獻的。

“半導體的好日子還在后面”

《深網》:在AI爆發時期,半導體公司最應該抓住的機遇是什么?

宋繼強:現在AI的爆發得益于半導體行業的發展,對半導體行業來講,我們就是要緊跟時代的潮流去做符合趨勢需要的硬件。

AI這個領域,它的興衰取決于最后這波技術能否真正的落到大規模應用的閉環上。如果說能夠讓商業利潤回饋前期的巨量投入,這就能運轉起來。要不然,雖然說它能用,但是應用規模非常的小,無法匹配前期這兩年的巨量投入的話,就會有一大批的公司倒掉。

前一波的深度學習(引起的AI熱潮)已經過了5年多了,真的能夠回饋的也就是計算機視覺領域的一些應用。自然語言在深度學習模型時期沒做成,大語言模型才算是做成了,但是內容的真實性、邏輯性、完整性、正確性還不達標,在很多領域沒有辦法用它去做一些工作。

現在大語言模型達到了一定程度,但是并不代表在應用上真的爆發了。等到應用爆發的時候,它需要的計算量那又是比現在大非常多,很多行業都可以受益于此。

比如計算機視覺可以了,自然語言也可以,理解和邏輯推理方面也可以了,能夠在很多行業催生出新的應用。這個時候,不管是云端也好,邊緣計算也好,都需要更多數量和種類的處理器、內存等等。

這也是為什么英特爾一直說,半導體的好日子還在后面,還要繼續推動摩爾定律的發展。萬億晶體管的時代是一定會到來的,否則真的支撐不了未來需要把AI、虛擬現實、元宇宙這些都整合在一起的數字化時代。

《深網》:大語言模型預計什么時候會在應用上真正爆發?

宋繼強:兩三年左右就可以知道,現在這一波大模型能夠在哪些領域發揮比較大的用處,并且我們也應該能夠知道大模型后面下一波的增長點,以及技術方面的提升會在哪些領域。

一般來講,早期這種火熱的狀態通常不超過兩年。因為第一批沖進去瘋狂燒錢的也就是燒個一年半到兩年就燒完了。那個時候相對實際的應用以及架構的優化,也開始做出來東西了。

這一波大模型會帶來很大的轉折點,因為它是基于語言的,而我們這個世界上各種各樣的應用都可以轉換成語言、語義的表達。

現在唯一的挑戰是:準確性怎么樣?可不可以依賴它?真正商業應用的要求是要能用在一些關鍵任務上,讓它產生足夠的商業價值。

我們可以預計,三到五年的發展周期后,就可以看到大模型能夠催生出什么樣的嶄新應用。

《深網》:現在半導體未來的發展趨勢是不是已經很明確了?

宋繼強:我們就是兩條路線:一方面繼續推動摩爾定律,把晶體管做得更小,讓單位面積上能有更多更高效的晶體管。

英特爾的愿景是到2030年,單一設備里面有一萬億個晶體管,現在是1200億到1300億,還有8倍,要繼續按照摩爾定律的速度去翻番。

另一方面,需要更多種類的硬件集成在一起,以異構的方式,甚至是以芯粒(Chiplet)互相整合的方式放在一起。

不可能所有的計算部件都用最先進的制程節點去做,那樣太貴了,不符合性價比。半導體行業是非常尊重經濟規律的,你做得太貴了,大家就用不起來,所以它一定會選擇一個在能效比、性價比上合適的方案。

未來異構計算肯定是針對很多不同的領域有專門的、定制性的加速器出現。未來CPU加一些定制的加速部件,會是一個很正常的組合模式。

“不同的元宇宙用不同的數字人”

《深網》:英特爾中國研究院一直在研究數字人,在你看來,未來數字人與人類的關系是怎樣的?

宋繼強:大部分時間里,數字人可以由AI驅動完成工作,甚至跟人去做交互、對接,也可以隨時切換成由真人驅動。這有點像我們做自動駕駛分級(自動駕駛分為5級),在前面的1、2級,AI只是一個輔助驅動,人要替數字人做所有決策。但到了3、4、5級,可以逐漸讓AI驅動數字人主動做事,人只在需要的時候介入。

比方說4、5級的數字人,可以處理80%-90%的日常事務。特別是我們未來都要去數字世界里工作,大部分的時候,我們的數字人替身可以幫我們去干很多事,到了真正需要人類動用他的知識、腦力、關系去處理的時候,才由真人來驅動數字人。

《深網》:數字人相當于人類的數字分身?這是為元宇宙做準備嗎?

宋繼強:元宇宙里一定需要數字人,相信未來會有多個元宇宙,我們會在不同的元宇宙用不同的數字人。

現在我們能看到醫療場景里有很多相對流程化的事情,比如說初步的問診、記錄和分診,這些數據人就可以在它的知識范圍內搞定,來大幅度減輕醫生的負擔。到病人做完檢查要詢問病情的時候,真人醫生上陣。

《深網》:如何理解大模型、數字人、機器人間的關系?

宋繼強:數字人可以成為機器人的大腦,當數字人交互中涉及自然語言對答等情況時,大模型可以讓數字人看起來更真實,減少錯誤的發生。但數字人除此之外還有一整套技術,比如說表情、手勢的展現能力等等,這些和大模型沒有什么關系。機器人的智能也比數字人更復雜。

《深網》:4、5級別的數字人大概什么時候能實現?

宋繼強:如果我們僅限于語言、表情、手勢這方面的交互,很可能在三五年內就可以取得一個很好的成果。我們現在正在研究一些高保真、高精度的數字人,從外觀上來看已經算是可以接受了,現在差的是探索數字人可以在哪些領域內提供服務。目前遠程醫療是有相關需求的,很多醫生都認為數字人很有用、很方便。

“把握好中國市場的新機遇”

《深網》:最近業界普遍認為,英特爾對決英偉達的關鍵在中國市場。你認同這個觀點嗎?

宋繼強:不光英特爾,其他在中國有相對重量級業務的公司,都要努力抓住中國市場新展現出來的機遇。

對英特爾而言,一方面,比較重要的筆記本、臺式機、服務器市場,都要把握好中國市場恢復的機遇。另一方面,中國有好幾個新增領域在全球都是相對領先的。第一個就是5G,中國的5G基站的部署是全球發展最快,總量占比最大的,現在路都修好了,后邊就是推各種各樣的落地應用,這些都是新的機會。

還有,“東數西算”這么大規模的國家級的戰略,是全球任何地方都沒有的,這是一個真正算力網級別的基礎設施建設,也是一個很大的“計算+網絡+存儲”的機會。還有電動車以及后續的車內娛樂體驗,自動駕駛,車路協同等等,都是新增的市場機遇。

目前我們講到的這些機遇在其他國家都沒有辦法復制,這跟中國的標準化建設,還有中國電動車產業的一枝獨秀相關。

中國的電動車產業已經達到了可以快速推動智能化改造的水平,包括基于5G、V2X做車路協同,都在開始做標準化,推動試點,我們看到有些城市已經在搶先試點了,北京就是其中走得比較快的一個。

這些機會對于半導體行業來講非常重要,因為里面每一個功能都需要新的芯片。

英特爾CEO帕特·基辛格提到的五大超級技術力量,其中之一就是AI,它是一種新的技術生產力。但不能忽視的是,除了AI之外還有很多其他東西,比如無所不在的計算、無處不在的連接、從云到邊緣的基礎設施,以及傳感和感知。

編輯/lambor

關鍵詞:

最近更新

關于本站 管理團隊 版權申明 網站地圖 聯系合作 招聘信息

Copyright © 2005-2023 創投網 - www.zzkede.cn All rights reserved
聯系我們:39 60 29 14 2@qq.com
皖ICP備2022009963號-3