TPU 開賣、NPU 崛起 主權(quán) AI 的「非輝達(dá)戰(zhàn)爭」正開啟
Google 開始對外販?zhǔn)圩约?TPU,與此同時,中東多國積極部署主權(quán) AI 基礎(chǔ)設(shè)施,採用包括 NPU 在內(nèi)的多元架構(gòu),顯示去 NVIDIA 化的 AI 運(yùn)算生態(tài)正逐步獲得關(guān)注,這一趨勢背後的關(guān)鍵驅(qū)動力,包括電力效率(節(jié)能)、部署彈性,以及地緣政治風(fēng)險控管。
在 2025 年 ISC West 等展會上,耐能智慧(Kneron)展出了其第四代 NPU 晶片 KL730,能支援邊緣生成式 AI 本地化運(yùn)行、多模態(tài)並行處理任務(wù)(如語音+視覺偵測等),並在功耗與效能上做優(yōu)化,例如在 Transformer 型模型運(yùn)行時,功耗減少約 40%,推理速度提升約 2 倍。
耐能是臺灣的一家 AI 晶片新創(chuàng),創(chuàng)辦人劉峻誠除被認(rèn)為是早期在臺定義 NPU 架構(gòu)者之一,耐能 NPU 已獲沙烏地阿拉伯 NTDP 支持,並參與德國主權(quán) AI 計畫,顯示其低耗能、非雲(yún)端導(dǎo)向的技術(shù)特性,正逐漸被主權(quán) AI 部署需求採用。
臺灣NPU晶片業(yè)者耐能,搶進(jìn)中東德國主權(quán)AI
耐能專注於 NPU/邊緣 AI發(fā)展,不只是賣晶片及IP,也在系統(tǒng)整合、模組設(shè)計、應(yīng)用落地上投入。例如支援 USB dongle、筆電及智慧裝置,也與工業(yè)物聯(lián)網(wǎng)(AIoT)、智能家電、車載、安防監(jiān)控等場景合作。
如耐能與新漢 (NEXCOM) 集團(tuán)策略合作,共同打造以 NPU 為基礎(chǔ)的邊緣運(yùn)算平臺與解決方案,針對智慧物聯(lián)網(wǎng)場景與垂直應(yīng)用市場。
隨算力中心大量建置,GPU為主的超級AI算力中心也因高耗電量及供應(yīng)管制等諸多因素,使各國紛紛多角化選擇晶片規(guī)格,科技巨頭也開發(fā)自有晶片如TPU或NPU,近期Google開發(fā)的TPU晶片更盛傳將對外銷售,而類NPU陣營如耐能及Cerebras等晶片業(yè)者,也打入中東國家主權(quán)AI建置需求,顯示各國在美國晶片出口限制下,對於非訓(xùn)練用途(如推論/邊緣 AI)逐步尋求去 NVIDIA 化的替代方案。
NPU是Neural Processing Unit的縮寫,也可稱神經(jīng)網(wǎng)路處理器,是專門為AI任務(wù)(特別是推理/部分訓(xùn)練、邊緣 AI/多模態(tài)模型推理)設(shè)計的硬體加速器。
與 GPU 或 CPU 相比,NPU或以RISC-V技術(shù)開發(fā)AI晶片具有幾個潛在優(yōu)勢:1.功耗與能效比(Performance per Watt),在低功耗/專用運(yùn)算的情境中,比 GPU/通用運(yùn)算單元更有效率,尤其是在邊緣設(shè)備(Edge Devices)或離線運(yùn)算場景。
2.延遲與即時性:因為能做本地推理/處理,避免因為雲(yún)端/網(wǎng)路往返延遲,適合對即時性要求高的應(yīng)用(語音命令、人員偵測、車載系統(tǒng)等)。
3.隱私與資料主權(quán):資料不必上傳到雲(yún)端,可以在終端或本地處理,減少對外部管控/監(jiān)控與法律/合規(guī)風(fēng)險。
4.成本與基礎(chǔ)設(shè)施壓力:雲(yún)端 GPU 運(yùn)算與冷卻/電力/網(wǎng)絡(luò)基礎(chǔ)設(shè)施需求非常高。若很多運(yùn)算能轉(zhuǎn)移到更低功耗/更分散的 NPU 或邊緣運(yùn)算,整體系統(tǒng)成本與資源耗用可降低。
不過,NPU 也有限制,包括通用性限制(通用大型模型或訓(xùn)練需求仍常常需要 GPU/TPU/大型加速器)、開發(fā)生態(tài)限制(工具/框架/算法最佳化)、晶片製造成本與設(shè)計經(jīng)驗挑戰(zhàn)高,因此耐能開發(fā)可重構(gòu)的 NPU,期望兼顧性能與功耗平衡、支援邊緣多任務(wù)或多模態(tài)應(yīng)用。
劉峻誠:臺灣產(chǎn)業(yè)應(yīng)比別人:更早又更完整
累積多國主權(quán)AI標(biāo)案經(jīng)驗,劉峻誠受訪指出,耐能期望於扮演「臺灣的 NPU 定義者與邊緣 AI 實踐者」戰(zhàn)略角色,為臺灣示範(fàn)未來可以發(fā)展的產(chǎn)業(yè)方向:不只是做代工,而是從設(shè)計 IP、研發(fā) NPU、加上模組與系統(tǒng)整合,甚至軟體+模型的端到端解決方案。
劉峻誠表示,若政府與產(chǎn)業(yè)政策能大力扶植這類整合能力,臺灣未來不只是算力代工中心,也能在架構(gòu)與設(shè)計上發(fā)揮影響力,面對邊緣 AI 市場與需求爆發(fā),許多國家與企業(yè)開始擔(dān)心雲(yún)端中心算力集中帶來的風(fēng)險(隱私、資料主權(quán)、延遲、成本、能源消耗等)。邊緣 AI 與 NPU 正好對應(yīng)這些痛點。
劉峻誠表示,臺灣的關(guān)鍵在於「比別人更早、更完整」推出低功耗可客製化的 NPU 解決方案,並達(dá)成技術(shù)自主、應(yīng)用分散及韌性需求、低耗能與低環(huán)境成本、在主權(quán) AI 陣營中佔有先手。
劉峻誠指出,臺灣NPU要能與 GPU 或國際領(lǐng)先 NPU/ASIC 媲美,需要高度設(shè)計經(jīng)驗、EDA 工具支持、國內(nèi)外 IP 與算法專家。耐能具備部分能力,但整體來說臺灣在某些核心設(shè)計(如最先進(jìn)邊緣大型語言模型、高精度訓(xùn)練電路、高帶寬記憶體與封裝)跟國際相比還有落差。
同時,也有許多國家正急起直追,如中國的 NPU 公司研發(fā)力量正在快速追趕;歐美與日韓也積極在此方向投入資源,由於NPU 的設(shè)計與驗證需要大量資本投入,並且量產(chǎn)成本、良率、封裝、測試都是需要高資本,若市場規(guī)模不足或訂單不穩(wěn)定,就墊高投資風(fēng)險。
因此,劉峻誠坦言未來NPU市場競爭勢必加劇,若臺灣不能持續(xù)在設(shè)計與架構(gòu)創(chuàng)新上投入,健全相關(guān)生態(tài)系統(tǒng)與軟體工具鏈,臺灣就可能被其他國家在某些邊緣應(yīng)用市場追上甚至取代。
更重要是政策與法規(guī)對相關(guān)先進(jìn)晶片設(shè)計、IP 保護(hù)、出口管制、知識產(chǎn)權(quán)、能源法規(guī)等,給投入NPU開發(fā)的相關(guān)產(chǎn)業(yè)鏈業(yè)者稅收優(yōu)惠或抵免誘因,提供本土市場邊緣 AI 應(yīng)用(如智慧家電、車載系統(tǒng)、安防監(jiān)控、醫(yī)療輔助裝置等)驗證場景,或公部門標(biāo)案及公共基礎(chǔ)設(shè)施率先使用臺灣隊NPU /邊緣 AI 解決方案,以促進(jìn)應(yīng)用生態(tài)成長。
除中東案例,劉峻誠認(rèn)為,臺灣企業(yè)未來也可針對「願意或正在推動主權(quán) AI/算力自主」的國家或地區(qū)(如歐盟、東南亞等)積極合作,他認(rèn)為,若臺灣能在政策上、資本上、基礎(chǔ)設(shè)施上支持,就有可能在新的 AI 世代中,不僅守住現(xiàn)有的半導(dǎo)體/代工強(qiáng)權(quán)地位,也擴(kuò)展到設(shè)計與主權(quán)自主的階段。