1、NPU能提高AI算法運行效率
根據觀(guān)研報告網(wǎng)發(fā)布的《中國NPU行業(yè)現狀深度分析與投資前景研究報告(2025-2032)》顯示,NPU即神經(jīng)網(wǎng)絡(luò )處理單元,采用專(zhuān)門(mén)優(yōu)化的神經(jīng)網(wǎng)絡(luò )計算架構,來(lái)處理特定的任務(wù),主要被用于加速計算。通過(guò)對NPU硬件層面優(yōu)化,能高效處理神經(jīng)網(wǎng)絡(luò )算法中矩陣乘法、卷積等數學(xué)運算。相較于GPU和CPU,NPU在A(yíng)I計算上性能和能效有了明顯提升,用來(lái)提高AI算法運行效率。
NPU與GPU區別
特性 |
NPU |
GPU |
設計初衷 |
專(zhuān)用于神經(jīng)網(wǎng)絡(luò )計算 |
最初用于圖形渲染,現廣泛用于通用計算 |
計算能力 |
高效的神經(jīng)網(wǎng)絡(luò )推理 |
強大的并行計算能力,主要用于云端 |
靈活性 |
專(zhuān)用硬件,較低的靈活性 |
通用性高,可以編程實(shí)現各種計算任務(wù) |
能效比 |
高 |
相對較低 |
典型應用 |
深度學(xué)習推理,邊緣計算,實(shí)時(shí)處理 |
圖形渲染,深度學(xué)習訓練和推理,科學(xué)計算 |
資料來(lái)源:觀(guān)研天下整理
2、AI算力提升帶來(lái)NPU行業(yè)需求端爆發(fā)
NPU專(zhuān)用于A(yíng)I運算,核心是矩陣乘法運算,CNN是主要算法之一,本質(zhì)上由大量的乘法累加計算組成。隨新AI應用、模型與需求的發(fā)展,NPU有望快速上量。根據數據,2020-2024年我國AI算力規模由134.2 EFLOPS增長(cháng)至725.3 EFLOPS,CAGR為52.5%。
數據來(lái)源:觀(guān)研天下整理
同時(shí),在智能手機上運行端側生成式AI的AI算力門(mén)檻約為30TOPS,旗艦智能機在2021-2022年逐步達到這一標準、且仍在進(jìn)步,預計2025年將達到60TOPS以上。而生成式AI應用的繁榮,將驅動(dòng)所需算力的實(shí)質(zhì)性增長(cháng)。根據相關(guān)資料,每天基于生成式AI的搜索查詢(xún)超過(guò)100億次,其中移動(dòng)端占比超過(guò)60%;智能手機基于精準的端側用戶(hù)畫(huà)像,與大模型結合,伴隨對話(huà)功能的不斷改進(jìn),將逐步成為真正的個(gè)人助手。
手機廠(chǎng)商內嵌AI大模型概況
手機廠(chǎng)商 |
大模型研發(fā) |
應用進(jìn)展 |
|
蘋(píng)果 |
與中國多廠(chǎng)商測試大模型 |
iOS18發(fā)布Apple Intelligence大模型(端側30億),并積極與OPENAI和谷歌接觸 |
宣布年內國行機引入通義大模型 |
華為 |
HarmonyOS4接入盤(pán)古大模型 |
HarmonyOSNEXT搭載盤(pán)古大模型5.0(端側15-70億) |
小藝接入DeepSeek |
三星 |
自研大模型Gauss |
GalaxyZ系列首次引入谷歌GeminiNano大模型(端側約30億) |
推出自有生成式多模態(tài)AI模型Gauss2;Bixby接入智譜智能AI |
OPPO |
ColorOS14搭載AndesGPT大模型 |
大模型升級為AndesGPT-2.0(端側70億) |
宣布折疊旗艦OPPO Find N5接入DeepSeek-R1 |
vivo |
OriginOS4搭載藍心大模型 |
OriginOS5搭載全新藍心大模型矩陣(最高端側跑通130億參數) |
OriginOS官宣將深度融合滿(mǎn)血版DeepSeek |
榮耀 |
逐步開(kāi)始引入 |
MagicOS9.0支持30億參數的端側大語(yǔ)言模型 |
YOYO智能體商店上線(xiàn)DeepSeek-R1嘗鮮版 |
資料來(lái)源:觀(guān)研天下整理
3、智駕滲透率提升,驅動(dòng)更高算力需求,我國NPU行業(yè)需求將持續釋放
而在智能駕駛方面,以高通智駕系統為例,其感知軟件棧和駕駛策略軟件棧需始終于本地運行,所以智駕對時(shí)延的要求極其嚴苛,云端無(wú)法針對此類(lèi)工作負載發(fā)揮任何作用。高通在2024年末發(fā)布的座艙與智駕芯片,應用增強的Hexagon NPU,較此前一代AI算力有大幅提升,且后期可繼續通過(guò)外掛NPU的方式繼續擴展算力。
高通車(chē)載NPU芯片參數
類(lèi)別 |
型號 |
發(fā)布年份 |
制程 |
核心數 |
場(chǎng)景 |
座艙 |
驍龍Cockpit Elite(8397) |
2024 |
4nm |
- |
配對Ride Elite |
驍龍SA8295 |
2023 |
5nm |
8 |
/ |
|
驍龍SA8155 |
2021 |
7nm |
8 |
/ |
|
智駕 |
驍龍RideElite(8797)(艙駕一體) |
2024 |
4nm |
- |
針對L2+L3 |
驍龍8650 |
2023 |
4nm |
8 |
已應用于零跑、大疆車(chē)載“成行平臺”,本田、通用、大眾、寶馬等預計25-26年逐步搭載。 |
|
驍龍8540 |
2023 |
5nm |
16 |
未量產(chǎn) |
資料來(lái)源:觀(guān)研天下整理
由此可見(jiàn),隨著(zhù)智駕解決方案支持GenAI模型,汽車(chē)對端側算力的要求將進(jìn)一步提升,并且伴隨越來(lái)越多車(chē)企布局智能駕駛市場(chǎng),我國NPU行業(yè)在該領(lǐng)域的需求將持續釋放。
各車(chē)企智能駕駛布局情況一覽
車(chē)企 |
產(chǎn)品 |
是否依賴(lài)高精地圖 |
感知算法/大模型 |
端到端規劃 |
城市NOA開(kāi)城進(jìn)展(需陸續OTA) |
特斯拉 |
FSD12 |
無(wú)需高精地圖 |
首個(gè)端到端自動(dòng)駕駛系統 |
(已推送北美所有內部員工)FSDV12可用于北美全地區道路 |
/ |
蔚來(lái) |
NAD |
不依賴(lài)高精地圖 |
BEV Transformer大模型:0ccupany占用網(wǎng)絡(luò ) |
實(shí)現數據驅動(dòng)(端到端前置能力)的規劃網(wǎng)絡(luò ) |
覆蓋726城 |
理想 |
ADMax3.0 |
不依賴(lài)高精地圖 |
BEV大模型:0ccupancy占用網(wǎng)絡(luò ) |
規劃算法逐步切換為時(shí)空聯(lián)合規劃算法;模塊化架構提升為大模型為主的端到端架構 |
覆蓋全國 |
小鵬 |
XNGP |
不依賴(lài)高精地圖 |
基于BEV Transformer的Xnet(24年Xnet2.0具備0ccupancy) |
2024年XNGP+有望實(shí)現端到端 |
覆蓋全國 |
華為 |
ADS2.0 |
不依賴(lài)高精地圖 |
Bev Transformer大模型:基于0ccupancy的GOD2.0 |
- |
覆蓋全國 |
資料來(lái)源:觀(guān)研天下整理
4、機器人產(chǎn)業(yè)進(jìn)入快速發(fā)展期,市場(chǎng)需求驅動(dòng)NPU行業(yè)爆發(fā)
NPU在機器人使用廣泛,有加速計算、降低系統功耗、實(shí)現實(shí)時(shí)交互和決策等優(yōu)勢。在機器人進(jìn)行深度學(xué)習任務(wù),如語(yǔ)音識別、圖像分類(lèi)、目標跟蹤時(shí),NPU能顯著(zhù)加快計算速度,比傳統CPU和GPU更高效地處理大量數據。進(jìn)入2025年,國內多家人形機器人企業(yè)相繼宣布各自的量產(chǎn)消息,市場(chǎng)需求驅動(dòng)NPU行業(yè)爆發(fā)。2025年1月17日,樂(lè )聚(深圳)機器人技術(shù)有限公司在北汽越野車(chē)公司舉行了樂(lè )聚第100臺全尺寸人形機器人交付儀式。該公司表示,樂(lè )聚人形機器人已邁入批量交付新階段。未來(lái)如果技術(shù)加速突破、成本快速下降,我國人形機器人規模展望千億元甚至萬(wàn)億元市場(chǎng),預計2030年有望達約8700億元。
數據來(lái)源:觀(guān)研天下整理(WYD)

【版權提示】觀(guān)研報告網(wǎng)倡導尊重與保護知識產(chǎn)權。未經(jīng)許可,任何人不得復制、轉載、或以其他方式使用本網(wǎng)站的內容。如發(fā)現本站文章存在版權問(wèn)題,煩請提供版權疑問(wèn)、身份證明、版權證明、聯(lián)系方式等發(fā)郵件至kf@chinabaogao.com,我們將及時(shí)溝通與處理。