BlockBeats 訊息,4 月 4 日,據美國科技媒體 The Information 最新報導,中國 AI 初創公司 DeepSeek 即將發布的新一代旗艦模型 V4,將完全在華為自研晶片之上運行,被視為中國推動半導體自主化進程的重要里程碑。
V4 預計將在未來數週內發布,並將完全運行於華為晶片。DeepSeek 為此與華為及晶片設計商寒武紀合作數月,重新改寫了模型底層部分程式碼,以實現與國產晶片的相容。
值得注意的是,DeepSeek 這次並未向輝達(NVIDIA)開放 V4 的提前測試權限,僅邀請國內晶片企業參與早期最佳化,打破了業界慣例。
阿里巴巴、字節跳動、騰訊等中國科技巨頭已提前採購華為最新款 Ascend 950PR 晶片,總訂單量達數十萬顆,計畫透過雲端服務部署 V4 並整合至自家 AI 應用。需求激增推動該晶片價格上漲約 20%。
V4 採用混合專家架構(MoE),總參數量約 1 兆億,每次推理啟動約 370 億參數,可在保持低延遲的同時支援文字、影像與程式碼的多模態輸入。
去年 DeepSeek 發布低成本模型 V3 和 R1,曾引發全球科技股大跌,令市場質疑美國 AI 公司是否需要耗資數十億美元採購算力。V4 因此備受國際關注。