DeepSeek V4將在未來數週內發布,或將完全運行於華為晶片

区块律动

BlockBeats 訊息,4 月 4 日,據美國科技媒體 The Information 最新報導,中國 AI 初創公司 DeepSeek 即將發布的新一代旗艦模型 V4,將完全在華為自研晶片之上運行,被視為中國推動半導體自主化進程的重要里程碑。

V4 預計將在未來數週內發布,並將完全運行於華為晶片。DeepSeek 為此與華為及晶片設計商寒武紀合作數月,重新改寫了模型底層部分程式碼,以實現與國產晶片的相容。

值得注意的是,DeepSeek 這次並未向輝達(NVIDIA)開放 V4 的提前測試權限,僅邀請國內晶片企業參與早期最佳化,打破了業界慣例。

阿里巴巴、字節跳動、騰訊等中國科技巨頭已提前採購華為最新款 Ascend 950PR 晶片,總訂單量達數十萬顆,計畫透過雲端服務部署 V4 並整合至自家 AI 應用。需求激增推動該晶片價格上漲約 20%。

V4 採用混合專家架構(MoE),總參數量約 1 兆億,每次推理啟動約 370 億參數,可在保持低延遲的同時支援文字、影像與程式碼的多模態輸入。

去年 DeepSeek 發布低成本模型 V3 和 R1,曾引發全球科技股大跌,令市場質疑美國 AI 公司是否需要耗資數十億美元採購算力。V4 因此備受國際關注。

免責聲明:本頁面資訊可能來自第三方,不代表 Gate 的觀點或意見。頁面顯示的內容僅供參考,不構成任何財務、投資或法律建議。Gate 對資訊的準確性、完整性不作保證,對因使用本資訊而產生的任何損失不承擔責任。虛擬資產投資屬高風險行為,價格波動劇烈,您可能損失全部投資本金。請充分了解相關風險,並根據自身財務狀況和風險承受能力謹慎決策。具體內容詳見聲明
留言
0/400
暫無留言