Gate 廣場“新星計劃”正式上線!
開啟加密創作之旅,瓜分月度 $10,000 獎勵!
參與資格:從未在 Gate 廣場發帖,或連續 7 天未發帖的創作者
立即報名:https://www.gate.com/questionnaire/7396
您將獲得:
💰 1,000 USDT 月度創作獎池 + 首帖 $50 倉位體驗券
🔥 半月度「爆款王」:Gate 50U 精美周邊
⭐ 月度前 10「新星英雄榜」+ 粉絲達標榜單 + 精選帖曝光扶持
加入 Gate 廣場,贏獎勵 ,拿流量,建立個人影響力!
詳情:https://www.gate.com/announcements/article/49672
#Deepseek Goes Viral
DeepSeek,一家總部位於中國杭州的人工智能初創公司,於2024年12月底推出了引起全球人工智能行業關注的大型語言模型DeepSeek-V3。該模型擁有6710億參數,但僅花費558萬美元約兩個月時間進行訓練,遠低於其他科技巨頭的投資成本。
DeepSeek-V3在開源模型中表現出色,並與世界上最先進的模型相媲美。該公司優化了培訓過程,以降低成本,使用了約2.78百萬小時的Nvidia H800 GPU,這些GPU是在中國製造的。這表明中國的人工智能公司在獲取訓練AI所需的先進半導體材料方面取得了重大進展,儘管受到美國的限制。
DeepSeek的成功引起了美國科技行業的擔憂,Nvidia和其他科技公司的股票大幅下跌。專家認為,DeepSeek通過使用開源技術和有效的培訓方法,以比美國競爭對手低得多的成本實現了高效能。
此外,DeepSeek已經公開了模型的源代碼和詳細的技術解釋,使全球的研究人員和開發人員可以接觸和改進這項技術。這種透明度與美國頂級人工智能公司更加保守的方法形成了鮮明對比,並可能改變未來科技公司開發模型的方式。