根據 NVIDIA 官方部落格 4 月 28 日公告(作者 Kari Briski),NVIDIA 發表 Nemotron 3 Nano Omni — 開源多模態模型,把視覺、語音與語言能力整合進單一模型,目標是為 AI agent 系統提供更低延遲、更省成本的「感知層」。
核心規格:30B-A3B MoE、256K context、9 倍吞吐量、登 6 個排行榜首位
關鍵架構:
30B-A3B hybrid mixture-of-experts(總參數 30B、活化 3B)
整合 Conv3D 與 EVS 編碼
256K context 長度
輸入:文字、影像、音訊、影片、文件、圖表、GUI 螢幕
輸出:文字
性能訊號:較其他開源 omni 模型在同等互動性下達 9 倍吞吐量;於文件智慧、影片理解、音訊理解三大類共 6 個基準排行榜取得首位(NVIDIA 公告未列出具體分數,引導讀者前往開發者部落格查看詳細資料)。
NVIDIA 把 Nemotron 3 Nano Omni 定位為 agent 系統中的「眼睛與耳朵」,可與 Nemotron 3 Super(高頻執行)、Nemotron 3 Ultra(複雜規劃)等同家族模型分工,亦可與第三方雲端模型互通。三個典型 agent 應用場景:
電腦操作代理(Computer Use Agent):原生 1920×1080 解析度視覺推理
文件智慧:跨圖、表、截圖與混合媒體輸入推理
音訊/影片理解:把講話、畫面、紀錄整合為單一推理串
採用方陣容:鴻海、Palantir 入列、H Company CEO 具名表態
NVIDIA 公告中明確區分「生產採用」與「正在評估」:
已生產採用:Aible、Applied Scientific Intelligence(ASI)、Eka Care、鴻海(Foxconn)、H Company、Palantir、Pyler
正在評估:Amdocs、Dell、Docusign、Infosys、IQVIA、Lila、Oracle、Quantiphi、TCS、Zefr 等
H Company 執行長 Gautier Cloix 在公告中具名表態:「To build useful agents, you can’t wait seconds for a model to interpret a screen. By building on Nemotron 3 Nano Omni, our agents can rapidly interpret full HD screen recordings — something that wasn’t practical before.」翻譯:「打造 thực用代理時,你不能等模型秒級解讀螢幕。建立在 Nemotron 3 Nano Omni 之上,我們的代理可快速解讀完整 HD 螢幕錄影 — 這在之前並不實際可行。」
開源策略與布署:weights / datasets / 訓練方法全公開
NVIDIA 在發布同時公開:
模型權重
訓練資料集
訓練技術/方法論
布署管道涵蓋三層:
本地工作站:NVIDIA DGX Spark、DGX Station
NIM 微服務:build.nvidia.com
第三方平台:Hugging Face、OpenRouter,並透過 25 個以上 NVIDIA Cloud Partners、推理平台與雲端服務商提供
客製化工具則使用 NVIDIA NeMo。Nemotron 3 家族(Nano/Super/Ultra)過去一年在 Hugging Face 累積下載超過 5,000 萬次,本次 Omni 將該家族能力延伸至多模態與 agentic 領域。
這篇文章 NVIDIA 發表 Nemotron 3 Nano Omni 開源多模態 最早出現於 鏈新聞 ABMedia。
Tuyên bố miễn trừ trách nhiệm: Thông tin trên trang này có thể đến từ bên thứ ba và không đại diện cho quan điểm hoặc ý kiến của Gate. Nội dung hiển thị trên trang này chỉ mang tính chất tham khảo và không cấu thành bất kỳ lời khuyên tài chính, đầu tư hoặc pháp lý nào. Gate không đảm bảo tính chính xác hoặc đầy đủ của thông tin và sẽ không chịu trách nhiệm cho bất kỳ tổn thất nào phát sinh từ việc sử dụng thông tin này. Đầu tư vào tài sản ảo tiềm ẩn rủi ro cao và chịu biến động giá đáng kể. Bạn có thể mất toàn bộ vốn đầu tư. Vui lòng hiểu rõ các rủi ro liên quan và đưa ra quyết định thận trọng dựa trên tình hình tài chính và khả năng chấp nhận rủi ro của riêng bạn. Để biết thêm chi tiết, vui lòng tham khảo
Tuyên bố miễn trừ trách nhiệm.
Bài viết liên quan
MoonPay ra mắt thẻ MoonAgents Card, thẻ Mastercard ảo dành cho AI Agents, vào thứ Sáu
Theo The Block, MoonPay đã ra mắt MoonAgents Card, một thẻ ghi nợ Mastercard ảo, vào thứ Sáu. Thẻ này được thiết kế cho cả các tác nhân AI và người dùng, chuyển đổi stablecoin sang tiền pháp định ngay tại thời điểm thanh toán và cho phép chi tiêu tại bất kỳ nhà bán lẻ trực tuyến nào trên toàn cầu chấp nhận Mastercard.
The card i
GateNews2giờ trước
AI Agent Manfred thành lập công ty, chuẩn bị giao dịch crypto trước cuối tháng 5
Tác nhân AI Manfred đã thành lập một công ty và có được một ví tiền mã hóa kèm theo thông tin đăng nhập để thuê nhân sự, thực hiện thanh toán và tiến hành hoạt động kinh doanh. Tác nhân này dự kiến bắt đầu giao dịch tiền mã hóa vào cuối
GateNews3giờ trước
Người dùng ChatGPT giờ đây có thể truy cập các gói đăng ký trên nền tảng OpenClaw, Sam Altman công bố
Theo thông báo của Sam Altman hôm nay, người dùng ChatGPT hiện có thể đăng nhập vào nền tảng tác nhân OpenClaw bằng tài khoản ChatGPT của mình và truy cập trực tiếp các gói đăng ký ChatGPT hiện có trên nền tảng.
GateNews9giờ trước
AI Agent Manfred Thành Lập Công Ty, Dự Kiến Bắt Đầu Giao Dịch Crypto Trước Cuối Tháng Năm
Theo các báo cáo, AI agent Manfred đã thành lập công ty của riêng mình và có được một ví crypto cùng với các thông tin đăng nhập để thuê nhân sự, thực hiện thanh toán và tiến hành hoạt động kinh doanh. Agent này dự định bắt đầu giao dịch crypto vào cuối
GateNews9giờ trước
AI đại lý quản lý toàn diện doanh nghiệp! Máy bán hàng tự động AI tại San Francisco hé lộ cơ hội kinh doanh mới mẻ
Bài viết này cho biết máy bán hàng tự động của Valerie được vận hành bởi OpenClaw, cho phép các tác nhân AI thực sự điều hành hoạt động kinh doanh hằng ngày, bao gồm giá bán, tồn kho, kênh truyền thông xã hội, thậm chí quản lý tài khoản ngân hàng. Kết quả thử nghiệm cho thấy AI có thể mô phỏng các quyết định của lãnh đạo doanh nghiệp, nhưng xuất hiện ảo tưởng về định giá, chẳng hạn tăng giá thanh protein lên 15 USD. Các trở ngại pháp lý như KYC, mở tài khoản ngân hàng và giấy phép thực phẩm vẫn chưa được khắc phục; dù có các cơ chế như tín thác để AI sở hữu doanh nghiệp, nhưng thách thức trong thực tiễn vẫn còn nhiều.
ChainNewsAbmedia12giờ trước
AI Agent Manfred thành lập công ty, nhận ví tiền mã hóa trước thềm đợt ra mắt giao dịch vào cuối tháng 5
AI agent Manfred đã thành lập công ty của riêng mình và có được một crypto wallet cùng với các thông tin đăng nhập để thuê nhân sự, thực hiện thanh toán và tiến hành hoạt động kinh doanh. Đến thời điểm này, agent vẫn chưa được lên lịch bắt đầu giao dịch crypto cho đến cuối
GateNews15giờ trước