NVIDIAがNemotron 3 Nano Omniのオープンソース多モーダルを発表
NVIDIAがNemotron 3 Nano Omniのオープンソースのマルチモーダルモデルを発表。視覚、音声、言語を単一のモデルに統合し、AIエージェントの知覚層として位置付ける。コアは30B-A3B MoE、256K context、9xスループット。文字、画像、音声、動画などの入力をサポートし、出力は文字。Nemotron 3 Super/Ultraと連携し、コンピュータ操作、ドキュメント知能、音声・映像理解などのシーンに適用し、重みと学習データを公開。ローカル、NIM、サードパーティプラットフォームを含む展開に対応。
ChainNewsAbmedia·2時間前
