Vừa mới thấy nhóm MiMo của Xiaomi mở nguồn mô hình mới, dòng V2.5.


Mình thấy thú vị là họ dùng giấy phép MIT, điều này rất thoáng đãng, bạn có thể mang đi làm sản phẩm thương mại, tự tiếp tục huấn luyện, tùy ý chỉnh sửa, họ không quản.
Hai mô hình cũng nói qua một chút.
Phiên bản Pro là một MoE hoàn toàn dựa trên văn bản, tổng số tham số là 1.02 nghìn tỷ, nhưng đừng hoảng, khi chạy thực tế chỉ kích hoạt 420 tỷ, áp lực phần cứng không lớn lắm. Nó chủ yếu dùng cho nhiệm vụ agent và viết mã.
Điểm số trên ClawEval của nó tương đương GPT-5.4, nhưng có một dữ liệu khá hấp dẫn, mỗi nhiệm vụ chỉ tiêu tốn khoảng 7 vạn token, tiết kiệm hơn một nửa so với các nhà khác.
Điều này tương đương với việc cùng một công việc, hóa đơn token của bạn sẽ ít đi một khoản lớn.
Mô hình còn lại là phiên bản toàn chế độ, 3100 tỷ tham số, kích hoạt 150 tỷ, có thể xem, nghe, đọc hình ảnh.
Đi kèm là bộ mã hóa hình ảnh và âm thanh riêng biệt.
Cả hai đều có thể xử lý cùng lúc khoảng 1 triệu token ngữ cảnh, đủ dùng cho các đoạn mã dài, cả cuốn sách toàn bộ.
Họ còn tổ chức một hoạt động, tặng miễn phí 1 triệu tỷ token trong 30 ngày.
Cá nhân, nhóm, doanh nghiệp đều có thể đăng ký, sau đó có thể dùng để truy cập các công cụ như Claude Code, Cursor.
Xem bản gốc
Trang này có thể chứa nội dung của bên thứ ba, được cung cấp chỉ nhằm mục đích thông tin (không phải là tuyên bố/bảo đảm) và không được coi là sự chứng thực cho quan điểm của Gate hoặc là lời khuyên về tài chính hoặc chuyên môn. Xem Tuyên bố từ chối trách nhiệm để biết chi tiết.
  • Phần thưởng
  • Bình luận
  • Đăng lại
  • Retweed
Bình luận
Thêm một bình luận
Thêm một bình luận
Không có bình luận
  • Ghim