Một cách tiếp cận mới về tích hợp khả năng thoại nâng cao vào robot—API âm thanh của Grok vừa ra mắt, trình diễn một robot, và kết quả thật sự rất hấp dẫn. Hiệu suất kỹ thuật nói lên tất cả: nó vượt qua Big Bench Audio, tiêu chuẩn kiểm tra khắt khe nhất của ngành về các nhiệm vụ lý luận âm thanh. Cách đột phá này có thể thực sự định hình lại khả năng của các tác nhân tự động trong lĩnh vực robot. Các tác nhân hỗ trợ thoại không chỉ thông minh hơn; chúng còn trực quan và thực tế hơn cho việc triển khai trong thế giới thực. Còn rất sớm, nhưng nền tảng đã vững chắc để phát triển các ứng dụng hấp dẫn trong tương lai.
Xem bản gốc
Trang này có thể chứa nội dung của bên thứ ba, được cung cấp chỉ nhằm mục đích thông tin (không phải là tuyên bố/bảo đảm) và không được coi là sự chứng thực cho quan điểm của Gate hoặc là lời khuyên về tài chính hoặc chuyên môn. Xem Tuyên bố từ chối trách nhiệm để biết chi tiết.
18 thích
Phần thưởng
18
4
Đăng lại
Retweed
Bình luận
0/400
MissedAirdropAgain
· 2025-12-20 17:38
API âm thanh của Grok thực sự tàn nhẫn, đánh bại băng ghế lớn có nghĩa là gì? Dù sao, robot âm thanh đang đến
Xem bản gốcTrả lời0
BlockchainGriller
· 2025-12-18 01:59
grok này API âm thanh này thực sự mạnh mẽ, trực tiếp vượt qua benchmark âm thanh của big bench, robot có thể hiểu được lời nói của con người rồi, chuyện này cảm giác lại gần hơn với thời đại agent tự chủ?
Xem bản gốcTrả lời0
SilentObserver
· 2025-12-18 01:50
API âm thanh của Grok thực sự tàn nhẫn, nhưng vẫn còn phải xem liệu cảnh này có thực sự có thể được sử dụng trên mặt đất hay không. Bây giờ tất cả đều là sự cường điệu demo, còn sản phẩm thực tế thì sao?
Xem bản gốcTrả lời0
Gm_Gn_Merchant
· 2025-12-18 01:45
grok API âm thanh thật sự tuyệt vời, hiệu quả của demo robot có thể thấy rõ kỹ thuật thực sự mạnh mẽ. Các mô hình lớn đang đẩy mạnh hướng về robot, lần này khả năng tự động hóa có thể sẽ bùng nổ.
Một cách tiếp cận mới về tích hợp khả năng thoại nâng cao vào robot—API âm thanh của Grok vừa ra mắt, trình diễn một robot, và kết quả thật sự rất hấp dẫn. Hiệu suất kỹ thuật nói lên tất cả: nó vượt qua Big Bench Audio, tiêu chuẩn kiểm tra khắt khe nhất của ngành về các nhiệm vụ lý luận âm thanh. Cách đột phá này có thể thực sự định hình lại khả năng của các tác nhân tự động trong lĩnh vực robot. Các tác nhân hỗ trợ thoại không chỉ thông minh hơn; chúng còn trực quan và thực tế hơn cho việc triển khai trong thế giới thực. Còn rất sớm, nhưng nền tảng đã vững chắc để phát triển các ứng dụng hấp dẫn trong tương lai.