Character.AI Ra Mắt Công Nghệ Video AI Thời Gian Thực với TalkingMachines

AsiaTokenFund

2025-07-03 20:27:19

Rebeca Moen

04 tháng 7, 2025 04:27

Character.AI giới thiệu TalkingMachines, một bước đột phá trong việc tạo video AI thời gian thực, sử dụng các mô hình khuếch tán tiên tiến cho hoạt hình nhân vật tương tác, dựa trên âm thanh.

Character.AI đã công bố một bước tiến quan trọng trong việc tạo video thời gian thực với sự ra mắt của TalkingMachines, một mô hình khuếch tán tự hồi quy sáng tạo. Công nghệ mới này cho phép tạo ra các video tương tác, điều khiển bằng âm thanh, theo phong cách FaceTime, cho phép các nhân vật trò chuyện theo thời gian thực với nhiều phong cách và thể loại khác nhau, như đã được báo cáo bởi Blog của Character.AI.

Cách mạng hóa việc tạo video

TalkingMachines dựa trên công việc trước đây của Character.AI, AvatarFX, cái mà cung cấp khả năng tạo video trên nền tảng của họ. Mô hình mới này tạo điều kiện cho các tương tác hình ảnh hấp dẫn, theo thời gian thực, được hỗ trợ bởi AI và các nhân vật hoạt hình. Bằng cách sử dụng chỉ một hình ảnh và một tín hiệu giọng nói, mô hình có thể tạo ra nội dung video động, mở ra những khả năng mới cho giải trí và truyền thông tương tác.

Công Nghệ Đằng Sau TalkingMachines

Mô hình này tận dụng kiến trúc Diffusion Transformer (DiT), sử dụng một phương pháp được gọi là tinh chế kiến thức không đối xứng. Phương pháp này biến một mô hình video hai chiều chất lượng cao thành một trình tạo nhanh, thời gian thực. Các tính năng chính bao gồm:

Phân Tán Khớp Luồng: Được huấn luyện trước để quản lý các mẫu chuyển động phức tạp, từ những biểu cảm tinh tế đến những cử chỉ năng động.
Chú Ý Chéo Dựa Trên Âm Thanh: Một mô-đun âm thanh 1,2B tham số kết hợp âm thanh và chuyển động một cách tinh vi.
Chú ý nguyên nhân thưa thớt: Giảm bộ nhớ và độ trễ bằng cách tập trung vào các khung hình quá khứ có liên quan.
Chưng cất không đối xứng: Sử dụng một mô hình khuếch tán hai bước nhanh chóng để tạo ra độ dài vô hạn mà không mất chất lượng.

Những hệ quả cho tương lai

Đột phá này không chỉ giới hạn ở hoạt hình khuôn mặt, mà còn mở đường cho các nhân vật AI tương tác đa phương tiện. Nó hỗ trợ nhiều phong cách, từ chân thực đến anime và hình đại diện 3D, và sẵn sàng nâng cao trải nghiệm phát trực tuyến với các giai đoạn nói và lắng nghe tự nhiên. Công nghệ này đặt nền tảng cho việc nhập vai, kể chuyện và xây dựng thế giới tương tác.

Nâng cao khả năng AI

Nghiên cứu của Character.AI đánh dấu nhiều tiến bộ, bao gồm tạo ra thời gian thực, chưng cất hiệu quả và khả năng mở rộng cao, với các hoạt động có thể chạy chỉ trên hai GPU. Hệ thống cũng hỗ trợ tương tác đa diễn giả, cho phép các cuộc đối thoại giữa các nhân vật diễn ra liền mạch.

Triển Vọng Tương Lai

Mặc dù chưa phải là một sản phẩm được ra mắt, nhưng sự phát triển này là một cột mốc quan trọng trong lộ trình của Character.AI. Công ty đang làm việc để tích hợp công nghệ này vào nền tảng của họ, nhằm mục đích cho phép những trải nghiệm giống như FaceTime, phát trực tiếp nhân vật và xây dựng thế giới hình ảnh. Mục tiêu cuối cùng là dân chủ hóa việc tạo ra và tương tác với các nhân vật âm thanh hình ảnh sống động.

Character.AI đã đầu tư mạnh mẽ vào hạ tầng đào tạo và thiết kế hệ thống, sử dụng hơn 1,5 triệu video clip được tuyển chọn và một quy trình đào tạo ba giai đoạn. Cách tiếp cận này exemplifies độ chính xác và mục đích của nghiên cứu tiên phong trong công nghệ AI.

Nguồn hình ảnh: Shutterstock

Xem bản gốc

Tuyên bố miễn trừ trách nhiệm: Thông tin trên trang này có thể đến từ bên thứ ba và không đại diện cho quan điểm hoặc ý kiến của Gate. Nội dung hiển thị trên trang này chỉ mang tính chất tham khảo và không cấu thành bất kỳ lời khuyên tài chính, đầu tư hoặc pháp lý nào. Gate không đảm bảo tính chính xác hoặc đầy đủ của thông tin và sẽ không chịu trách nhiệm cho bất kỳ tổn thất nào phát sinh từ việc sử dụng thông tin này. Đầu tư vào tài sản ảo tiềm ẩn rủi ro cao và chịu biến động giá đáng kể. Bạn có thể mất toàn bộ vốn đầu tư. Vui lòng hiểu rõ các rủi ro liên quan và đưa ra quyết định thận trọng dựa trên tình hình tài chính và khả năng chấp nhận rủi ro của riêng bạn. Để biết thêm chi tiết, vui lòng tham khảo Tuyên bố miễn trừ trách nhiệm.

Bình luận

0/400

Không có bình luận