Google DeepMind ra mắt Lyria 3 Pro: âm nhạc AI từ "nghỉ thử 30 giây" trở thành bài hát hoàn chỉnh

MarsBitNews · 2026-03-26T01:07:57+00:00

Google DeepMind ra mắt Lyria 3 Pro, cho phép tăng thời lượng tạo từ 30 giây lên 3 phút, có khả năng "nhận thức cấu trúc", cho phép người dùng chỉ định cấu trúc bài hát. Phiên bản này dự kiến sẽ kết hợp với hệ sinh thái Gemini, hỗ trợ nhiều ngôn ngữ và định dạng nội dung, nhưng vấn đề bản quyền vẫn chưa được giải quyết.

MarsBitNews

2026-03-26 01:07:57

Đang tạo bản tóm tắt

Google DeepMind đã ra mắt Lyria 3 Pro vào ngày 25 tháng 3. Chỉ sáu tuần sau khi phiên bản trước đó, Lyria 3, được phát hành, lần cập nhật này tập trung vào một điều duy nhất: kéo dài thời gian tạo ra từ 30 giây lên 3 phút, đồng thời giúp mô hình thực sự hiểu cấu trúc nội bộ của một bài hát.

Khoảng cách này không phải là một bước tiến nhỏ. 30 giây đủ để tạo ra âm thanh nền, nhưng không thể viết thành một bài hát hoàn chỉnh — không có đoạn, không có chuyển cảnh, không có cao trào. Khả năng “nhận thức cấu trúc” mới của Lyria 3 Pro cho phép người dùng chỉ định phần mở đầu, phần chính, điệp khúc, đoạn bridge trong lời nhắc, và mô hình sẽ sắp xếp các đoạn này theo cách phù hợp và thay đổi động thái phù hợp. Đây là bước quan trọng trong việc chuyển đổi công cụ âm nhạc AI từ “máy tạo” sang “công cụ sáng tạo”.

Suno và Udio đã hoạt động được một năm

Thành thật mà nói, khả năng này Suno và Udio đã có từ đầu năm 2025, cả hai đều có thời gian tạo dài hơn và kiểm soát cấu trúc linh hoạt hơn. Google bắt kịp ở thời điểm này thể hiện rằng họ thực sự đã bước vào cuộc cạnh tranh trong lĩnh vực âm nhạc AI — dựa vào khả năng phân phối của hệ sinh thái Gemini, phạm vi người dùng của Lyria 3 Pro sẽ lớn hơn rất nhiều so với bất kỳ công cụ âm nhạc AI độc lập nào.

Việc mở rộng đồng bộ của Vertex AI là một tín hiệu khác: Google không chỉ muốn phát triển các công cụ dành cho người tiêu dùng, mà còn muốn tích hợp Lyria vào quy trình làm việc của doanh nghiệp.

Cụ thể có thể làm gì

Hỗ trợ đầu vào bằng văn bản, hình ảnh và video, mô hình sẽ tự động phù hợp phong cách âm nhạc dựa trên cảm xúc của nội dung. Nội dung tạo ra bao gồm giọng hát, lời bài hát và nhạc cụ, hỗ trợ nhiều ngôn ngữ. Tất cả đầu ra đều tự động đính kèm watermark SynthID, ghi rõ nguồn gốc AI — đây là cách DeepMind duy trì việc truy xuất nguồn gốc nội dung.

Ai có thể sử dụng, cách sử dụng

Người dùng trả phí của ứng dụng Gemini hiện đã có thể sử dụng. Phân theo gói: AI Plus khoảng 10 bài/ngày, Pro khoảng 20 bài/ngày, Ultra khoảng 50 bài/ngày. Người dùng miễn phí vẫn chỉ dùng phiên bản 30 giây của Lyria 3.

Hỗ trợ các ngôn ngữ như tiếng Anh, Nhật, Hàn, Hindi, Tây Ban Nha, Bồ Đào Nha, Đức, Pháp và các ngôn ngữ khác, dành cho người trên 18 tuổi. Các bước thao tác: Gemini App → Create Music → chọn chế độ “Thinking” hoặc “Pro”.

Các nhà phát triển có thể tích hợp qua Google AI Studio và Gemini API; Vertex AI đã bước vào chế độ xem trước công khai, dành cho các kịch bản tạo nội dung theo nhu cầu doanh nghiệp. Google Vids và công cụ sản xuất âm nhạc của họ là ProducerAI cũng đã bắt đầu tích hợp. Phiên bản doanh nghiệp Workspace dự kiến sẽ sẵn sàng trong vài ngày tới.

Vấn đề bản quyền vẫn còn là một ẩn số

Google cho biết việc sử dụng dữ liệu huấn luyện tuân thủ các thỏa thuận liên quan với các nghệ sĩ, nhưng không tiết lộ nguồn gốc cụ thể hay phạm vi cấp phép. Điều này nằm trong bối cảnh các vụ kiện về bản quyền đối với Suno và Udio vẫn chưa có kết luận rõ ràng — ngành công nghiệp vẫn đang tranh luận về pháp lý của dữ liệu huấn luyện cho AI âm nhạc, và phát ngôn của Google chủ yếu là tuyên bố về lập trường chứ chưa cung cấp câu trả lời hoàn chỉnh.

Lyria 3 Pro hiện đang dần mở rộng cho người dùng, một số khu vực có thể sẽ gặp trễ trong quá trình triển khai.

Xem bản gốc

Trang này có thể chứa nội dung của bên thứ ba, được cung cấp chỉ nhằm mục đích thông tin (không phải là tuyên bố/bảo đảm) và không được coi là sự chứng thực cho quan điểm của Gate hoặc là lời khuyên về tài chính hoặc chuyên môn. Xem Tuyên bố từ chối trách nhiệm để biết chi tiết.