Việc Google triển khai Lyria 3 trong ứng dụng Gemini cho phép người dùng tạo ra các bản nhạc tùy chỉnh dài 30 giây từ một đoạn văn bản hoặc hình ảnh đơn giản, kèm theo lời bài hát tự động và bìa album.
Công ty công nghệ Google thông báo đã ra mắt Lyria 3 trong Gemini, mô hình tạo nhạc AI mới của công ty cho phép người dùng biến một đoạn văn bản hoặc hình ảnh thành các bản nhạc tùy chỉnh dài 30 giây với lời bài hát và bìa album tự động tạo ra. Cập nhật này giới thiệu phiên bản mới nhất của hệ thống tạo nhạc của Google DeepMind trực tiếp trong ứng dụng Gemini, đánh dấu sự phát hành rộng rãi nhất dành cho người tiêu dùng từ trước đến nay.
Lyria 3 dựa trên các phiên bản trước của mô hình và được thiết kế để cung cấp cho người dùng nhiều quyền kiểm soát hơn đối với sản phẩm âm nhạc. Hệ thống có thể tự tạo lời bài hát mà không cần nhập liệu từ người dùng, điều chỉnh các yếu tố phong cách như thể loại, tốc độ và giọng hát, cũng như tạo ra âm thanh chân thực và phức tạp hơn về mặt âm nhạc. Người dùng có thể mô tả ý tưởng, ký ức hoặc tâm trạng, hoặc tải lên hình ảnh hoặc video, và mô hình sẽ tạo ra một bản nhạc phản ánh nội dung đó. Ứng dụng Gemini tạo ra các đoạn clip dài 30 giây kèm theo bìa album tùy chỉnh do Nano Banana tạo ra, giúp kết quả dễ dàng tải xuống hoặc chia sẻ.
Mô hình hỗ trợ hai chế độ sáng tạo chính. Chế độ tạo nhạc từ văn bản cho phép người dùng chỉ định thể loại hoặc cảm xúc để tạo ra bài hát có lời hoặc nhạc nền không lời. Chế độ tạo nhạc từ hình ảnh hoặc video sử dụng hình ảnh hoặc video tải lên làm cảm hứng cho bản phối, với hệ thống sáng tác lời phù hợp với hình ảnh đó. Google định vị các tính năng này như công cụ thể hiện sáng tạo giải trí hơn là sản xuất nhạc chuyên nghiệp.
Các nhà sáng tạo trên YouTube cũng sẽ có quyền truy cập Lyria 3 thông qua Dream Track for Shorts. Tính năng này, đã có sẵn tại Mỹ và sẽ mở rộng sang các khu vực khác, cho phép tạo nhạc nền tùy chỉnh cho các video ngắn. Mô hình có thể tạo ra các câu hát hoặc nhạc nền khí quyển, mang lại nhiều linh hoạt hơn cho các nhà sáng tạo trong việc định hình âm thanh đi kèm với bài đăng của họ.
Google mở rộng giám sát âm nhạc AI với công nghệ watermark SynthID và các công cụ xác thực mới
Tất cả âm thanh được tạo trong ứng dụng Gemini đều có chứa SynthID, watermark không thể nhận biết của Google để xác định nội dung do AI tạo ra. Ứng dụng hiện cho phép người dùng tải lên các tệp âm thanh để kiểm tra xem chúng có chứa SynthID hay không, mở rộng các công cụ xác thực trước đây chỉ áp dụng cho hình ảnh và video. Gemini sẽ phân tích tệp và xác định xem nó có được tạo ra bằng hệ thống AI của Google hay không.
Google nhấn mạnh rằng Lyria 3 được phát triển với trọng tâm là sử dụng có trách nhiệm và hợp tác với ngành công nghiệp âm nhạc. Công ty lưu ý rằng mô hình này nhằm mục đích thể hiện sáng tạo gốc hơn là bắt chước các nghệ sĩ cụ thể. Nếu đoạn prompt đề cập đến một nghệ sĩ nổi tiếng, hệ thống sẽ tạo ra âm nhạc lấy cảm hứng từ các yếu tố phong cách chung chứ không sao chép giọng hát hoặc danh mục của một nghệ sĩ cụ thể. Các bộ lọc cũng được thiết lập để ngăn chặn các sản phẩm tương tự các tác phẩm có bản quyền hiện có, và người dùng có thể báo cáo nội dung có thể vi phạm quyền. Tất cả việc sử dụng hệ thống vẫn phải tuân thủ Điều khoản dịch vụ của Google và chính sách AI tạo sinh.
Lyria 3 hiện có sẵn trong ứng dụng Gemini cho người dùng từ 18 tuổi trở lên bằng tiếng Anh, Đức, Tây Ban Nha, Pháp, Hindi, Nhật Bản, Hàn Quốc và Bồ Đào Nha. Google dự định mở rộng hỗ trợ ngôn ngữ và nâng cao chất lượng theo thời gian. Mô hình sẽ được triển khai trên máy tính để bàn ngay lập tức và sẽ có mặt trên ứng dụng di động trong những ngày tới, với các thuê bao Google AI Plus, Pro và Ultra nhận giới hạn sử dụng cao hơn.
Xem bản gốc
Trang này có thể chứa nội dung của bên thứ ba, được cung cấp chỉ nhằm mục đích thông tin (không phải là tuyên bố/bảo đảm) và không được coi là sự chứng thực cho quan điểm của Gate hoặc là lời khuyên về tài chính hoặc chuyên môn. Xem Tuyên bố từ chối trách nhiệm để biết chi tiết.
Google giới thiệu Lyria 3 trong Gemini, mang nhạc do AI tạo ra đến hàng triệu người dùng
Tóm tắt
Việc Google triển khai Lyria 3 trong ứng dụng Gemini cho phép người dùng tạo ra các bản nhạc tùy chỉnh dài 30 giây từ một đoạn văn bản hoặc hình ảnh đơn giản, kèm theo lời bài hát tự động và bìa album.
Công ty công nghệ Google thông báo đã ra mắt Lyria 3 trong Gemini, mô hình tạo nhạc AI mới của công ty cho phép người dùng biến một đoạn văn bản hoặc hình ảnh thành các bản nhạc tùy chỉnh dài 30 giây với lời bài hát và bìa album tự động tạo ra. Cập nhật này giới thiệu phiên bản mới nhất của hệ thống tạo nhạc của Google DeepMind trực tiếp trong ứng dụng Gemini, đánh dấu sự phát hành rộng rãi nhất dành cho người tiêu dùng từ trước đến nay.
Lyria 3 dựa trên các phiên bản trước của mô hình và được thiết kế để cung cấp cho người dùng nhiều quyền kiểm soát hơn đối với sản phẩm âm nhạc. Hệ thống có thể tự tạo lời bài hát mà không cần nhập liệu từ người dùng, điều chỉnh các yếu tố phong cách như thể loại, tốc độ và giọng hát, cũng như tạo ra âm thanh chân thực và phức tạp hơn về mặt âm nhạc. Người dùng có thể mô tả ý tưởng, ký ức hoặc tâm trạng, hoặc tải lên hình ảnh hoặc video, và mô hình sẽ tạo ra một bản nhạc phản ánh nội dung đó. Ứng dụng Gemini tạo ra các đoạn clip dài 30 giây kèm theo bìa album tùy chỉnh do Nano Banana tạo ra, giúp kết quả dễ dàng tải xuống hoặc chia sẻ.
Mô hình hỗ trợ hai chế độ sáng tạo chính. Chế độ tạo nhạc từ văn bản cho phép người dùng chỉ định thể loại hoặc cảm xúc để tạo ra bài hát có lời hoặc nhạc nền không lời. Chế độ tạo nhạc từ hình ảnh hoặc video sử dụng hình ảnh hoặc video tải lên làm cảm hứng cho bản phối, với hệ thống sáng tác lời phù hợp với hình ảnh đó. Google định vị các tính năng này như công cụ thể hiện sáng tạo giải trí hơn là sản xuất nhạc chuyên nghiệp.
Các nhà sáng tạo trên YouTube cũng sẽ có quyền truy cập Lyria 3 thông qua Dream Track for Shorts. Tính năng này, đã có sẵn tại Mỹ và sẽ mở rộng sang các khu vực khác, cho phép tạo nhạc nền tùy chỉnh cho các video ngắn. Mô hình có thể tạo ra các câu hát hoặc nhạc nền khí quyển, mang lại nhiều linh hoạt hơn cho các nhà sáng tạo trong việc định hình âm thanh đi kèm với bài đăng của họ.
Google mở rộng giám sát âm nhạc AI với công nghệ watermark SynthID và các công cụ xác thực mới
Tất cả âm thanh được tạo trong ứng dụng Gemini đều có chứa SynthID, watermark không thể nhận biết của Google để xác định nội dung do AI tạo ra. Ứng dụng hiện cho phép người dùng tải lên các tệp âm thanh để kiểm tra xem chúng có chứa SynthID hay không, mở rộng các công cụ xác thực trước đây chỉ áp dụng cho hình ảnh và video. Gemini sẽ phân tích tệp và xác định xem nó có được tạo ra bằng hệ thống AI của Google hay không.
Google nhấn mạnh rằng Lyria 3 được phát triển với trọng tâm là sử dụng có trách nhiệm và hợp tác với ngành công nghiệp âm nhạc. Công ty lưu ý rằng mô hình này nhằm mục đích thể hiện sáng tạo gốc hơn là bắt chước các nghệ sĩ cụ thể. Nếu đoạn prompt đề cập đến một nghệ sĩ nổi tiếng, hệ thống sẽ tạo ra âm nhạc lấy cảm hứng từ các yếu tố phong cách chung chứ không sao chép giọng hát hoặc danh mục của một nghệ sĩ cụ thể. Các bộ lọc cũng được thiết lập để ngăn chặn các sản phẩm tương tự các tác phẩm có bản quyền hiện có, và người dùng có thể báo cáo nội dung có thể vi phạm quyền. Tất cả việc sử dụng hệ thống vẫn phải tuân thủ Điều khoản dịch vụ của Google và chính sách AI tạo sinh.
Lyria 3 hiện có sẵn trong ứng dụng Gemini cho người dùng từ 18 tuổi trở lên bằng tiếng Anh, Đức, Tây Ban Nha, Pháp, Hindi, Nhật Bản, Hàn Quốc và Bồ Đào Nha. Google dự định mở rộng hỗ trợ ngôn ngữ và nâng cao chất lượng theo thời gian. Mô hình sẽ được triển khai trên máy tính để bàn ngay lập tức và sẽ có mặt trên ứng dụng di động trong những ngày tới, với các thuê bao Google AI Plus, Pro và Ultra nhận giới hạn sử dụng cao hơn.