Le déploiement de Lyria 3 par Google dans l’application Gemini permet aux utilisateurs de générer des morceaux de musique personnalisés de 30 secondes à partir d’une simple invite textuelle ou d’une photo, accompagnés de paroles et de couverture créées automatiquement.
La société technologique Google a annoncé avoir lancé Lyria 3 dans Gemini, le nouveau modèle d’IA de génération musicale de l’entreprise qui permet aux utilisateurs de transformer une invite textuelle ou une photo en morceaux personnalisés de 30 secondes avec des paroles et une couverture générées automatiquement. La mise à jour introduit la dernière version du système de musique générative de Google DeepMind directement dans l’application Gemini, marquant sa sortie grand public la plus large à ce jour.
Lyria 3 s’appuie sur des versions antérieures du modèle et est conçue pour offrir aux utilisateurs un contrôle accru sur la production musicale. Le système peut générer des paroles sans intervention de l’utilisateur, ajuster des éléments stylistiques tels que le genre, le tempo et la tonalité vocale, et produire des sons plus réalistes et musicalement complexes. Les utilisateurs peuvent décrire une idée, un souvenir ou une humeur, ou télécharger une photo ou une vidéo, et le modèle créera une piste reflétant le contenu. L’application Gemini produit des clips de 30 secondes accompagnés d’une couverture personnalisée générée par Nano Banana, rendant les résultats faciles à télécharger ou à partager.
Le modèle supporte deux modes principaux de création. La génération de musique à partir de texte permet aux utilisateurs de spécifier un genre ou une tonalité émotionnelle pour produire une chanson avec paroles ou une piste instrumentale. La génération à partir d’images ou vidéos utilise des photos ou vidéos téléchargées comme source d’inspiration pour la composition, avec le système créant des paroles correspondant à l’imagerie. Google présente ces fonctionnalités comme des outils d’expression créative occasionnelle plutôt que comme une production musicale professionnelle.
Les créateurs sur YouTube auront également accès à Lyria 3 via Dream Track for Shorts. Cette fonctionnalité, déjà disponible aux États-Unis et en expansion dans d’autres régions, permet de créer des bandes sonores personnalisées pour des vidéos courtes. Le modèle peut générer des vers lyriques ou des pistes d’ambiance, offrant aux créateurs plus de flexibilité pour façonner l’audio accompagnant leurs publications.
Google étend la supervision de la musique IA avec le filigrane SynthID et de nouveaux outils de vérification
Toute l’audio généré dans l’application Gemini inclut SynthID, le filigrane imperceptible de Google permettant d’identifier le contenu produit par IA. L’application permet désormais aux utilisateurs de télécharger des fichiers audio pour vérifier s’ils contiennent SynthID, élargissant ainsi les outils de vérification qui s’appliquaient auparavant uniquement aux images et vidéos. Gemini analysera le fichier et déterminera s’il a été créé à l’aide des systèmes d’IA de Google.
Google souligne que Lyria 3 a été développée dans une optique d’utilisation responsable et en collaboration avec l’industrie musicale. La société précise que le modèle est destiné à l’expression originale plutôt qu’à l’imitation d’artistes spécifiques. Si une invite fait référence à un artiste connu, le système générera une musique inspirée par des éléments stylistiques généraux plutôt que de reproduire une voix ou un catalogue précis. Des filtres sont en place pour empêcher la production d’œuvres ressemblant à des œuvres protégées par des droits d’auteur existants, et les utilisateurs peuvent signaler tout contenu susceptible de violer des droits. Toute utilisation du système reste soumise aux Conditions d’utilisation de Google et à ses politiques sur l’IA générative.
Lyria 3 est désormais disponible dans l’application Gemini pour les utilisateurs âgés de 18 ans et plus, en anglais, allemand, espagnol, français, hindi, japonais, coréen et portugais. Google prévoit d’étendre la prise en charge des langues et d’améliorer la qualité au fil du temps. Le modèle est déployé immédiatement sur ordinateur et sera accessible sur mobile dans les prochains jours, avec des limites d’utilisation plus élevées pour les abonnés Google AI Plus, Pro et Ultra.
Voir l'original
Cette page peut inclure du contenu de tiers fourni à des fins d'information uniquement. Gate ne garantit ni l'exactitude ni la validité de ces contenus, n’endosse pas les opinions exprimées, et ne fournit aucun conseil financier ou professionnel à travers ces informations. Voir la section Avertissement pour plus de détails.
Google présente Lyria 3 dans Gemini, apportant la musique générée par IA à des millions d'utilisateurs
En Bref
Le déploiement de Lyria 3 par Google dans l’application Gemini permet aux utilisateurs de générer des morceaux de musique personnalisés de 30 secondes à partir d’une simple invite textuelle ou d’une photo, accompagnés de paroles et de couverture créées automatiquement.
La société technologique Google a annoncé avoir lancé Lyria 3 dans Gemini, le nouveau modèle d’IA de génération musicale de l’entreprise qui permet aux utilisateurs de transformer une invite textuelle ou une photo en morceaux personnalisés de 30 secondes avec des paroles et une couverture générées automatiquement. La mise à jour introduit la dernière version du système de musique générative de Google DeepMind directement dans l’application Gemini, marquant sa sortie grand public la plus large à ce jour.
Lyria 3 s’appuie sur des versions antérieures du modèle et est conçue pour offrir aux utilisateurs un contrôle accru sur la production musicale. Le système peut générer des paroles sans intervention de l’utilisateur, ajuster des éléments stylistiques tels que le genre, le tempo et la tonalité vocale, et produire des sons plus réalistes et musicalement complexes. Les utilisateurs peuvent décrire une idée, un souvenir ou une humeur, ou télécharger une photo ou une vidéo, et le modèle créera une piste reflétant le contenu. L’application Gemini produit des clips de 30 secondes accompagnés d’une couverture personnalisée générée par Nano Banana, rendant les résultats faciles à télécharger ou à partager.
Le modèle supporte deux modes principaux de création. La génération de musique à partir de texte permet aux utilisateurs de spécifier un genre ou une tonalité émotionnelle pour produire une chanson avec paroles ou une piste instrumentale. La génération à partir d’images ou vidéos utilise des photos ou vidéos téléchargées comme source d’inspiration pour la composition, avec le système créant des paroles correspondant à l’imagerie. Google présente ces fonctionnalités comme des outils d’expression créative occasionnelle plutôt que comme une production musicale professionnelle.
Les créateurs sur YouTube auront également accès à Lyria 3 via Dream Track for Shorts. Cette fonctionnalité, déjà disponible aux États-Unis et en expansion dans d’autres régions, permet de créer des bandes sonores personnalisées pour des vidéos courtes. Le modèle peut générer des vers lyriques ou des pistes d’ambiance, offrant aux créateurs plus de flexibilité pour façonner l’audio accompagnant leurs publications.
Google étend la supervision de la musique IA avec le filigrane SynthID et de nouveaux outils de vérification
Toute l’audio généré dans l’application Gemini inclut SynthID, le filigrane imperceptible de Google permettant d’identifier le contenu produit par IA. L’application permet désormais aux utilisateurs de télécharger des fichiers audio pour vérifier s’ils contiennent SynthID, élargissant ainsi les outils de vérification qui s’appliquaient auparavant uniquement aux images et vidéos. Gemini analysera le fichier et déterminera s’il a été créé à l’aide des systèmes d’IA de Google.
Google souligne que Lyria 3 a été développée dans une optique d’utilisation responsable et en collaboration avec l’industrie musicale. La société précise que le modèle est destiné à l’expression originale plutôt qu’à l’imitation d’artistes spécifiques. Si une invite fait référence à un artiste connu, le système générera une musique inspirée par des éléments stylistiques généraux plutôt que de reproduire une voix ou un catalogue précis. Des filtres sont en place pour empêcher la production d’œuvres ressemblant à des œuvres protégées par des droits d’auteur existants, et les utilisateurs peuvent signaler tout contenu susceptible de violer des droits. Toute utilisation du système reste soumise aux Conditions d’utilisation de Google et à ses politiques sur l’IA générative.
Lyria 3 est désormais disponible dans l’application Gemini pour les utilisateurs âgés de 18 ans et plus, en anglais, allemand, espagnol, français, hindi, japonais, coréen et portugais. Google prévoit d’étendre la prise en charge des langues et d’améliorer la qualité au fil du temps. Le modèle est déployé immédiatement sur ordinateur et sera accessible sur mobile dans les prochains jours, avec des limites d’utilisation plus élevées pour les abonnés Google AI Plus, Pro et Ultra.