Google lanza su modelo más avanzado de generación de música con IA, Lyria 3
Google DeepMind publicó en la aplicación Gemini la versión beta de su último modelo de generación musical, Lyria 3, que, con solo la ayuda de una descripción simple o una fotografía base, puede generar una pista de alta calidad de hasta 30 segundos.
El anuncio lo realizó la compañía el pasado 18 de febrero en su blog oficial, donde se explica que el resultado además se podrán crear portadas personalizadas.
Lyria 3 brinda a los usuarios 3 mejoras significativas respecto a sus antecesores: el modelo ahora se encarga de generar letras que acompañen la pista; no es necesario proveerlas como en los modelos anteriores.
Tienes más control sobre los detalles del audio, como el estilo, el tono, la voz y el tempo. Y un aumento significativo en la complejidad musical y en la calidad del audio generado.
Hay dos formas de usarlo. La primera es de texto a pista: describes el género, el estado de ánimo o la historia detrás de la canción y Gemini hace el resto. La segunda es de foto o video a pista: subes una imagen, algo como tu perro en una caminata o una tarde con amigos, y el modelo analiza el contenido para componer algo que se ajuste al momento.
Cada pista viene, además, con una portada personalizada generada por Nano Banana, lo que facilita compartirla directamente mediante un enlace.
Google también está llevando Lyria 3 a Dream Track de YouTube, la herramienta que permite a los creadores generar bandas sonoras únicas para sus Shorts. Esto lo hace disponible no solo para usuarios casuales sino también para creadores de contenido que buscan diferenciarse.
Todo el contenido musical generado en la aplicación de Gemini estará marcado con SynthId, la marca de agua imperceptible que Google utiliza para identificar todo el contenido generado por su IA. Esta misma tecnología les permite a los usuarios subir archivos de audio a la aplicación de Gemini para realizar verificaciones respecto a si el contenido del archivo fue generado por alguno de los modelos de Google. Lo que Google deja claro con esto es que Gemini ya no es solo un asistente de texto. La generación de música llega después de imágenes y video, completando una apuesta por convertir la app en una plataforma de creatividad integral. La función está disponible desde hoy en versión beta para usuarios de Gemini.
Relacionados