Imagina la IA algún día componiendo música y sonidos de calidad. Es una realidad que puede estar más cerca de lo que piensas. Hoy (2 de agosto), Meta Anunciado ha lanzado tres modelos de IA generativa de código abierto: MusicGen, AudioGen y EnCodec, que permiten a los usuarios generar música y efectos de sonido, desde un perro ladrando hasta autos tocando la bocina y pasos en un piso de madera, con solo un mensaje de texto. Los modelos, que están capacitados en música con licencia y propiedad de Meta, así como en efectos de sonido públicos, están actualmente disponibles para fines de investigación.
Los modelos de IA generativa han asombrado al mundo con su capacidad para crear contenido que suena y se ve como el de un ser humano. Eso sí, qué bien la salidapone es discutible. Si das el audio de muestra para el mensaje de texto, “pista de baile pop con melodías pegadizas, percusiones tropicales y ritmos alegres, perfecto para la playa” una escucha, suena como algo que escucharía en un ascensor.
Podría decirse que la música es el tipo de audio más difícil de crear porque implica largas secuencias de datos, según Meta. Por el contrario, los modelos de IA generativos basados en texto como LLaMA de Meta funcionan con secuencias de datos mucho más cortas. La IA, hasta ahora, no ha podido “captar por completo los matices expresivos y los elementos estilísticos que se encuentran en la música”, escribió la compañía en una publicación de blog. Meta dijo que cualquiera puede construir sobre sus modelos para crear mejores generadores de sonido.
El lanzamiento de la herramienta de texto a audio viene como sellos discográficos y los artistas han expresado su preocupación por los modelos de IA que imitan a los músicos.
¿Qué está haciendo Meta con la IA generativa?
Como todos los demás gigantes tecnológicos, Meta ha estado invirtiendo en IA generativa. En febrero, la empresa publicado públicamente LLaMA, su propio modelo de lenguaje grande (LLM) para la investigación. El mes pasado, la compañía reveló la última versión de su LLM, Llama 2, que es gratuita para investigación y uso comercial y está disponible a través del servicio de computación en la nube de Azure.
Según se informa, Meta se está preparando para lanzar una gama de Chatbots impulsados por IA, probablemente impulsado por Llama, que exhiben diferentes personalidades, según el Financial Times. A diferencia de Microsoft, que se ha centrado en crear herramientas generativas de IA para empresas empresariales, Meta se diferencia por el desarrollo de herramientas de inteligencia artificial para los usuarios de sus plataformas de redes sociales. Según se informa, se espera que los chatbots de IA tomen la forma de diferentes personajes que pueden proporcionar recomendaciones o nuevas funciones de búsqueda en conversaciones que parecen humanas. Esto podría impulsar la participación de los usuarios en el gigante de las redes sociales y dar a Meta la oportunidad de recopilar nuevos datos para contenido y anuncios específicos, según el Financial Times.
‘ Este Articulo puede contener información publicada por terceros, algunos detalles de este articulo fueron extraídos de la siguiente fuente: qz.com ’