NVIDIA (NVDA, Finanzas) ha presentado Fugatto, un nuevo modelo de inteligencia artificial diseñado para generar y modificar música, voces y sonidos; la acción ha bajado un 3,1% en las primeras operaciones de la mañana.
La empresa dijo el lunes que el enfoque está dirigido a profesionales de la producción musical, la cinematografía y la creación de videojuegos.
Foundational Generative Audio Transformer Opus, o Fugatto para abreviar, permite a los usuarios generar o alterar audio utilizando sugerencias que se encuentran en texto o fuentes de audio. Según Nvidia, el modelo puede generar sonidos totalmente nuevos, modificar instrumentos en una canción, traducir descripciones escritas en extractos musicales e incluso cambiar acentos o emociones en un discurso.
Rafael Valle, director de investigación de audio aplicado de Nvidia, dijo: Queríamos crear un modelo que comprenda y genere sonido como lo hacen los humanos.
El paradigma tiene aplicaciones útiles en muchos campos diferentes. Las empresas de publicidad, por ejemplo, pueden editar locuciones con distintos acentos o emociones para adaptarlas a campañas de muchos lugares. Fugatto permite a los creadores de videojuegos cambiar dinámicamente los recursos de audio en tiempo real para reflejar las actividades del juego.
Al demostrar su adaptabilidad, Nvidia enfatizó la capacidad del modelo para crear cambios de sonido inusuales, incluyendo hacer que una trompeta parezca un perro que ladra o un saxofón imite el maullido de un gato. Fugatto también puede crear excelentes voces de canto a partir de entradas de texto con un mínimo de ajustes y pequeñas cantidades de datos de canto, a pesar de no estar especialmente capacitado para tales trabajos.
Impulsado por 2.500 millones de parámetros, Fugatto se creó en los sistemas DGX de Nvidia, que tienen 32 GPU H100 Tensor Core. La empresa observó que desarrollar el modelo consumió más de un año de esfuerzo.
Nvidia no ha dicho cuándo se podrá acceder a Fugatto para uso público o comercial.
Este artículo apareció por primera vez en EnfoqueGuru.
‘ Este Articulo puede contener información publicada por terceros, algunos detalles de este articulo fueron extraídos de la siguiente fuente: finance.yahoo.com ’