{"id":1342657,"date":"2025-09-02T15:37:07","date_gmt":"2025-09-02T15:37:07","guid":{"rendered":"https:\/\/celebrity.land\/pt\/?p=1342657"},"modified":"2025-09-02T15:37:07","modified_gmt":"2025-09-02T15:37:07","slug":"os-pesquisadores-desbloqueiam-nova-geracao-musical-com-amadeus-desafiador-de-dependencias-sequenciais-na-modelagem-de-token-de-atributo","status":"publish","type":"post","link":"https:\/\/celebrity.land\/pt\/os-pesquisadores-desbloqueiam-nova-geracao-musical-com-amadeus-desafiador-de-dependencias-sequenciais-na-modelagem-de-token-de-atributo\/","title":{"rendered":"Os pesquisadores desbloqueiam nova gera\u00e7\u00e3o musical com Amadeus, desafiador de depend\u00eancias seq\u00fcenciais na modelagem de token de atributo"},"content":{"rendered":"\n<figure><\/figure>\n<\/p>\n<div>\n<p>A gera\u00e7\u00e3o de m\u00fasica simb\u00f3lica depende cada vez mais de modelos que prev\u00eaem sequ\u00eancias de notas musicais e suas caracter\u00edsticas, mas as abordagens atuais geralmente tratam essas caracter\u00edsticas como ordenadas rigidamente, limitando seu potencial. Hongju Su, Ke Li e Lan Yang, juntamente com Honggang Zhang e Yi-Zhe Song, desafiam essa suposi\u00e7\u00e3o ao introduzir Amadeus, uma nova estrutura que v\u00ea os atributos musicais como um conjunto mais flex\u00edvel e concorrente. O trabalho deles demonstra que a modelagem atribui bidirecionalmente, e n\u00e3o sequencialmente, melhora significativamente a qualidade e a velocidade da gera\u00e7\u00e3o da m\u00fasica, superando os modelos de ponta existentes em v\u00e1rios benchmarks. Crucialmente, a equipe tamb\u00e9m apresenta um conjunto de dados de c\u00f3digo aberto substancial, o conjunto de dados da Amadeus MIDI, para facilitar mais pesquisas e desenvolvimento nesse campo em r\u00e1pida evolu\u00e7\u00e3o e mostra a possibilidade de controle detalhado e guiado pelo usu\u00e1rio sobre m\u00fasica gerada.<\/p>\n<p>Os modelos de gera\u00e7\u00e3o de m\u00fasica simb\u00f3lica normalmente modelam a m\u00fasica como uma sequ\u00eancia de atributos, assumindo uma estrutura de depend\u00eancia fixa entre eles. No entanto, as observa\u00e7\u00f5es sugerem que os atributos musicais s\u00e3o essencialmente simult\u00e2neos e n\u00e3o ordenados, em vez de estritamente seq\u00fcencial.<\/p>\n<h3>Modelos de idiomas grandes geram m\u00fasica simb\u00f3lica<\/h3>\n<p>Avan\u00e7os recentes na alavancagem de gera\u00e7\u00e3o de m\u00fasica simb\u00f3lica <a target=\"_blank\" rel=\"nofollow\" target=\"_blank\" href=\"https:\/\/quantumzeitgeist.com\/understanding-jailbreak-attacks-in-large-language-models-a-new-taxonomy\/\" data-wpel-link=\"internal\">grande linguagem<\/a> Modelos, originalmente projetados para texto, para criar pe\u00e7as musicais. Esses modelos visam gerar m\u00fasicas estruturalmente s\u00f3lidas, musicalmente expressivas e control\u00e1veis, permitindo especifica\u00e7\u00e3o de g\u00eanero, humor ou estilo. V\u00e1rios modelos surgiram, construindo t\u00e9cnicas anteriores. O Music Transformer foi um modelo inicial que aplica a arquitetura de transformadores \u00e0 gera\u00e7\u00e3o de m\u00fasica. O Musecoco gera m\u00fasica simb\u00f3lica a partir de legendas de texto, enquanto o transformador da m\u00fasica pop se concentra nas expressivas composi\u00e7\u00f5es de piano pop.<\/p>\n<p>Outros modelos, como o transformador de palavras compostos e o transformador de jazz, exploram diferentes abordagens para modelar m\u00fasicas completas e avaliar a m\u00fasica composta por IA. Desenvolvimentos recentes incluem difuso e disperso, megabyte, byte latente Transformer, Audio est\u00e1vel e mupt, cada um contribuindo com t\u00e9cnicas exclusivas para o campo. Modelos como Notagen, Melodyt5, Text2midi-Inferalign e XMusic avan\u00e7am ainda mais a ponta, visando uma estrutura de gera\u00e7\u00e3o de m\u00fasica simb\u00f3lica generalizada e control\u00e1vel. A pesquisa atual se concentra em melhorar a musicalidade e a expressividade, melhorar a controlabilidade, a escala para sequ\u00eancias mais longas e abordar a falta de dados de alta qualidade. O desenvolvimento de melhores m\u00e9tricas para avaliar a m\u00fasica composta por IA continua sendo um desafio significativo, impulsionando a necessidade de inova\u00e7\u00e3o cont\u00ednua nesse campo.<\/p>\n<h3>Amadeus gera m\u00fasica com qualidade e velocidade aprimoradas<\/h3>\n<p>Os pesquisadores desenvolveram o Amadeus, uma nova estrutura para gera\u00e7\u00e3o de m\u00fasica simb\u00f3lica que supera significativamente os modelos existentes em qualidade e velocidade. Desafiando a abordagem seq\u00fcencial convencional, a equipe observou que os atributos de nota musical s\u00e3o simult\u00e2neos e n\u00e3o ordenados. Isso levou a uma arquitetura de dois n\u00edveis que combinava um modelo autoregressivo para sequ\u00eancias de notas com um modelo de difus\u00e3o discreta bidirecional para atributos, alterando fundamentalmente a gera\u00e7\u00e3o simb\u00f3lica da m\u00fasica. Amadeus incorpora duas inova\u00e7\u00f5es principais: a estrat\u00e9gia de aprimoramento de discriminabilidade ao espa\u00e7o latente da m\u00fasica e o m\u00f3dulo de aprimoramento de informa\u00e7\u00f5es condicionais.<\/p>\n<p>O primeiro utiliza um aprendizado contrastante aprimorado para amplificar a discriminabilidade das representa\u00e7\u00f5es da m\u00fasica intermedi\u00e1ria, enquanto o \u00faltimo emprega mecanismos de aten\u00e7\u00e3o para fortalecer a representa\u00e7\u00e3o vetorial latente da nota, levando a uma decodifica\u00e7\u00e3o mais precisa das anota\u00e7\u00f5es. As experi\u00eancias demonstram que Amadeus alcan\u00e7a pelo menos um aumento de quatro vezes na velocidade em compara\u00e7\u00e3o com os m\u00e9todos anteriores. Os resultados mostram que o Amadeus se destaca na qualidade da m\u00fasica, ades\u00e3o \u00e0 condi\u00e7\u00e3o, controlabilidade de atributos e velocidade de infer\u00eancia, permitindo trade-offs flex\u00edveis entre esses fatores. 9 milh\u00f5es de amostras pr\u00e9-treinamento e 320.000 amostras anotadas de ajuste fino. Esse conjunto de dados e a inovadora estrutura da Amadeus prometem desbloquear novas possibilidades na composi\u00e7\u00e3o auxiliada por computador e na gera\u00e7\u00e3o de m\u00fasica.<\/p>\n<h3>A difus\u00e3o simult\u00e2nea supera a gera\u00e7\u00e3o de m\u00fasica seq\u00fcencial<\/h3>\n<p>Amadeus apresenta uma nova abordagem da gera\u00e7\u00e3o de m\u00fasica simb\u00f3lica, desafiando a depend\u00eancia da modelagem seq\u00fcencial de atributos musicais. A estrutura adota uma arquitetura de dois n\u00edveis, combinando um modelo autoregressivo para seq\u00fc\u00eancias de notas com um modelo de difus\u00e3o discreta bidirecional para atributos, tratando esses atributos como um conjunto simult\u00e2neo e n\u00e3o ordenado. As melhorias de desempenho s\u00e3o alcan\u00e7adas por meio de estrat\u00e9gias de aprimoramento de discriminabilidade ao espa\u00e7o latente da m\u00fasica e o m\u00f3dulo de aprimoramento de informa\u00e7\u00f5es condicionais, que refinam a representa\u00e7\u00e3o de dados musicais. As experi\u00eancias demonstram que o Amadeus supera significativamente os modelos existentes em tarefas de gera\u00e7\u00e3o de m\u00fasica incondicional e condicionada por texto, al\u00e9m de alcan\u00e7ar um aumento substancial na velocidade de gera\u00e7\u00e3o. Os autores reconhecem que a otimiza\u00e7\u00e3o adicional \u00e9 poss\u00edvel para equilibrar a efici\u00eancia computacional com a qualidade da gera\u00e7\u00e3o, e trabalhos futuros explorar\u00e3o as t\u00e9cnicas de acelera\u00e7\u00e3o sem perdas para permitir a gera\u00e7\u00e3o de m\u00fasica em tempo real.<\/p>\n<\/p>\n<\/div>\n<p><em>  &#8216;O artigo anterior pode incluir informa\u00e7\u00f5es divulgadas por terceiros&#8217; <\/em><\/p>\n<p><em>  &#8216;Alguns detalhes deste artigo foram extra\u00eddos da seguinte fonte Quantumzeitgeist.com&#8217; <\/em><\/p>\n<p><em> \u2018 O artigo anterior foi obtido e traduzido do site internacional da celebrity.land   \u2019 Source Link <\/em><\/p>\n\n","protected":false},"excerpt":{"rendered":"<p>A gera\u00e7\u00e3o de m\u00fasica simb\u00f3lica depende cada vez mais de modelos que prev\u00eaem sequ\u00eancias de notas musicais e suas caracter\u00edsticas, mas as abordagens atuais geralmente tratam essas caracter\u00edsticas como ordenadas rigidamente, limitando seu potencial. Hongju Su, Ke Li e Lan Yang, juntamente com Honggang Zhang e Yi-Zhe Song, desafiam essa suposi\u00e7\u00e3o ao introduzir Amadeus, uma [&hellip;]<\/p>\n","protected":false},"author":2,"featured_media":1342658,"comment_status":"open","ping_status":"closed","sticky":false,"template":"","format":"standard","meta":{"jnews-multi-image_gallery":[],"jnews_single_post":[],"jnews_primary_category":[],"jnews_override_counter":[],"footnotes":""},"categories":[42],"tags":[],"class_list":["post-1342657","post","type-post","status-publish","format-standard","has-post-thumbnail","hentry","category-musica"],"_links":{"self":[{"href":"https:\/\/celebrity.land\/pt\/wp-json\/wp\/v2\/posts\/1342657","targetHints":{"allow":["GET"]}}],"collection":[{"href":"https:\/\/celebrity.land\/pt\/wp-json\/wp\/v2\/posts"}],"about":[{"href":"https:\/\/celebrity.land\/pt\/wp-json\/wp\/v2\/types\/post"}],"author":[{"embeddable":true,"href":"https:\/\/celebrity.land\/pt\/wp-json\/wp\/v2\/users\/2"}],"replies":[{"embeddable":true,"href":"https:\/\/celebrity.land\/pt\/wp-json\/wp\/v2\/comments?post=1342657"}],"version-history":[{"count":0,"href":"https:\/\/celebrity.land\/pt\/wp-json\/wp\/v2\/posts\/1342657\/revisions"}],"wp:featuredmedia":[{"embeddable":true,"href":"https:\/\/celebrity.land\/pt\/wp-json\/wp\/v2\/media\/1342658"}],"wp:attachment":[{"href":"https:\/\/celebrity.land\/pt\/wp-json\/wp\/v2\/media?parent=1342657"}],"wp:term":[{"taxonomy":"category","embeddable":true,"href":"https:\/\/celebrity.land\/pt\/wp-json\/wp\/v2\/categories?post=1342657"},{"taxonomy":"post_tag","embeddable":true,"href":"https:\/\/celebrity.land\/pt\/wp-json\/wp\/v2\/tags?post=1342657"}],"curies":[{"name":"wp","href":"https:\/\/api.w.org\/{rel}","templated":true}]}}