A Microsoft revelou recentemente o modelo de inteligência artificial VASA-1, que é capaz de criar vídeos extremamente realistas usando apenas uma única foto de alguém e um arquivo de áudio.
A novidade gera sincronia de movimentos labiais e expressões faciais detalhadas. Destinada inicialmente para uso em acessibilidade e educação, a tecnologia possibilita a geração de personagens virtuais que podem auxiliar indivíduos com dificuldades de comunicação, além de proporcionar companhia ou suporte terapêutico.
Apesar de ter sido criada pensando em um uso social e com impacto positivo, a tecnologia trás grandes preocupações sobre o seu uso e possível resultados antiéticos, especialmente na criação de deepfakes.
A Microsoft destacou que não lançará o modelo VASA-1 comercialmente até que medidas de segurança adequadas estejam garantidas para prevenir abusos.
O VASA-1 pode renderizar vídeos de alta qualidade com baixa latência, suportando resoluções de até 512×512 pixels e 40 FPS, e permite ajustes granulares no vídeo, como direção do olhar e expressões emocionais.
É possível ler a matéria completa na página da Microsoft sobre os detalhes da nova tecnologia.
Fonte/Créditos: B9.
Imagens: divulgação.