A Meta, empresa controladora do Facebook e do Instagram, anunciou um modelo de IA de geração de fala chamado Voicebox em 16 de junho.
A empresa disse que o Voicebox pode gerar fala a partir de texto e observou que o modelo pode combinar um estilo de áudio com base em uma amostra de apenas dois segundos.
O Voicebox também pode converter uma amostra de texto para outro idioma e, com uma amostra de fala separada, ler o texto traduzido na voz original do falante. Esse recurso suporta seis idiomas: inglês, francês, alemão, espanhol, polonês e português.
O modelo AI também pode editar as gravações existentes para remover o ruído de fundo. De forma mais geral, ele pode criar fala modelada em diversas amostras de fala.
Voicebox pode ser aproveitado por vários usuários
A Meta disse que o Voicebox e outros modelos de IA semelhantes poderiam permitir que assistentes virtuais e personagens não-jogadores em seu metaverso tivessem vozes realistas. A ferramenta também pode ser útil para criadores de conteúdo e usuários com necessidades de acessibilidade, afirmou.
Meta disse que o Voicebox é atualmente um projeto de pesquisa. Não disse quando o recurso pode estar disponível publicamente, mas compartilhou um vídeo de demonstração.
Meta anunciou vários ferramentas de IA do consumidor no início de junho, revelou detalhes sobre sua chips de IA em maio, e discutiu aplicativos internos de IA em uma chamada para investidores em abril.
o posto Meta revela IA de geração de voz: Voicebox apareceu primeiro em CryptoSlate.