Depois de puxar o grande boom da inteligência artificial generativa, o ChatGPT está evoluindo – agora, mais do que um mecanismo inteligente baseado em texto, a OpenAI anunciou a chegada de novos recursos baseados em voz e imagem à ferramenta. Ou seja, os usuários poderão manter uma conversa por voz com o chatbot.

Uso de inteligência artificial para clonar voz

Imagem: Shutterstock

A atualização vai permitir que o usuário pergunte algo verbalmente ou até peça para que a inteligência artificial crie uma história na hora de dormir.

Usando um novo modelo de converter texto em fala, o recurso de voz do ChatGPT é capaz de gerar vozes semelhantes às humanas a partir de texto e apenas alguns segundos de amostra. Segundo a OpenAI, são cinco vozes diferentes, com seu sistema de reconhecimento de fala Whisper de código aberto usado para transcrever declarações verbais em texto.

O Spotify é o primeiro parceiro de lançamento do recurso de voz da OpenAI. A plataforma de streaming anunciou uma nova funcionalidade para podcasters que lhes permite experimentar sua voz e traduzir seus programas do inglês para o espanhol, francês ou alemão – mantendo sua voz original.

Spotify - tradução de podcasts com inteligência artificial do ChatGPT

Imagem: divulgação / Spotify

“A nova tecnologia de voz – capaz de criar vozes sintéticas realistas a partir de apenas alguns segundos de fala real – abre portas para muitas aplicações criativas e focadas na acessibilidade”, explica a empresa. “No entanto, estas capacidades também apresentam novos riscos, como a possibilidade de intervenientes mal-intencionados se passarem por figuras públicas ou cometerem fraude”.

ChatGPT também ganha “olhos” e agora enxerga

A atualização também permite que os usuários do chatbot procurem respostas usando imagens. Basta enviar uma imagem ao ChatGPT e pedir algo ao mesmo tempo como, por exemplo, explicar o que é visto na cena ou até instruções do que fazer em determinadas situações.

Os novos recursos (voz e imagem) serão implementados para assinantes Plus e Enterprise nas próximas duas semanas. A voz será limitada inicialmente aos aplicativos ChatGPT para Android e iOS em uma versão beta opcional, enquanto a pesquisa de imagens chegará a todas as plataformas por padrão.

Comentários

0

Please give us your valuable comment

O seu endereço de e-mail não será publicado. Campos obrigatórios são marcados com *

Subscribe
Notify of
0 Comentários
Inline Feedbacks
View all comments