OpenAI ha iniziato a lanciare la sua funzionalità Advanced Voice Mode per ChatGPT, dandogli una voce molto simile a quella umana. A partire da oggi, un piccolo numero di utenti paganti di ChatGPT potrà avere un tete-a-tete con il chatbot AI, conversando proprio come se si trattasse di un essere umano. Tutti i membri di ChatGPT Plus dovrebbero ricevere l’accesso al set di strumenti ampliato entro l’autunno di quest’anno.
In un annuncio su X, l’azienda ha affermato che questa versione avanzata della sua Voice Mode “offre conversazioni più naturali e in tempo reale, ti consente di interrompere in qualsiasi momento e rileva e risponde alle tue emozioni“.
https://x.com/OpenAI/status/1818353580279316863
ChatGPT ha finalmente una voce molto simile a quella umana, comprensiva di intonazioni ed espressioni
Il supporto per le conversazioni vocali è arrivato lo scorso settembre in ChatGPT e la versione più avanzata ha ottenuto una demo pubblica a maggio. La “o” in GPT-4o sta per “omni” e il suo focus principale è sugli input multimodali. Può gestire voce, video, immagini e migliora significativamente anche il supporto per le lingue non inglesi. Il limite dei token di output con GPT-4o è stato dimezzato fino al 2048, ma OpenAI afferma che ha una finestra di contesto di 128.000 token e una data di conoscenza di ottobre 2023.
ChatGPT basato su GPT-4o (non la versione mini) utilizza un singolo modello multimodale per le capacità vocali anziché i tre modelli separati utilizzati dalla sua precedente soluzione audio, riducendo la latenza nelle conversazioni con il chatbot.
OpenAI ha attirato molte critiche alla demo di maggio per aver debuttato con un’opzione vocale che suonava stranamente come Scarlett Johansson, la cui carriera di attrice includeva la voce del personaggio AI Samantha nel film Her di Spike Jonze. Dopo alcuni giorni di polemiche però, è venuto fuori che OpenAI effettivamente non ha utilizzato il timbro vocale dell’attrice per dare voce al proprio chatbot.
La data di rilascio per la Advanced Voice Mode di ChatGPT è stata posticipata poco dopo la reazione negativa. Anche se l’azienda ha insistito sul fatto che il doppiatore non stava imitando la performance di Johansson, la voce dal suono simile è stata poi eliminata.