Il generatore di immagini integrato nella nuova app di Gemini, noto come Imagen 2, ha prodotto alcuni risultati davvero imbarazzanti e inaccurati per l’azienda, tanto che Google ha annunciato di averlo disattivato in seguito alle critiche sulla sua accuratezza storica. La società ha rilasciato oggi una spiegazione più dettagliata.
Dopo due dichiarazioni nel corso di questa settimana, Google ha pubblicato ora un post sul blog più lungo scritto da Prabhakar Raghavan, VP della divisione “Knowledge and Information“, in cui si afferma che “non vuole Gemini si rifiutino di creare immagini di un particolare gruppo” o “creano immagini storiche – o di qualsiasi altro tipo” imprecise.
…se chiedi a Gemini immagini di un tipo specifico di persona – come “un insegnante nero in una classe” o “un veterinario bianco con un cane” – o persone in particolari contesti culturali o storici, dovresti assolutamente ottenere una risposta che rifletta accuratamente ciò che chiedi.
Google ha identificato due problemi come responsabili:
“… la nostra messa a punto per garantire che Gemini mostrasse una serie di persone non è riuscita a tenere conto dei casi che chiaramente non avrebbero dovuto mostrare una gamma.”
“… col tempo, il modello è diventato molto più cauto di quanto intendessimo e si è rifiutato di rispondere completamente a determinati suggerimenti, interpretando erroneamente alcuni suggerimenti molto anodini come sensibili.”
Una combinazione di questi due problemi critici, dice Raghavan, ha portato Gemini a compensare eccessivamente in alcune aree mentre è eccessivamente conservatore in altre richieste, risultando in immagini “imbarazzanti e sbagliate”. Sebbene la società entri nei dettagli spiegando le inadeguatezze di Gemini – più specificamente Imagen 2, che viene utilizzato dal chatbot per la generazione di immagini – non c’è menzione esplicita di quando questa funzionalità tornerà sul chatbot.
Non è chiaro quando Imagen 2 tornerà disponibile su Google Gemini
Per ora, il post sul blog afferma che Google lavorerà per migliorare la generazione di immagini con le persone “in modo significativo” prima di riportarla su Gemini. Quindi spetta a chiunque indovinare quanto tempo ci vorrà, ma è sicuro dire che Google Gemini non sarà in grado di generare immagini di persone in tempi brevi. Va riconosciuto merito all’azienda, che ha sempre sostenuto che gli LLM (modelli linguistici di grandi dimensioni) possono sbagliare alcune cose, riferendosi a ciò che è ampiamente noto nel settore come allucinazioni.
In chiusura, Raghavan afferma che Google farà del suo meglio per fornire l’intelligenza artificiale “in modo sicuro e responsabile” ai suoi utenti.