Gli strumenti di intelligenza artificiale generativa di Google stanno ricevendo alcuni dei potenziamenti che l’azienda ha anticipato al Google I/O. A partire da questa settimana, l’azienda sta lanciando la versione di nuova generazione del suo generatore di immagini Imagen 3, che reintroduce la possibilità di generare persone AI (dopo un’imbarazzante controversia all’inizio di quest’anno). Oltre a ciò, il chatbot Gemini di Google aggiunge anche Gems, la versione dell’azienda dei bot con istruzioni personalizzate, simili ai GPT personalizzati di ChatGPT.
Google Imagen 3 torna in campo, integrato in Gemini
Imagen 3 di Google è la versione aggiornata del suo generatore di immagini, in arrivo su Gemini. L’azienda afferma che il modello di intelligenza artificiale di nuova generazione “stabilisce un nuovo standard per la qualità delle immagini” ed è costruito con protezioni per evitare di correggere eccessivamente la diversità, come le bizzarre immagini AI storiche che sono diventate virali all’inizio di quest’anno.
“In un’ampia gamma di benchmark, Imagen 3 si comporta favorevolmente rispetto ad altri modelli di generazione di immagini disponibili“, ha scritto il Product Manager di Gemini Dave Citron in un comunicato stampa. Lo strumento consente di guidare la generazione di immagini con prompt aggiuntivi se non ti piace ciò che sputa fuori la prima volta.
Citron afferma che Imagen 3 funziona “favorevolmente” rispetto alla concorrenza. Include anche lo strumento SynthID di DeepMind per filigranare le immagini, rendendo chiaro che sono realizzate dall’intelligenza artificiale e non l’articolo originale.
Citron afferma che la possibilità di generare persone tornerà nei prossimi giorni per gli utenti paganti, mesi dopo che Google ha ritirato la funzionalità. Afferma che nuovi guardrail impediranno la generazione di “individui fotorealistici e identificabili”, ben lontani dai problematici deepfake generati da Grok di Elon Musk. Sono inoltre off-limits i bambini e (come con altri generatori di immagini) qualsiasi scena cruenta, violenta o sessuale. Il product manager giustifica le aspettative affermando che le immagini di Gemini non saranno perfette, ma promette che l’azienda continuerà ad ascoltare il feedback degli utenti e ad apportare le dovute modifiche.
A partire da questa settimana, il modello Imagen 3 sarà disponibile per tutti gli utenti, ma la reintroduzione delle immagini con persone inizierà con gli utenti paganti. Gli utenti Gemini Advanced, Business ed Enterprise di lingua inglese possono aspettarsi che la generazione di immagini umane torni “nei prossimi giorni”.
Google Gemini, arrivano i Gem per un focus ancora più specifico
Inizialmente presentati in anteprima al Google I/O 2024, i Gem sono i chatbot personalizzati di Google con istruzioni create dagli utenti. Sono essenzialmente la risposta di Gemini ai GPT di OpenAI, che il concorrente di Google ha lanciato alla fine dell’anno scorso. I Gem inizieranno a essere lanciati nei prossimi giorni.
“Con i Gem, puoi creare un team di esperti che ti aiutino a riflettere su un progetto impegnativo, a fare brainstorming di idee per un evento imminente o a scrivere la didascalia perfetta per un post sui social media“, ha scritto Citron. “Il tuo Gem può anche ricordare una serie dettagliata di istruzioni per aiutarti a risparmiare tempo su attività noiose, ripetitive o difficili“.
Oltre alla lavagna vuota di Gem personalizzati, Gemini ne includerà di predefinite “per aiutarti a iniziare” e ispirare nuove idee. I Gem predefinite includono:
- Coach di apprendimento: per aiutarti a comprendere argomenti complessi
- Brainstormer: per ispirare nuove idee
- Guida alla carriera: ti guida attraverso gli aggiornamenti delle competenze, le decisioni e gli obiettivi
- Editor di scrittura: fornisce feedback costruttivi su grammatica, tono e struttura
- Partner di codifica: aggiorna le competenze di codifica per gli sviluppatori e ispira nuovi progetti
I Gem iniziano a essere distribuiti oggi su desktop e dispositivi mobili: tuttavia, sono disponibili solo per gli abbonati Gemini Advanced, Business ed Enterprise, quindi avrai bisogno di un piano a pagamento per provarli.