Utilizziamo assistenti digitali come Google Assistant e Siri per aiutarci a gestire le attività, rispondere alle domande e rimanere organizzati. Sebbene utili, non sono all’altezza dell’intelligenza artificiale generativa rappresentata nei film di fantascienza, come i sistemi intelligenti e intuitivi che sembrano quasi umani. Tuttavia, sta iniziando un nuovo capitolo. Gemini Nano di Google sta preparando il terreno per interazioni più intelligenti e veloci con il tuo dispositivo, che si tratti dell’ultimo Google Pixel o di un altro smartphone Android. Diamo un’occhiata più da vicino a Gemini Nano.
Cos’è Gemini Nano?
Gemini Nano è un Large Language Model (LLM) piccolo ma potente progettato per l’uso locale su dispositivi a basso consumo. Secondo i benchmark, questo grande modello linguistico funziona bene in attività come la sintesi di testo e la comprensione della lettura. Funziona bene anche con operazioni più complesse come ragionamento, attività STEM e codifica.
Il modello è disponibile in due varianti: Nano-1, con 1,8 miliardi di parametri adatti a dispositivi con poca memoria, e Nano-2, che offre 3,25 miliardi di parametri per ambienti con più memoria intensiva. Gemini Nano funziona su dispositivi Android che utilizzano il servizio di sistema Android AICore. È disponibile sui dispositivi della serie Google Pixel 9, Pixel 8 Pro, Pixel 8, Pixel 8a, Samsung Galaxy S24, Galaxy Z Fold 6 e Z Flip 6. Tuttavia, il supporto ad altri dispositivi e a Google Chrome è in arrivo.
Gemini Nano: un modello multimodale e multilingue
I modelli Gemini sono creati utilizzando un set di dati che è sia multimodale che multilingue. Questo set di dati include dati provenienti da documenti Web, libri e codice, nonché immagini, audio e video. Le IA multimodali come Gemini Nano elaborano e comprendono simultaneamente più tipi di dati, tra cui testo, immagini, audio e video.
Questa capacità consente di eseguire attività che richiedono una comprensione integrata di diversi media, portando a output più informati e ricchi di contesto. Grazie alle sue capacità multilingue, Gemini Nano comprende, elabora e produce contenuti in varie lingue, rendendoli accessibili in tutto il mondo.
Questa funzionalità consente una comunicazione multilingua senza sforzo, consentendo la traduzione in tempo reale e la generazione di contenuti in più lingue per soddisfare le esigenze di un pubblico eterogeneo. Gemini è disponibile in più di 40 lingue (italiano compreso) e Google gli sta insegnando come rispondere in più lingue.
Gemini Nano non richiede Internet ma funziona in locale sullo smartphone
Gemini Nano elabora i dati localmente operando sul tuo dispositivo senza inviare dati ai server cloud. Ciò garantisce che le informazioni sensibili rimangano sul tuo telefono, proteggendo la tua privacy e impedendo la trasmissione esterna o l’archiviazione dei dati.
Ciò è fondamentale quando si utilizzano app di messaggistica crittografate end-to-end, in cui suggerimenti e correzioni vengono apportati senza che i tuoi messaggi lascino mai il dispositivo. Ciò significa anche che Gemini Nano non si basa su una connessione Internet attiva per funzionare in modo efficace. Puoi accedervi offline.
Come Gemini Nano impara dai modelli Gemini più grandi
Nel loro nucleo, i modelli Gemini sono basati su un framework di decodifica Transformer, ottimizzato per un addestramento stabile e su larga scala e un’inferenza efficiente sulle unità di elaborazione tensoriale (TPU) di Google. Tuttavia, sia la versione Nano-1 che la versione Nano-2 sono distillate da modelli Gemini più grandi, ed è così che mantengono prestazioni eccezionali nonostante le loro piccole dimensioni. Nel campo del machine learning, distillato si riferisce a un processo noto come distillazione della conoscenza. Questa tecnica comporta l’addestramento di un modello più piccolo (spesso chiamato modello studente) per imitare il comportamento e le prestazioni di un modello più grande e complesso (noto come modello insegnante).
AICore è il centro di comando AI per Android
AICore è un modulo a livello di sistema all’interno del sistema operativo Android che funge da centro di comando per la gestione delle attività AI. Quando un’app Android deve eseguire operazioni correlate all’AI, interagisce con AICore tramite Google AI Edge SDK. L’architettura di AICore include più funzionalità di sicurezza integrate per garantire che le attività AI siano conformi agli standard di sicurezza di Google e siano coerenti con i principi di Google Private Compute Core.