Addestrato con le medesime tecniche usate per Gemini, Google ha annunciato un nuovo modello LLM chiamato Gemma. A differenza di Gemini però, questo è “open”.
L’azienda afferma che Gemma rappresenta il suo contributo alla comunità aperta e ha lo scopo di aiutare gli sviluppatori “a costruire l’intelligenza artificiale in modo responsabile“. Pertanto, insieme a Gemma, ha introdotto anche il Responsible Generative AI Toolkit. Contiene uno strumento di debug, nonché una guida con le migliori pratiche per lo sviluppo dell’intelligenza artificiale basata sull’esperienza di Google.
Google ha reso Gemma disponibile in due diverse dimensioni: Gemma 2B e Gemma 7B, entrambe dotate di varianti pre-addestrate e ottimizzate per le istruzioni e sono entrambe sufficientemente leggere da poter essere eseguite direttamente sul laptop o sul computer desktop di uno sviluppatore. Google afferma che Gemma supera modelli molto più grandi quando si tratta di parametri di riferimento chiave e che entrambe le dimensioni dei modelli superano gli altri modelli aperti disponibili.
Oltre ad essere potenti, i modelli Gemma sono stati addestrati per essere sicuri. Google ha utilizzato tecniche automatizzate per eliminare le informazioni personali dai dati utilizzati per addestrare i modelli e ha utilizzato l’apprendimento per rinforzo basato sul feedback umano per garantire che le varianti ottimizzate per le istruzioni di Gemma mostrassero comportamenti responsabili. Aziende e sviluppatori indipendenti potrebbero utilizzare Gemma per creare applicazioni basate sull’intelligenza artificiale, soprattutto se nessuno dei modelli aperti attualmente disponibili è abbastanza potente per ciò che vogliono costruire.
Facciamo presente però che Gemma non è open source. Google definisce il rilascio come un “modello aperto”. Ciò significa che sono disponibili i “pesi” del modello, o parametri pre-addestrati, ma non il codice sorgente effettivo o i dati di addestramento, ha affermato la portavoce di Google Jane Park.
Come usare Google Gemma
Google ha in programma di introdurre in futuro ancora più varianti Gemma per una gamma di applicazioni ancora più diversificata. Detto questo, coloro che vogliono iniziare a lavorare con i modelli adesso possono accedervi tramite la piattaforma di data science Kaggle, i notebook Colab dell’azienda o anche su Hugging Face.
Ricordiamo tuttavia che al momento è LLaMA 2 (sviluppato da Meta) il modello open source più utilizzato dagli sviluppatori.