Negli ultimi tempi, i modelli linguistici applicati alle intelligenze artificiali sono il topic più discusso. Una pletora di modelli sviluppati da importanti aziende come Microsoft, Google e OpenAI sono già presenti sulla scena abbinati alle rispettive intelligenze artificiali. Secondo le ultime notizie, anche Meta, la società madre di Facebook, ha fatto passi da gigante in questo campo e ha rilasciato un nuovo modello linguistico chiamato LLaMA.
A differenza di altri modelli linguistici come Bing Chat, Google Bard o ChatGPT, LLaMA non è ancora un prodotto finito nel senso che il pubblico in generale non può interagire con esso tramite prompt e messaggi. Piuttosto, è più uno strumento di ricerca che Meta condivide in modo che gli sviluppatori possano accedere facilmente a questo campo importante e in rapida evoluzione.
Meta LLAMA non è un prodotto commerciale ma si rivolge alla ricerca e allo sviluppo
Rilasciando LLaMA con una licenza non commerciale incentrata su casi d’uso di ricerca, Meta garantisce l’accesso a università, ONG e laboratori del settore per aiutare gli esperti ad affrontare problemi come pregiudizi e tossicità nei modelli di linguaggio AI.
Il CEO Mark Zuckerberg ha espresso l’impegno di Meta per aprire la ricerca. Ha sottolineato l’impegno di Meta nei confronti di questo modello di ricerca aperto, affermando che l’azienda metterà a disposizione della comunità di ricerca sull’IA il suo nuovo modello.
“Riteniamo che l’intera comunità dell’IA – ricercatori accademici, società civile, responsabili politici e industria – debba lavorare insieme per sviluppare linee guida chiare sull’IA responsabile in generale e sui modelli di linguaggio di grandi dimensioni responsabili in particolare“, ha scritto la società nel suo post. “Non vediamo l’ora di vedere cosa la comunità può imparare – e alla fine costruire – utilizzando LLaMA“.
Rilasciando LLaMA, Meta spera di promuovere la collaborazione tra ricercatori accademici, società civile, responsabili politici e industria per sviluppare linee guida chiare sull’intelligenza artificiale responsabile e modelli di linguaggio di grandi dimensioni responsabili.
Mentre Meta ha precedentemente rilasciato i propri chatbot di intelligenza artificiale, come BlenderBot e Galactica, l’accoglienza è stata al massimo mista. Con LLaMA, Meta spera in una risposta migliore.
4 modelli di LLAMA da usare con diverse potenze computazionali
LLaMA è in realtà un quartetto di modelli di diverse dimensioni, con i numeri nei loro nomi che si riferiscono ai miliardi di parametri in ciascun modello. Il secondo modello più piccolo, LLaMA-13B, può persino funzionare su una singola GPU Nvidia Tesla V100 di livello data center, rendendolo accessibile alle istituzioni più piccole che desiderano eseguire test su questi sistemi.
Il rilascio di LLaMA da parte di Meta è degno di nota perché dimostra la sua dedizione alla ricerca sull’IA e la volontà dell’azienda di condividere le risorse con la comunità più ampia. Poiché il campo dei modelli linguistici AI continua ad evolversi e crescere, è emozionante vedere quali progressi e scoperte emergeranno dall’uso di strumenti come LLaMA.
E seppur non sia ancora open source, Meta non ha chiuso all’idea di renderne disponibile il codice in futuro.