Le grandi aziende tecnologiche non sono mai state così desiderose di frenare tanto quanto lo hanno fatto di fronte a ChatGPT di OpenAI; alcuni colossi della tecnologia, come Microsoft, si sono affrettati a salire a bordo, mentre altri, come Google, sono stati lasciati al passo. La società ha finalmente svelato Bard il mese scorso in risposta alla popolare IA generativa di OpenAI. Ora stiamo venendo a conoscenza delle accuse secondo cui i suoi ricercatori hanno utilizzato i dati della tecnologia ChatGPT di OpenAI senza autorizzazione per aiutare a sviluppare Bard.
Google Bard è frutto dei dati di ChatGPT?
Come altri tipi di intelligenza artificiale generativa, Google Bard si basa su una combinazione di modelli di apprendimento automatico e dati di addestramento. Nel caso di Bard, Google ha utilizzato il suo Language Model for Dialogue Applications, o LaMDA, per formare la sintassi del chatbot. Per i dati di addestramento, ci sono molte librerie open source che i ricercatori di intelligenza artificiale possono utilizzare e non dubitiamo che Google le abbia cercate.
Tuttavia, sembra che questi dati di dominio pubblico non fossero sufficienti. Secondo The Information, Google ha addestrato Bard utilizzando i dati delle risposte di ChatGPT condivise pubblicamente tramite ShareGPT, un sito Web in cui gli utenti possono condividere le risposte dal chatbot di OpenAI.
Jacob Devlin, un ricercatore di intelligenza artificiale di Google, ha lasciato l’azienda dopo aver avvertito i massimi dirigenti (incluso il CEO Sundar Pichai) che l’utilizzo dei dati di ChatGPT avrebbe violato i termini di servizio di OpenAI. Devlin, che ora lavora per OpenAI, era anche preoccupato che se Google avesse attinto ai dati di ChatGPT, Bard avrebbe potuto ottenere risposte simili.
Il rapporto afferma inoltre che Google ha ordinato alla sua divisione DeepMind di collaborare con il team Brain su una nuova iniziativa nota internamente come Gemini.
La risposta di Google
In risposta a questo report, Google ha inviato una dichiarazione a WinFuture affermando che la formazione di Bard non si basava sui dati di ChatGPT. “Bard non è addestrato sui dati di ShareGPT o ChatGPT“, ha dichiarato la società alla pubblicazione.
Camminando sul filo del rasoio tra preoccupazioni etiche e mancanza di progressi, Google si è arrampicato sulla sua strada per creare Bard su una sequenza temporale avanzata (anche troppo per alcuni dipendenti). Business Insider ha riferito in precedenza che Pichai ha chiesto ai dipendenti di Google di impiegare fino a quattro ore della loro giornata per appianare alcuni nodi nel suo sfidante ChatGPT prima del suo rilascio.
Al momento non è chiaro se i dati di ChatGPT siano stati utilizzati per addestrare Bard prima del suo lancio e se Bard operi su una di queste formazioni. Per quanto dice Google, nessuno dei due è il caso.
C’è da dire che il progresso delle IA sta avvenendo a un ritmo ancora più veloce di quello a cui siamo stati abituati in questi ultimi anni. E il lancio di GPT-4 ne è l’esempio.