L’impressionante intelligenza artificiale video di OpenAI, Sora, ha preso d’assalto il mondo all’inizio di quest’anno, ma la società non ammette ancora se i video di YouTube siano stati utilizzati o meno per addestrare il modello di intelligenza artificiale.
In un’intervista al Bloomberg Technology Summit, il COO di OpenAI, Brad Lightcap, ha parlato delle potenziali applicazioni aziendali della tecnologia AI. Non sorprende che Sora sia uno di quei potenziali casi d’uso. Tuttavia, alla domanda se i video di YouTube fossero stati utilizzati o meno per addestrare Sora di OpenAI, Lightcap ha rifiutato di fornire una risposta effettiva.
Quando è stato chiesto direttamente di “chiarire una volta per tutte” se YouTube è stato utilizzato per addestrare Sora, Lightcap ha detto:
Sì, voglio dire, guarda, la conversazione sui dati è davvero importante.
Ovviamente dobbiamo sapere da dove provengono questi dati. Questa settimana abbiamo pubblicato un post proprio su questo argomento esatto, ovvero che deve esserci un sistema di identificazione dei contenuti per l’intelligenza artificiale che consenta ai creatori di capire mentre creano cose dove stanno andando, chi si sta formando su di esso, potendo partecipare e fuori dalla formazione, potendo scegliere se partecipare o meno all’utilizzo.
Inoltre, dall’altro lato, essere in grado di consentire attivamente che i tuoi contenuti vengano inseriti in un modello o che un modello vi acceda perché potrebbe esserci quest’altra opportunità economica dall’altra parte di questo.
Ed è qualcosa che stiamo esplorando anche noi, come si può effettivamente creare un contratto sociale completamente diverso con il web, con i creatori, con gli editori, dove questi modelli escono nel mondo e fanno cose che sono utili, creano valore, per nella misura in cui sono in grado di mettere mi piace, fare riferimento e incorporare contenuti dal web, dovrebbe esserci un modo in cui le persone possano trarne vantaggio.
Quindi sì, stiamo esaminando questo problema, è davvero difficile. Non abbiamo ancora tutte le risposte.
È una mancata risposta impressionante, poiché YouTube non è stato affrontato una sola volta nell’intera risposta.
OpenAI ha infatti pubblicato un post all’inizio di questa settimana su “comprendere la fonte di ciò che vediamo e sentiamo online“. Il post non affronta ancora una volta nulla con YouTube, ma piuttosto discute di come OpenAI sta lavorando per aiutare a costruire uno standard per l’autenticità dei contenuti, nonché di come sta costruendo nuovi modi per identificare i contenuti prodotti dagli strumenti di OpenAI.
All’inizio di quest’anno è stato riferito che OpenAI ha utilizzato “oltre un milione” di ore di contenuti YouTube, contro le regole della piattaforma, per addestrare GPT-4, sebbene Google abbia fatto lo stesso per Gemini secondo il rapporto.
Ricordiamo che OpenAI ha affermato che Sora sarà disponibile entro la fine dell’anno.