Entro la fine dell’anno, milioni di dispositivi Apple inizieranno a eseguire Apple Intelligence (non in Europa), la versione di Cupertino dell’intelligenza artificiale generativa annunciata alla WWDC 2024 che, tra le altre cose, consente alle persone di creare immagini da istruzioni di testo. Ma alcuni membri della comunità creativa sono scontenti di quella che, secondo loro, è la mancanza di trasparenza dell’azienda riguardo alle informazioni grezze che alimentano il modello di intelligenza artificiale che lo rende possibile.
“Vorrei che Apple avesse spiegato al pubblico in modo più trasparente come hanno raccolto i dati di formazione“, ha detto a Engadget Jon Lam, artista di videogiochi e attivista per i diritti dei creatori con sede a Vancouver. “Penso che il loro annuncio non sarebbe potuto arrivare in un momento peggiore”.
Apple è sempre stata “l’azienda per gli artisti”
I creativi sono stati storicamente alcuni dei clienti più fedeli di Apple, un’azienda il cui fondatore l’ha posizionata notoriamente “all’incrocio tra tecnologia e arti liberali”. Ma fotografi, concept artist e scultori hanno affermato di essere frustrati dal relativo silenzio di Apple sul modo in cui raccoglie i dati per i suoi modelli di intelligenza artificiale.
L’intelligenza artificiale generativa è valida tanto quanto lo sono i dati su cui sono addestrati i suoi modelli. A tal fine, la maggior parte delle aziende ha ingerito praticamente tutto ciò che ha potuto trovare su Internet, al diavolo il consenso o il compenso. Quasi 6 miliardi di immagini utilizzate per addestrare più modelli di intelligenza artificiale provenivano anche da LAION-5B, un set di dati di immagini recuperate da Internet.
In un’intervista con Forbes, David Holz, CEO di Midjourney, ha affermato che i modelli dell’azienda sono stati addestrati su “solo un grosso frammento di Internet” e che “non esiste davvero un modo per ottenere cento milioni di immagini e sapere dove si trovano e da dove vengono.”
Artisti, autori e musicisti hanno accusato (metaforicamente e letteralmente, in tribunale) le società di intelligenza artificiale generativa di succhiare il loro lavoro gratuitamente e di trarne profitto, portando a più di una dozzina di cause legali solo nel 2023. Il mese scorso, le principali etichette musicali, tra cui Universal e Sony, hanno citato in giudizio i generatori di musica AI Suno e Udio, startup valutate centinaia di milioni di dollari, per violazione del copyright. Le aziende tecnologiche, ironicamente, hanno difeso le proprie azioni e hanno anche stretto accordi di licenza con fornitori di contenuti, compresi gli editori di notizie.
Alcuni artisti pensavano che Apple avrebbe potuto fare di meglio. “Ecco perché ho voluto concedere loro un leggero beneficio del dubbio”, ha detto Lam. “Pensavo che avrebbero affrontato la conversazione sull’etica in modo diverso.”
Apple Intelligence: dubbi sulla provenienza dei dati per addestrare il modello LLM
Invece, Apple ha rivelato ben poco sulla fonte dei dati di addestramento per Apple Intelligence. In un post pubblicato sul blog di ricerca sul machine learning dell’azienda, l’azienda ha scritto che, proprio come altre società di intelligenza artificiale generativa, raccoglie dati pubblici dal web aperto utilizzando AppleBot, il suo web crawler appositamente creato, qualcosa che hanno detto anche i suoi dirigenti palcoscenico.
Anche il responsabile dell’intelligenza artificiale e del machine learning di Apple, John Giannandrea, avrebbe affermato che “una grande quantità di dati di addestramento è stata effettivamente creata da Apple”, ma non è entrato nei dettagli. E secondo quanto riferito, Apple ha anche firmato accordi con Shutterstock e Photobucket per concedere in licenza le immagini di formazione, ma non ha confermato pubblicamente tali rapporti.
Mentre Apple Intelligence cerca di ottenere complimenti per un approccio apparentemente più incentrato sulla privacy utilizzando l’elaborazione sul dispositivo e il cloud computing su misura, i fondamenti che circondano il suo modello di intelligenza artificiale sembrano poco diversi da quelli della concorrenza.