Meta ha introdotto il suo modello di intelligenza artificiale generativa per il parlato, Voicebox, a metà del 2023 ma ora mira a portare la generazione del suono AI a un livello superiore con Audiobox. Lo strumento innovativo è stato lanciato nei giorni scorsi e genera effetti sonori da istruzioni di testo, elimina il rumore dalle registrazioni vocali, crea una voce ridisegnata, genera parlato nello stile di una clip audio e altro ancora. E più di ogni altra cosa, permette di clonare le voci.
È uno strumento di generazione del suono proveniente dal Facebook AI Research (FAIR). L’ultima offerta di Meta genera audio ed effetti sonori utilizzando input vocali, istruzioni di testo e una combinazione di entrambi.
Con Audiobox, Meta mira ad abbassare la barriera della creazione audio e a rendere più semplice per gli utenti generali la creazione di campioni sonori di alta qualità. Che tu voglia creare audio per un podcast, un video di YouTube, un audiolibro o un videogioco, Audiobox può aiutarti a portare a termine il lavoro.
Purtroppo per il momento il funzionamento è assicurato solamente con frasi brevi (meno di 25 parole) e e nella lingua inglese.
Come utilizzare Meta Audiobox
Tutte le funzionalità di Audiobox possono essere provate dal sito Web ufficiale dell’azienda. Puoi generare campioni audio, controllare le anteprime e scaricarli sul tuo dispositivo.
- Vai sul sito web di Audiobox e passa alla scheda Funzionalità.
- Seleziona un’opzione pertinente sotto il menu Crea audio. Usiamo Voci Restyled.
- Registra la tua voce o scegli una voce campione dal menu a discesa.
- Aggiungi un breve paragrafo in cui vuoi che il modello AI parli. Descrivi lo stile della voce per narrare il testo. Ad esempio, puoi scrivere un breve paragrafo e chiedere ad Audiobox di creare un campione audio con il tono amichevole di una persona di mezza età.
- Seleziona Genera e lascia che il modello AI crei un paio di risultati audio.
- Seleziona il pulsante di riproduzione per controllare i risultati vocali rinnovati e salvarli sul tuo computer.
Puoi anche spostarti nel menu Effetti sonori e descrivere il campione sonoro che desideri creare. Aggiungi abbastanza dettagli per ottenere risultati ancora più accurati da Meta Audiobox. Abbiamo eseguito diversi messaggi di testo e siamo rimasti colpiti dagli effetti sonori generati.
Meta ha fatto un lavoro straordinario con Audiobox. È accurato e molto buono. Provalo con diversi suggerimenti ed esempi vocali e controlla i risultati. Oltre a Facebook, i giganti della tecnologia come Google e Microsoft stanno esplorando l’intelligenza artificiale generativa per creare contenuti.
Il colosso della ricerca ha recentemente lanciato Gemini come LLM e Google Bard come chatbot per affrontare ChatGPT di Open AI (e Microsoft). Leggi il nostro post dedicato per saperne di più su Google Bard.