Siamo entrati ufficialmente nella seconda metà del 2025 e la sfida tra AI continua, non senza colpi di scena. I due concorrenti principali sono ancora oggi ChatGPT di OpenAI e Google Gemini. Più staccate sono poi Microsoft Copilot, strumento apprezzato dagli utenti delle generazioni più mature (in particolare i Gen X), e le cinesi DeepSeek e Doubao (quest’ultimo tool è stato sviluppato da ByteDance, la parent company di TikTok).

ChatGPT, dagli scontrini falsi alla release di ChatGPT 5
Gli argomenti più caldi, al momento, sono legati – per tutti i competitor in campo – alla generazione di immagini e video sempre più realistici, alle funzionalità di ricerca in sostituzione dei motori tradizionali e alle ambizioni da “super assistant” o “everything app” che possono compiere sempre più azioni al nostro posto: prenotare un biglietto aereo, acquistare un prodotto, ecc. Per l’utente comune spesso il caos regna sovrano: ogni settimana un nuovo aggiornamento, un nuovo annuncio, una nuova hype seguita – dopo pochi giorni – dai dietrofront per i rischi legati alla privacy, alla possibilità di truffe e altro.
Per quanto riguarda ChatGPT, ad esempio, tra fine marzo e inizio aprile non si è parlato d’altro che della possibilità di generare immagini e meme in stile Studio Ghibli, con risultati sicuramente spettacolari, ma con evidenti interrogativi legati al copyright, al diritto d’autore e alla legacy del colosso giapponese d’animazione. Altrettanto divertenti e originali gli “starter pack”, con le action figure che per qualche settimana hanno reso meno noiose le giornate in ufficio di milioni di professionisti. Salvo poi scoprire che la generazione di queste immagini comporta un consumo di dati e di energia davvero impressionante.
E non è tutto. La possibilità di inserire dei testi all’interno delle immagini generate da ChatGPT-4 su istruzioni (i prompt) fornite dall’utente è stata usata per generare ricevute e scontrini falsi, file che possono essere usati per richieste di rimborso spese per acquisti – però – mai effettuati nella realtà. Sì alla libertà creativa, dunque, ma con un occhio anche alla prudenza, soprattutto in vista del rilascio di ChatGPT 5, annunciato da mesi e poi rinviato.
Google Gemini e il clamore per il video generati da VEO 3
Stesse preoccupazioni anche per l’utilizzo di Google Gemini. Va detto che Google Gemini, dopo delle performance iniziali non all’altezza del brand, ha recuperato velocemente terreno nell’ultimo anno. Lo ha fatto con tante novità che hanno travolto gli utenti meno esperti, che hanno visto “spuntare” di punto in bianco i tool AI del colosso di Mountain View in ogni strumento di uso quotidiano: dall’AI Overview nelle ricerche sul web a Gemini in Gmail, che ora può riassumere di default il contenuto delle mail più lunghe e complesse.
Tra le novità più recenti, poi, c’è l’accesso a Google Gemini consentito ora anche agli utenti di età inferiore ai 13 anni, anche se attraverso la supervisione del Google Family Link, quindi con il parental control. Gli utenti più giovani non sono ancora in grado – ad esempio – di riconoscere le cosiddette “allucinazioni” delle AI e rischiano inoltre di essere esposti a contenuti falsi o ingannevoli generati proprio dall’AI. Il tutto, in questo ecosistema, avviene con estrema velocità e senza le necessarie spiegazioni di contesto. Anche con il parental control, quindi, i rischi non mancano.
ChatGPT, Google Gemini & Co.: come riconoscere i video fake
Come già accennato, poi, l’hype legata alle novità più eclatanti travolge tutto e tutti in poche ore, spesso senza dare all’utente comune il tempo di farsi un’idea realistica e di capire esattamente cosa ha davanti. È accaduto, nelle scorse settimane, con il rilascio di VEO 3 “powered by Gemini”, il nuovo strumento Google per la generazione di brevi video tramite prompt. I risultati hanno lasciato a bocca aperta anche gli addetti ai lavori. Il salto di qualità, questa volta, c’è e si vede: dal lip sync alle sembianze fisiche dei protagonisti, al contesto sullo sfondo.
Tra i video che hanno fatto più scalpore, ad esempio, ci sono il filmato in stile “Il vecchio e il mare” di Hemingway e le brevi interviste realizzate per strada. L’effetto distopico è reso ancora più evidente da alcune frasi pronunciate dai finti protagonisti, come “fino a 5 minuti fa io ero solo un prompt nella tua testa” e simili. Se desideri farti un’idea più approfondita, puoi dare un’occhiata ai video che il tech influencer Raffaele Gaito ha dedicato all’argomento (anche con esempi di video VEO 3 in italiano).

Fai attenzione a questi elementi
A questo punto è chiaro che, anche in futuro, release di questo genere saranno immediatamente seguite da una viralità travolgente e annunci roboanti – senza dubbio fondati – sui rischi legati all’uso fraudolento di questi strumenti – ad esempio per la creazione di fake news o per la produzione di contenuti che renderanno la gente sempre più stupida – o alla perdita di posti di lavoro. Va anche detto, però, che anche con VEO 3 è possibile riconoscere – allenando l’occhio – un video generato con l’AI. Il primo suggerimento, almeno agli inizi, è: non limitarti a guardare il video in questione una volta sola.
Osserva ogni dettaglio più volte e in poco tempo realizzerai che questi contenuti sono accomunati da alcune caratteristiche che li rendono non accurati al 100%. Ad esempio, i filmati generati con VEO 3 sono ancora piuttosto lenti. Se i volti e l’aspetto fisico possono trarre in inganno, gesti e movimenti del corpo e mimica facciale dei protagonisti sono ancora piuttosto limitati. In alcuni casi la rigidità del collo, della schiena e del fisico sono evidenti. Osservando bene, dunque, noterai una certa ripetitività e non autenticità rispetto ad un vero essere umano. Anche il contesto sullo sfondo spesso appare sfocato o comunque non realistico al 100%.
Crea il tuo podcast con Google Gemini
Se il rilascio di VEO 3 rappresenta senza dubbio una delle novità più dirompenti, Gemini consente ora anche applicazioni legate a tante attività che svolgiamo ogni giorno in ufficio. Possiamo ad esempio generare immagini da usare come sfondo/background per le nostre video call con Google Meet o generare materiale per un podcast.
In quest’ultimo caso ti sarà sufficiente sfruttare la funzionalità Audio Overview, che converte documenti o slide in conversazioni in stile podcast. Questa funzione, disponibile sia in Gemini standard che in Gemini Advanced, ti consentirà di caricare questi contenuti e di farli discutere da due host AI, che li riassumeranno per te, collegheranno idee e offriranno diverse prospettive.