Soffri di FOMO e hai paura di esserti perso qualcosa durante la pausa natalizia? Ripartiamo dai colossi del mondo tech, anche quest’anno in aperta competizione tra loro. L’obiettivo? Sviluppare e rilasciare – su scala globale – strumenti basati su intelligenza artificiale sempre più potenti e performanti. Il 2024 si è chiuso con una release molto attesa da parte di Google: quella di Gemini 2.0.
Google Gemini 2.0 come funziona
Gemini 2.0 Flash, come viene chiamato per ora il modello, è disponibile nella versione chat per gli utenti a livello globale, versione a cui siamo già abituati con Gemini 1.5, mentre una versione sperimentale multimodale del modello, con funzionalità di text-to-speech e generazione di immagini, è disponibile per gli sviluppatori. “Se Gemini 1.0 riguardava l’organizzazione e la comprensione delle informazioni, Gemini 2.0 ha l’obiettivo di renderle molto più utili”, ha dichiarato il CEO di Google Sundar Pichai.
L’ultimo prodotto AI di Google supera i suoi predecessori in molte aree di richiesta degli utenti, come la generazione di codice e la capacità di fornire risposte corrette sotto l’aspetto logico e fattuale. Accedere alla versione ottimizzata per chat su PC di Gemini Flash 2.0 è piuttosto semplice. Apri dal tuo computer fisso o portatile la home di Gemini (gemini.google.com) e, cliccando sulla scritta Gemini in alto a sinistra, si aprirà un breve menu a tendina che offre tre opzioni. La prima è continuare ad usare (gratuitamente) Gemini 1.5, la seconda è – appunto – provare (sempre gratuitamente) Gemini 2.0 e la terza è effettuare l’upgrade abbonandosi a Gemini Advanced.
Google Gemini 2.0 su smartphone
Se invece hai scaricato sul tuo smartphone l’app ufficiale di Gemini, dovrai avere ancora un po’ di pazienza. Google ha comunque annunciato che Gemini 2.0 sarà presto disponibile anche tramite app su smartphone. L’azienda ha inoltre comunicato che prevede di integrare l’uso di Gemini 2.0 all’interno di altri prodotti Google già a partire dalle prossime settimane. Gemini 2.0 rappresenta l’ultimo sforzo di Google nella corsa sempre più competitiva dell’industria tech in ambito AI.
OpenAI – ad esempio – ha fatto parlare di sé, negli ultimi tempi, per aver rilasciato una versione di ChatGPT Pro il cui abbonamento costa ben 200 dollari al mese. Si tratta del chatbot di punta dell’azienda, pensato per le attività più complesse e le conversazioni più lunghe, ma dal costo non alla portata di tutti. Anche Microsoft continua a rilasciare nuove versioni del suo Copilot. L’ultima è Vision: analizza solo testi e immagini dai siti web visitati attraverso Edge, senza dunque monitorare altri contenuti o utilizzare i dati per l’addestramento dell’AI.
Anche Microsoft prevede di estendere la disponibilità di Vision – per ora limitata agli Stati Uniti – a un maggior numero di utenti Edge nel tempo. Copilot Vision rappresenta un interessante esperimento delle potenzialità dell’intelligenza artificiale nell’interazione con il web. La possibilità di “dialogare” con la propria attività di ricerca e navigazione – per risolvere un problema o semplicemente soddisfare una curiosità – apre scenari innovativi, ma solleva comunque interrogativi sulla privacy e sulla sicurezza dei dati.
Google Gemini 2.0 e gli agenti AI
Si è parlato molto di multimodalità e di “agenti AI” contestualmente al lancio di Gemini 2.0. “Gemini 2.0 è il modello più capace che abbiamo sviluppato fino ad ora – ha evidenziato Sundar Pichai -. I progressi nella multimodalità (cioè nella possibilità di generare in modo nativo immagini e audio) e l’uso (sempre in modalità nativa) di strumenti e applicazioni ci consentiranno di costruire nuovi agenti dotati di intelligenza artificiale che ci avvicineranno sempre più alla nostra idea di assistente universale”.
Gli agenti AI a cui fa riferimento il CEO di Google sono programmi autonomi progettati per svolgere compiti, assumere decisioni e interagire con ambienti diversi con un intervento umano sempre più ridotto. Chi ha provato Gemini 2.0 lo ha trovato subito più veloce ed efficiente, nel semplificare la vita degli utenti, sottolineando la capacità del nuovo modello di comprendere un contesto, anticipare e prendere decisioni, ma ancora sotto la supervisione umana. La multimodalità consente, ad esempio, di mostrare oggetti all’intelligenza artificiale, che può analizzarli e rispondere a domande su di essi, in tempo reale e anche oralmente.
Deep Research
Tra le ultime novità di Google legate all’intelligenza artificiale c’è anche Deep Research, una AI pensata per le ricerche complesse sul web. Dopo l’inserimento di una domanda, l’assistente è in grado di generare un piano di ricerca dettagliato, che può essere in seguito revisionato o approvato, per poi analizzare le informazioni più rilevanti disponibili in rete. Google Gemini, già integrato in Deep Research, raffina continuamente l’analisi, individuando i dati più utili, avviando ricerche mirate e infine generando un report completo e organizzato.
Il tutto corredato da collegamenti alle fonti originali e provvisto di un rapido accesso a elementi di approfondimento. Deep Research si è dimostrato particolarmente utile per specifiche categorie di utenti, come gli imprenditori, per analisi di mercato o pianificazioni strategiche. Il servizio è disponibile a pagamento tramite Gemini Advanced – al momento solo da desktop e in lingua inglese – e verrà gradualmente integrato nelle applicazioni mobili nelle prossime settimane.
L’AI e il mondo della musica
Quelle appena descritte sono novità che riguardano soprattutto gli utenti comuni. Parlando invece di AI di livello pro, applicate in ambiti specifici da addetti ai lavori adeguatamente formati, di recente è stato diffuso un nuovo studio, con dati abbastanza preoccupanti. Le persone che lavorano nell’industria musicale perderanno quasi un quarto del loro reddito a causa dell’intelligenza artificiale entro i prossimi quattro anni, secondo il primo studio economico globale che esamina l’impatto delle tecnologie emergenti sulla creatività umana.
Coloro che lavorano nel settore audiovisivo vedranno anche il loro reddito ridursi di oltre il 20%, poiché il mercato dell’AI generativa crescerà nel settore fino ai 64 miliardi di euro previsti entro il 2028. La Confederazione Internazionale delle Società di Autori e Compositori (CISAC), che rappresenta più di 5 milioni di professionisti in tutto il mondo, ha diffuso i risultati di questo studio a Parigi.
Il rapporto ha concluso che mentre il boom dell’AI arricchirà notevolmente i colossi tech, i diritti e le fonti di reddito di artisti e creator saranno drasticamente ridotti, a meno che non intervengano le autorità pubbliche. I governi australiano e neozelandese sono stati menzionati dal presidente della CISAC, l’ex membro degli ABBA Björn Ulvaeus. Ulvaeus ha evidenziato che i due Paesi stanno guidando il mondo nella definizione di standard e politiche in grado di tutelare artisti e creator da un uso incontrollato dell’AI generativa in campo musicale.