Google ha annunciato un importante aggiornamento per il suo modello linguistico di grandi dimensioni, Gemini 1.5 Pro. Ora Gemini può ascoltare e comprendere i file audio, come le chiamate di guadagno o l’audio da video, senza la necessità di una trascrizione scritta.
Questo nuovo aggiornamento rende Gemini 1.5 Pro ancora più potente e versatile, consentendo di utilizzarlo per un’ampia gamma di attività, tra cui:
Analisi di registrazioni audio: Gemini può essere utilizzato per estrarre informazioni da registrazioni audio, come riassunti, parole chiave e concetti chiave.
Trascrizione e traduzione: Gemini può trascrivere l’audio in testo e tradurlo da una lingua all’altra.
Creazione di contenuti: Gemini può essere utilizzato per generare testi, come articoli, post sui social media e script.
Oltre all’aggiornamento di Gemini 1.5 Pro, Google ha anche annunciato:
Disponibilità pubblica di Gemini 1.5 Pro: Per la prima volta, Gemini 1.5 Pro sarà disponibile al pubblico attraverso la piattaforma per la creazione di applicazioni AI di Google, Vertex AI.
Nuovi aggiornamenti per Imagen: Imagen 2, il modello di generazione text-to-image di Google, aggiungerà la possibilità di dipingere e outpainting, consentendo agli utenti di aggiungere o rimuovere elementi dalle immagini.
Funzione di filigrana digitale SynthID: SynthID sarà disponibile su tutte le immagini create attraverso i modelli Imagen. SynthID aggiunge un’invisibile filigrana del visualizzatore alle immagini che ne segna la provenienza se vista attraverso uno strumento di rilevamento.
Integrazione con la ricerca Google: Google sta lavorando su un modo per integrare le risposte di Gemini con la ricerca Google, in modo che rispondano con informazioni aggiornate.
Questi aggiornamenti dimostrano l’impegno di Google nello sviluppo di modelli linguistici di grandi dimensioni sempre più potenti e versatili. Gemini e Imagen hanno il potenziale per rivoluzionare il modo in cui lavoriamo, creiamo e interagiamo con il mondo che ci circonda.
#Google #AI #Gemini #Imagen #IntelligenzaArtificiale #ModelliLinguistici #VertixAI #GenerazioneImmagini #Trascrizione #Traduzione #CreazioneContenuti #RicercaGoogle
L’articolo Intelligenza artificiale: Google aggiorna Gemini 1.5 Pro con nuove abilità audio! proviene da CorriereNerd.it.
Aggiungi un commento