OpenAI ha reso disponibile in Italia la Live Vision per ChatGPT, permettendo all'intelligenza artificiale di analizzare e commentare un flusso di immagini in tempo reale. Questa funzionalità, inizialmente riservata agli utenti Plus, amplia le capacità di ChatGPT e rende le conversazioni ancora più coinvolgenti.
Fino a poco tempo fa, la capacità di 'vedere' di ChatGpt in Italia era limitata alle immagini statiche, che gli utenti potevano caricare dal proprio archivio o scattare direttamente con la fotocamera dello smartphone. In questi casi, l’IA era in grado di fornire informazioni, spiegazioni o approfondimenti su ciò che veniva mostrato.
Ora, però, OpenAI ha reso disponibile anche in Italia uno strumento più avanzato: la Live Vision, che permette a ChatGpt di analizzare e commentare un flusso di immagini in tempo reale. Questa funzione, come molte altre introdotte da OpenAI in passato, è inizialmente a disposizione solo degli utenti “Plus” che pagano un abbonamento mensile di circa 24 euro (tasse incluse). Come trasmettere a ChatGpt le immagini in tempo reale Per attivare questa modalità, che risulta particolarmente efficace quando viene utilizzata attraverso la app ufficiale di ChatGpt, basta selezionare l’icona a forma di onda sonora accanto alla barra di testo: si accede così all’Advanced Voice Mode, che consente di conversare con l’intelligenza artificiale usando la voce, con tempi di risposta estremamente ridotti e la possibilità di interrompere l’IA in qualsiasi momento per cambiare argomento. La grande novità sta nella possibilità di selezionare, in basso a sinistra, l’icona della videocamera: in questo modo, tutto ciò che viene ripreso dalla fotocamera dello smartphone è visibile anche dall’intelligenza artificiale. Può essere utilizzata sia la fotocamera sul retro dello smartphone, per riprendere quello che ci circonda, sia quella frontale adibita solitamente ai selfie, per conversare – in un certo senso – faccia a faccia con l’intelligenza artificiale. Di fatto, un’IA fino a ieri “cieca” acquisisce ora la capacità di vedere il mondo reale. Ma è inutile chiederle informazioni sulle persone riprese, o su se stessi: ChatGpt non è un sistema di riconscimento facciale. Per il resto, questa funzione rende le conversazioni ancora più coinvolgenti. L’utente può inquadrare un oggetto, chiedere informazioni e passare rapidamente a un altro elemento – che sia un edificio, un dispositivo elettronico o un luogo – per ricevere spiegazioni immediate su ciò che sta osservando. Durante un test che abbiamo condotto, inquadrando gli adesivi su un computer ChatGpt ha fornito dettagli sul processore installato. Rivolgendo invece la fotocamera all’esterno di un treno, ha riconosciuto il treno Frecciarossa su cui ci trovavamo e ha commentato le condizioni meteo, descrivendole come nuvolose. I limiti dell’IA nella comprensione visiva Nonostante le sue potenzialità, l’IA mostra ancora alcune difficoltà. Se senza il feed video la voce virtuale è solitamente precisa e fluida, con la videocamera attiva diventa meno sicura nelle risposte, impiegando più tempo per elaborarle. Anche la comprensione del mondo reale resta una sfida: inquadrando un treno in movimento nella direzione opposta, ChatGpt ha erroneamente affermato che si trattava di un riflesso sul finestrino, anziché riconoscere il convoglio. Operator di OpenAI: il futuro degli agenti IA La visione artificiale sarà fondamentale per gli agenti IA del futuro, che saranno in grado di eseguire operazioni al posto degli esseri umani, a partire da quelle effettuabili su un computer. OpenAI ha recentemente annunciato Operator, un agente IA capace di svolgere attività in autonomia sul web. Operator combina la visione avanzata di Gpt-4o, uno dei modelli più avanzati rilasciati da OpenAI, con un sofisticato sistema di ragionamento, permettendogli di interpretare screenshot, interagire con pagine web e compiere azioni come digitare, cliccare o scorrere contenuti. Microsoft Copilot: l’IA che vede e spiega in tempo reale Anche Microsoft, sfruttando la tecnologia di OpenAI in cui ha investito finora almeno 13 miliardi di dollari, ha arricchito il suo chatbot Copilot con funzionalità vocali e visive. La modalità Copilot Vision, non ancora disponibile in Italia, consente all’IA di interpretare il contenuto visibile sullo schermo dell’utente e di offrire spiegazioni contestuali in tempo reale. Questa funzione, insomma, è simile a quella appena introdotta in Italia da OpenAI per ChatGpt. Durante la navigazione web, Copilot può analizzare le pagine visitate e fornire riepiloghi o approfondimenti con un linguaggio naturale, rendendo l’esperienza più fluida e interattiva. Google Astra: l’IA multimodale del colosso di Mountain View Anche Google sta lavorando a un proprio agente IA in grado di “vedere” e “ascoltare”: si chiama Astra e ha la capacità di rispondere a domande su immagini riprese in tempo reale. Astra può operare su dispositivi come smartphone o occhiali smart. Il progetto segna anche il ritorno di Google nel settore degli smart glasses, dopo l’abbandono dei Google Glass di qualche anno fa, e mira a offrire un’interazione multimodale sempre più fluida e naturale
Chatgpt Live Vision Openai Intelligenza Artificiale Applicazione Agente IA AI Vision Operator Microsoft Copilot Google Astra
Italia Ultime Notizie, Italia Notizie
Similar News:Puoi anche leggere notizie simili a questa che abbiamo raccolto da altre fonti di notizie.
ChatGPT in Italia ottiene la Live Vision: ecco come funzionaOpenAI introduce la Live Vision per ChatGPT in Italia, permettendo all'intelligenza artificiale di analizzare immagini in tempo reale. Una funzione che arricchisce l'esperienza di conversazione con ChatGPT, aprendo nuove possibilità di interazione e comprensione del mondo reale.
Leggi di più »
ChatGpt 'apre' gli occhi, videocamera live anche in ItaliaA metà dicembre, OpenAi aveva annunciato l'arrivo della funzionalità video per la modalità Vocale Avanzata di ChatGpt. A poco più di due settimane di distanza, la nuova opzione diventa disponibile anche in Italia. (ANSA)
Leggi di più »
ChatGPT Disponibile anche in Italia con Video LiveA partire da metà dicembre, OpenAI ha introdotto la funzionalità video per ChatGPT in modalità Vocale Avanzata. Ora, l'opzione diventa disponibile anche in Italia, permettendo agli utenti con un abbonamento di avviare conversazioni video in tempo reale con l'assistente di intelligenza artificiale. La funzione è accessibile tramite l'icona della videocamera all'interno dell'app e non richiede aggiornamenti.
Leggi di più »
ChatGPT, Videocamera Live di OpenAI è ora disponibile in Italia: come funzionaUna similitudine con gli occhiali Ray-Ban di Meta. La nuova funzione di ChatGPT è finalmente disponibile in Italia per chi possiede un abbonamneto con l'app.
Leggi di più »
ChatGPT Acquisisce Visione in Tempo Reale in ItaliaOpenAI introduce la Live Vision in Italia, consentendo a ChatGPT di analizzare e commentare un flusso di immagini in tempo reale tramite la fotocamera dello smartphone. Questa funzionalità rende le conversazioni con l'intelligenza artificiale ancora più coinvolgenti e interattive.
Leggi di più »
ChatGpt ora può “vedere” anche in Italia: come funziona la nuova frontiera dell’IAL’intelligenza artificiale generativa non si limita più a scrivere testi o codice: ora può analizzare immagini in tempo reale e rispondere con la voce. OpenAI,…
Leggi di più »