Il primo benchmark LLM per applicazioni aziendali nel CRM

Tecnologia Notizia

Il primo benchmark LLM per applicazioni aziendali nel CRM
Intelligenza ArtificialeLLMBenchmark
  • 📰 LaStampa
  • ⏱ Reading Time:
  • 66 sec. here
  • 8 min. at publisher
  • 📊 Quality Score:
  • News: 47%
  • Publisher: 68%

Un nuovo benchmark LLM è stato sviluppato per valutare le prestazioni dei modelli di intelligenza artificiale in un ambiente CRM aziendale.

Qualsiasi strumento di intelligenza artificiale generativa si basa su un Large Language Model, ovvero il cervello che, a partire da una domanda, ha il compito di fornire un output in base a una fonte di dati da cui attingere - la knowledge base - e un algoritmo capace di interpretare la richiesta stessa e di costruirne la risposta più precisa.

Il LLM deve essere affidabile, e per garantirne la sicurezza si effettuano i cosiddetti benchmark: procedure di test che valutano l\u2019accuratezza delle prestazioni. I benchmark sono progettati per valutare rigorosamente i modelli di intelligenza artificiale come, per esempio, GPT-4 e Claude, e determinare quale di questi modelli genera i risultati più accurati rispetto a un determinato compito. Compiti come risolvere un problema di matematica o programmare in Python, per esempio. Ovvero compiti molto specifici risolvibili attraverso un ragionamento lineare, simile a quando si esegue un\u2019operazione matematica. Si comprende come questo tipo di test non sia particolarmente utile agli utenti aziendali, che essenzialmente devono capire se uno strumento di intelligenza artificiale è in grado di supportare il loro lavoro quotidiano nel mondo reale. Salesforce AI Research, in collaborazione con AI Frontier ha sviluppato il primo benchmark LLM pensato appositamente per le applicazioni di Gen AI in un ambiente applicativo CRM, ovvero la piattaforma che si occupa della relazione tra azienda e cliente. Il benchmark rappresenta un primo tentativo di adottare un approccio scientifico alla convalida di modelli di intelligenza artificiale di grandi dimensioni relativamente ad attività aziendali

Abbiamo riassunto questa notizia in modo che tu possa leggerla velocemente. Se sei interessato alla notizia puoi leggere il testo completo qui. Leggi di più:

LaStampa /  🏆 16. in İT

Intelligenza Artificiale LLM Benchmark CRM Applicazioni Aziendali

Italia Ultime Notizie, Italia Notizie

Similar News:Puoi anche leggere notizie simili a questa che abbiamo raccolto da altre fonti di notizie.

Nuovo Benchmark per Valutare LLM nell'Ambito CRMNuovo Benchmark per Valutare LLM nell'Ambito CRMUn nuovo benchmark per modelli di intelligenza artificiale generativa (LLM) è stato sviluppato per valutare le loro prestazioni in un ambiente applicativo CRM, offrendo una misura più realistica della loro capacità di supportare il lavoro quotidiano delle aziende.
Leggi di più »

Ecco Minerva 7B, il nuovo LLM italiano è più potente e basato su fonti aperteEcco Minerva 7B, il nuovo LLM italiano è più potente e basato su fonti apertePresentato alla Sapienza il modello di intelligenza artificiale testuale forte di 7 miliardi di parametri contro i 3 della precedente versione. Addestrato anch…
Leggi di più »

Presentata la Minerva 7B, LLM Italiano Addestrato con 1,5 Trilioni di ParolePresentata la Minerva 7B, LLM Italiano Addestrato con 1,5 Trilioni di ParoleLa Sapienza di Roma ha presentato la versione 7B della famiglia Minerva, un modello linguistico di intelligenza artificiale sviluppato nel progetto FAIR in collaborazione con Cineca. Questo LLM è stato addestrato da zero nella lingua italiana per migliorare la sicurezza dei modelli di linguaggio.
Leggi di più »

Minerva 7B, l’IA generativa italiana è diventata grandeMinerva 7B, l’IA generativa italiana è diventata grandeL’intelligenza artificiale conversazionale basata sul primo LLM nato in seno all’università italiana arriva alla seconda versione, più potente, sicura e efficace nelle risposte (ANSA)
Leggi di più »

Addestrato con 1,5 trilioni di parole, la nuova versione di Minerva alza la sicurezza dei modelli di intelligenza artificialeAddestrato con 1,5 trilioni di parole, la nuova versione di Minerva alza la sicurezza dei modelli di intelligenza artificialePresentata all'Università Sapienza di Roma, la versione 7B della Minerva, sviluppata nel progetto FAIR con Cineca, rafforza lo standard di sicurezza per i modelli linguistici LLM italiani addestrati 'da zero' per la lingua italiana.
Leggi di più »

La Terza Ondata dell'AI Generativa: I Nuovi Agenti AutonomiLa Terza Ondata dell'AI Generativa: I Nuovi Agenti AutonomiL'intelligenza artificiale generativa sta entrando nella sua terza fase, caratterizzata da agenti autonomi sempre più sofisticati. Questi agenti integrano dati aziendali con informazioni in tempo reale, e si dividono in due categorie: Assistenti AI e Agenti AI, entrambi basati su modelli Large Action Models (LAM). I LAM sono la nuova evoluzione dei Large Language Models (LLM), in grado di non solo comprendere il linguaggio, ma anche eseguire attività complesse in autonomia.
Leggi di più »



Render Time: 2025-02-13 15:52:19