Skip to content
Effettua una ricerca per conoscere i prodotti e le soluzioni di InterSystems, le opportunità di carriera e altro ancora.
Abstract data representation

Retrieval Augmented Generation (RAG): cos'è e come previene gli errori dell'IA

Scoprite come la Retrieval Augmented Generation (RAG) migliora l'accuratezza dell'IA combinando i modelli linguistici con il recupero dei dati in tempo reale, rivoluzionando i chatbot e i motori di ricerca.

La Retrieval Augmented Generation (RAG) è una tecnica di IA che migliora i modelli linguistici di grandi dimensioni (LLM) combinando la loro conoscenza intrinseca con il recupero di informazioni in tempo reale da database esterni.

Questo approccio consente ai modelli generativi di IA di generare risposte più accurate, aggiornate e contestualmente rilevanti, basando i loro risultati su dati attuali e verificabili.

Poiché l'IA continua a integrarsi in vari aspetti della nostra vita, dal processo decisionale aziendale agli assistenti personali, la necessità di informazioni aggiornate e accurate diventa sempre più critica. RAG risponde a questa esigenza colmando il divario tra la vasta conoscenza dei modelli linguistici e le informazioni fattuali in tempo reale.

Abstract image of binary data emitted from AGI brain.

Conclusioni principali

  • RAG migliora i modelli di intelligenza artificiale generativa combinando la generazione del linguaggio con il recupero delle informazioni in tempo reale, riducendo in modo significativo gli errori e le allucinazioni.
  • Questa tecnica consente ai sistemi di IA di fornire informazioni aggiornate e verificabili, fondamentali per mantenere la fiducia nel processo decisionale guidato dall'IA.
  • L'implementazione di RAG migliora le prestazioni dell'IA in diverse applicazioni, dai chatbot ai motori di ricerca, dai sistemi di risposta alle domande alla sintesi del testo.

Capire i RAG

Basando le risposte dell'intelligenza artificiale su fonti di dati esterne, RAG affronta i limiti principali dei modelli linguistici tradizionali, come le informazioni obsolete e le allucinazioni. Immaginate RAG come un assistente di ricerca altamente efficiente. Quando gli viene posta una domanda, non si limita a fare affidamento sulla sua memoria (come i modelli di intelligenza artificiale tradizionali), ma cerca attivamente in una vasta libreria di informazioni aggiornate per fornire la risposta più accurata e pertinente possibile. Questo approccio consente ai sistemi di intelligenza artificiale di rimanere aggiornati sulle informazioni in rapida evoluzione e di fornire risposte più adeguate al contesto.

Engineer designing AI technology with reflection on eyeglasses

L'importanza dei RAG: una storia cautelativa

Immaginate un dirigente impegnato a prepararsi per un incontro cruciale con un potenziale investitore. A corto di tempo, si rivolgono a un assistente AI per raccogliere informazioni dell'ultimo minuto sul loro settore. Chiedono: "Qual è stato il tasso di crescita del settore delle energie rinnovabili lo scorso anno?". L'AI risponde con sicurezza: "Il settore delle energie rinnovabili ha registrato un robusto tasso di crescita del 15,7% lo scorso anno, superando di gran lunga le fonti energetiche tradizionali". Colpito da questo dato specifico, il dirigente lo include nella sua presentazione. Tuttavia, durante l'incontro, il potenziale investitore mette in dubbio la cifra, affermando che le sue fonti indicano un tasso di crescita solo dell'8,3%.

Questo scenario illustra un problema comune ai LLM tradizionali: le allucinazioni di . I LLM possono talvolta generare informazioni plausibili ma non corrette, soprattutto quando si tratta di dati specifici, recenti o in rapida evoluzione.

È qui che la RAG diventa fondamentale. Se l'assistente AI avesse utilizzato RAG:

  • Avrebbe cercato in un database continuamente aggiornato le informazioni più recenti e accurate sui tassi di crescita delle energie rinnovabili.
  • Se la cifra esatta non era disponibile, avrebbe potuto fornire un intervallo basato su più fonti affidabili o dichiarare esplicitamente di non avere dati aggiornati.
  • La risposta avrebbe potuto includere la fonte delle informazioni e la data dell'ultimo aggiornamento.

Questo esempio sottolinea il motivo per cui gli RAG sono così importanti:

  1. Previene la disinformazione: basando le risposte su fatti recuperabili, il RAG riduce significativamente il rischio di allucinazioni dell'IA
  2. Mantiene la fiducia: gli utenti possono fare affidamento sull'intelligenza artificiale potenziata da RAG per ottenere informazioni aggiornate e precise, fondamentali per le decisioni aziendali.
  3. Fornisce trasparenza: RAG permette all'IA di citare le fonti, consentendo agli utenti di verificare le informazioni in modo indipendente.

Con l'integrazione dell'IA nel nostro lavoro quotidiano e nei processi decisionali, la capacità di fornire informazioni accurate, aggiornate e verificabili diventa non solo utile, ma essenziale. Il RAG è una tecnologia chiave per raggiungere questo obiettivo, colmando il divario tra le vaste conoscenze dei LLM e la necessità di informazioni affidabili e in tempo reale.

Female and make programmers training for coding, cyber security or software on computer.

Componenti chiave del RAG

I sistemi RAG si basano su diversi elementi essenziali che lavorano insieme per fornire funzionalità AI avanzate:

Modelli linguistici

I modelli linguistici di grandi dimensioni come GPT-3, GPT-4 e BERT costituiscono il nucleo dei sistemi RAG. Questi sofisticati modelli di intelligenza artificiale vengono addestrati su grandi quantità di dati testuali, consentendo loro di comprendere e generare risposte simili a quelle umane.

Nei quadri RAG, sono responsabili di:

  1. Comprendere le richieste degli utenti
  2. Sintetizzare le informazioni dai dati recuperati
  3. Generare risposte coerenti e adeguate al contesto

Basi di dati e sistemi di recupero delle informazioni

Le basi di conoscenza esterne memorizzano informazioni strutturate e non strutturate che possono essere consultate e recuperate rapidamente. Questi database sono fondamentali per fornire informazioni aggiornate e specifiche che potrebbero non essere presenti nei dati di addestramento del modello linguistico.

Gli aspetti principali includono:

  1. Archiviazione efficiente di grandi volumi di dati
  2. Sistemi di elaborazione e recupero rapido delle interrogazioni
  3. Supporto per vari tipi di dati (testo, immagini, metadati)

I sistemi di recupero delle informazioni svolgono un ruolo fondamentale nell'identificare ed estrarre i dati rilevanti da questi database. I metodi di recupero più comuni includono:

  1. Ricerca per parole chiave
  2. Ricerca vettoriale
  3. Ricerca semantica
  4. Algoritmo BM25 per la classificazione dei documenti rilevanti

Rappresentazione vettoriale e indicizzazione

la "vettorializzazione" dei dati è fondamentale per i moderni sistemi RAG. Si tratta di convertire i dati di testo in vettori numerici, consentendo una ricerca vettoriale e un confronto efficiente delle somiglianze. Le caratteristiche principali includono:

  1. Generazione di incorporazioni utilizzando modelli pre-addestrati
  2. Tecniche di riduzione della dimensionalità per una rappresentazione compatta
  3. Misure di somiglianza come la somiglianza del coseno per confrontare i vettori

Un database vettoriale è un sistema specializzato progettato per memorizzare e interrogare queste rappresentazioni vettoriali in modo efficiente. Offrono:

  1. Funzionalità di ricerca rapida dei vicini
  2. Scalabilità per la gestione di grandi insiemi di dati
  3. Supporto per operazioni di query complesse

Le tecniche di indicizzazione, come gli algoritmi di prossimità approssimativa (ANN), possono migliorare ulteriormente la velocità e l'efficienza di recupero nei sistemi RAG.

Emerging Digital Structure - Growing Connection Lines Symbolizing Innovative Artificial Intelligence Or Big Data Models - Technology Background

Come funziona il RAG

Il processo RAG prevede diverse fasi sofisticate per recuperare i dati e generare risposte accurate e pertinenti al contesto:

Fase 1: il processo di recupero

Quando gli viene posta una domanda o una richiesta, il sistema cerca in una base di conoscenza esterna per trovare le informazioni pertinenti. Questa base di conoscenza può essere una raccolta di documenti, un database o un'altra fonte di dati strutturati.

RAG utilizza algoritmi di recupero avanzati per identificare le informazioni più pertinenti. Questi algoritmi possono utilizzare tecniche come la ricerca semantica o il recupero vettoriale denso. L'obiettivo è trovare dati contestualmente rilevanti che possano migliorare la risposta del modello linguistico.

Fase 2: Architettura RAG e formazione del modello

Un'architettura funzionale RAG combina un componente encoder , un componente retriever e un componente generatore. Ecco come funzionano insieme:

  1. Encoder: converte le query in ingresso in rappresentazioni vettoriali
  2. Retriever: ricerca nella base di conoscenza utilizzando la query codificata
  3. Generatore: crea la risposta finale utilizzando le informazioni recuperate

Durante l'addestramento, i modelli RAG imparano a bilanciare le informazioni provenienti dalla loro conoscenza interna (pre-addestramento) con i dati esterni recuperati. Questo processo migliora la capacità del modello di generare risposte accurate e contestualmente rilevanti.

RAG vs Fine-tuning vs Prompt Engineering: Everything You Need to Know


Find Out More

Dopo il reperimento iniziale, i sistemi RAG spesso impiegano un re-ranking per affinare ulteriormente la rilevanza delle informazioni recuperate. Questa fase aiuta a dare priorità ai dati più preziosi per il processo di generazione finale. La riclassificazione può essere utilizzata:

  1. Punteggi di rilevanza
  2. Misure di similarità semantica
  3. Euristica specifica del contesto

I meccanismi di attenzione svolgono un ruolo cruciale nella RAG, decidendo quali parti dell'informazione recuperata sono più importanti per generare la risposta. Questi sistemi consentono al modello di concentrarsi su parti specifiche dei dati recuperati quando elabora il suo output.

L'attenzione in RAG aiuta il modello:

  1. Soppesare l'importanza dei diversi passaggi recuperati
  2. Integrare le conoscenze esterne con quelle interne
  3. Generare risposte più coerenti e adeguate al contesto

Combinando queste fasi, i sistemi RAG possono produrre risultati di qualità superiore, corretti dal punto di vista dei fatti e pertinenti al contesto.

Applicazioni di RAG

RAG potenzia i sistemi di intelligenza artificiale in vari ambiti, migliorando l'accuratezza e la rilevanza delle attività di elaborazione e generazione delle informazioni:

Chatbot e IA conversazionale

RAG migliora significativamente i chatbot e l'IA conversazionale, fornendo risposte più accurate e contestualmente rilevanti. Questi sistemi possono accedere a basi di conoscenza esterne per integrare le conoscenze acquisite, consentendo loro di gestire efficacemente una gamma più ampia di domande degli utenti.

I chatbot alimentati da RAG possono:

  1. Fornire informazioni aggiornate
  2. Offrire spiegazioni dettagliate
  3. Mantenere la coerenza tra le conversazioni

Questa tecnologia è particolarmente preziosa nel servizio clienti, dove i chatbot possono recuperare rapidamente dettagli specifici sui prodotti o le fasi di risoluzione dei problemi. Inoltre, consente dialoghi più naturali e informativi negli assistenti virtuali, rendendoli più utili e coinvolgenti per gli utenti.

I principali fornitori di IA come Anthropic, Google e OpenAI hanno sviluppato modelli per la creazione di chatbot RAG. Questi modelli consentono agli sviluppatori di creare chatbot che combinano funzionalità avanzate del motore di ricerca con modelli generativi, facilitando lo sviluppo di applicazioni in grado di gestire query complesse e fornire risposte intelligenti senza richiedere un'ampia formazione del modello personalizzato.

Chatbots and Conversational AI

Combinando la potenza dell'IA generativa con il recupero delle informazioni, i motori di ricerca possono fornire risultati più accurati e contestualmente rilevanti. I vantaggi principali includono:

  1. Migliore comprensione dell'intento dell'utente
  2. Miglioramento del posizionamento dei risultati di ricerca
  3. Generazione di riassunti concisi per gli snippet di ricerca

RAG consente ai motori di ricerca di andare oltre la corrispondenza delle parole chiave, interpretando il significato semantico delle query. Questo porta a esperienze di ricerca più intuitive, in cui gli utenti possono trovare informazioni rilevanti anche quando i loro termini di ricerca non corrispondono esattamente al contenuto che stanno cercando.

Sistemi di risposta alle domande

Il RAG può essere utilizzato per costruire strumenti interni che rispondono a domande, anche complesse, normalmente poste da un umano. I vantaggi del RAG nella risposta alle domande includono:

  1. Accesso a informazioni aggiornate
  2. Capacità di citare le fonti
  3. Gestione di domande complesse e multiparte

I sistemi alimentati da RAG rispondono alle domande in modo impressionante in campi come la diagnosi medica, l'assistenza, la ricerca legale e le piattaforme educative. Sono in grado di recuperare rapidamente fatti rilevanti da vasti database e di generare risposte coerenti, informative e adatte alla domanda specifica dell'utente.

Question-Answering Systems

Generative AI in Healthcare
Explore how generative AI in healthcare is revolutionizing patient care,
diagnosis, and drug discovery. Learn about its applications, benefits, and ethical considerations.

Gli strumenti di sintesi basati sulle RAG sono particolarmente utili in campi come il giornalismo, la ricerca accademica e la business intelligence.

Mentre molti LLM come GPT-4 sono in grado di riassumere un insieme di testi, gli strumenti privi di funzionalità RAG faticano a contestualizzare quel testo all'interno di una base di conoscenza più ampia o di un campo con dati profondi e specifici per il dominio.

Immaginate un giornalista che lavora a una notizia dell'ultima ora su una nuova scoperta medica nel trattamento del cancro.

Deve riassumere rapidamente un denso documento di ricerca di 50 pagine e contestualizzarlo all'interno del campo più ampio dell'oncologia. Ecco come uno strumento di sintesi alimentato da RAG potrebbe aiutare:

  1. Il giornalista inserisce il documento di ricerca nello strumento di riassunto potenziato RAG.
  2. Lo strumento elabora il documento e genera una query o una serie di query in base al suo contenuto.
  3. Utilizzando la ricerca vettoriale, il sistema interroga il proprio database per trovare le informazioni pertinenti:
    • Riviste mediche aggiornate
    • Articoli precedenti
    • Pareri di esperti sui trattamenti antitumorali
    • Informazioni sulle pietre miliari della ricerca sul cancro
    • Statistiche sugli attuali tassi di efficacia dei trattamenti antitumorali
  4. Il sistema RAG recupera e classifica le informazioni esterne più rilevanti.
  5. Lo strumento genera quindi un sommario che incorpora sia il documento originale sia le informazioni esterne recuperate:
    • Crea un riassunto di base dei punti chiave dell'articolo
    • Integra le informazioni di base sulle precedenti pietre miliari della ricerca sul cancro
    • Spiega la complessa terminologia medica, rendendola accessibile a un pubblico generico
    • Include il confronto con gli attuali tassi di efficacia dei trattamenti antitumorali
    • Incorpora pareri di esperti sull'impatto potenziale del nuovo trattamento

Il risultato finale è un rapporto completo e contestualizzato che:

  • Spiega la scoperta in termini profani
  • Confronto con i trattamenti esistenti
  • Fornisce pareri di esperti sul suo potenziale impatto
  • Colloca la scoperta all'interno del più ampio panorama della ricerca sul cancro

Questa sintesi potenziata da RAG consente al giornalista di comprendere e comunicare rapidamente il significato della ricerca, anche senza una profonda esperienza in oncologia. Risparmia tempo, migliora l'accuratezza e fornisce una base più ricca e informativa per i loro articoli.

Sfruttando sia il contenuto dell'articolo originale che le fonti esterne pertinenti, lo strumento RAG produce un riassunto più valido e approfondito di quello che si potrebbe ottenere con le sole tecniche di riassunto tradizionali.

RAG and Text Summarization: a Real-World Example

Digital transformation concept. System engineering. Binary code. Programming.

L'implementazione di sistemi RAG può comportare costi computazionali e finanziari significativi, soprattutto quando si tratta di recuperare ed elaborare dati su larga scala. Ecco altri potenziali ostacoli all'implementazione della tecnologia RAG:

Gestire l'ambiguità e le allucinazioni

Anche con le protezioni RAG in atto, i sistemi di IA generativa possono ancora avere problemi con le query ambigue o le informazioni contrastanti nei dati recuperati. Questo può portare ad allucinazioni, cioè a risultati che sembrano plausibili ma che sono di fatto errati o insensati.

Per attenuare questo problema, è necessario implementare solidi meccanismi di fact-checking, utilizzare più fonti di dati per la verifica incrociata e impiegare un punteggio di fiducia per i contenuti generati.

Mantenere l'affidabilità e la fiducia degli utenti

Costruire e mantenere la fiducia degli utenti è fondamentale per l'adozione dei RAG. Risposte incoerenti o non corrette possono erodere rapidamente la fiducia nel sistema. Tra le strategie principali vi è quella di informare gli utenti sui limiti del sistema, di fornire citazioni o fonti per le informazioni e di consentire agli utenti di fornire un feedback sulle risposte.

Considerazioni sulla sicurezza e sulla privacy dei dati

I sistemi RAG spesso accedono a grandi database, sollevando preoccupazioni sulla sicurezza e sulla privacy dei dati. Proteggere le informazioni sensibili mantenendo la funzionalità del sistema è un equilibrio delicato.

Tra le misure di salvaguardia importanti vi sono i controlli rigorosi dell'accesso e la crittografia dei dati memorizzati, l'anonimizzazione delle informazioni personali nei dati di formazione e i regolari controlli di sicurezza e test di penetrazione.

Security and Data Privacy Considerations

Global network security technology, business people protect personal information. Encryption with a padlock icon on the virtual interface.

L'implementazione degli RAG richiede solide basi tecniche:

Requisiti hardware e software

I sistemi RAG richiedono notevoli risorse computazionali. Processori ad alte prestazioni e ampia memoria sono essenziali per gestire contemporaneamente modelli linguistici e operazioni di recupero di grandi dimensioni. L'accelerazione della GPU si rivela spesso fondamentale per un'inferenza efficiente del modello.

Dal punto di vista del software, framework specializzati facilitano l'implementazione di RAG. Le scelte più popolari includono Hugging Face Transformers e LangChain.

Scalare con i servizi cloud e le API

Le API svolgono un ruolo cruciale nei sistemi RAG, consentendo una perfetta integrazione dei vari componenti. Permettono di accedere a modelli linguistici pre-addestrati open-source, archivi di documenti e database vettoriali.

Strumenti open-source popolari come Apache Kafka per lo streaming dei dati, Elasticsearch per l'archiviazione e la ricerca di documenti e FAISS (Facebook AI Similarity Search) per la ricerca efficiente di somiglianze in vettori densi possono essere integrati tramite API per costruire robusti sistemi RAG.

Pensieri finali

La Retrieval Augmented Generation (RAG) è un grande miglioramento della tecnologia AI. Risolve i principali problemi dei tradizionali modelli linguistici di grandi dimensioni utilizzando la ricerca vettoriale e l'IA generativa.

Questo approccio consente applicazioni alimentate dall'IA più accurate, contestualmente rilevanti e aggiornate in diversi settori.

Piattaforme come InterSystems IRIS® facilitano l'implementazione del RAG offrendo funzionalità vettoriali integrate, elaborazione ad alte prestazioni e integrazione flessibile dell'IA all'interno di un ambiente sicuro e pronto per l'impresa.

Grazie alla capacità di gestire dati strutturati e non strutturati in un sistema unificato, InterSystems IRIS semplifica l'architettura necessaria per il RAG, fornendo al contempo solidi strumenti per l'orchestrazione e l'auditing dell'IA.

Con l'evoluzione dell'IA, il RAG continuerà a essere una tecnologia fondamentale per la creazione di sistemi più affidabili, efficienti e intelligenti. Siamo proprio sulla cresta dell'onda di incredibili innovazioni in campi che vanno dai chatbot avanzati e dai motori di ricerca semantici ai complessi strumenti di analisi dei dati.

Utilizzando RAG e piattaforme come InterSystems IRIS, le organizzazioni possono costruire soluzioni di IA che non sono solo più potenti e precise, ma anche più affidabili e adattabili alle esigenze del mondo reale.

Domande frequenti sui RAG

La RAG (Retrieval-augmented generation) migliora i modelli linguistici dell'intelligenza artificiale incorporando fonti di conoscenza esterne. Questo approccio innovativo migliora l'accuratezza, riduce le allucinazioni ed espande le capacità del modello in diverse applicazioni.

Frequently Asked Questions About RAG

Contenuto correlato

29 mar 2024
Realizzate applicazioni di intelligenza artificiale generativa con funzionalità di ricerca vettoriale integrate su InterSystems IRIS. Ricerca di dati strutturati e non strutturati, aggiunta di semantica e superamento dei limiti degli LLM.
19 feb 2025
Fundamentals
InterSystems IRIS Data Platform 2024.1 introduce Vector Search, una nuova e potente funzione che consente di aggiungere facilmente funzionalità di ricerca semantica e di IA generativa alle vostre applicazioni.

Fare il passo successivo

Usa il modulo qui sotto per contattarci. Compila questo modulo per richiedere informazioni.
*Campi richiesti
Highlighted fields are required
*Campi richiesti
Highlighted fields are required

Inviando a InterSystems i dati di contatto della vostra azienda attraverso questo modulo, riconoscete e accettate che InterSystems possa elaborare tali informazioni, allo scopo di soddisfare la vostra richiesta, attraverso un sistema ospitato negli Stati Uniti, ma mantenuto in conformità con le leggi vigenti sulla protezione dei dati.



** Selezionando sì, si acconsente ad essere contattati per notizie, aggiornamenti e altre finalità di marketing relative a prodotti ed eventi attuali e futuri di InterSystems. Inoltre, l'utente acconsente a che le informazioni di contatto della sua azienda siano inserite nella nostra soluzione CRM ospitata negli Stati Uniti, ma mantenute in linea con le leggi applicabili sulla protezione dei dati.