RAG bazat pe vector retrieval
RAG (Retrival Augmentet Generation) bazat pe vectori
Când oamenii încep să arunce termeni precum „RAG” și „vector retrieval” în AI, majoritatea oamenilor normali simt nevoia imediată să intrebe ce inseamna acesti termeni.
În primul rând, ce este „RAG”?
RAG = Generare Augmentata de Recuperare.
Sună fantezist. Este vorba doar despre a da unui model mare de inteligență artificială (OpenAI, Claude, Llama, Deepseek, etc) o bibliografie (documentatie), înainte de a răspunde la întrebarea ta. Dacă cineva vă întreabă: „Cine a fost al 3-lea președinte al Romaniei?”
- Dacă ești un om obișnuit, s-ar putea să ghicești, sau s-ar putea să te înșeli.
- Dacă faceți RAG, deschideți rapid bilbliografia (recuperare) și apoi spuneți răspunsul corect (generație).
Asta este RAG:
- Preluați informații utile din bibliografie.
- Aplicati inteligenta AI pe aceste informații.
- Generați un răspuns inteligent, pe subiect.
De ce avem nevoie de RAG?
Iată secretul modelelor mari de inteligență artificială (chiar și GPT-4, Claude etc.): de fapt nu „știu” totul. Modelele au o memorie fixă (pe care au fost antrenate). Dacă îi întrebați despre noile politici ale companiei dvs., notele nepublicate sau orice altceva de nișă șau privat, vor spune:
„Îmi pare rău, nu am auzit niciodată de asta, dar iată oricum niște prostii care sună a fi de incredere, dar sunt spuse la întâmplare.”
Remedieri RAG
În cazul RAG, in loc să halucineze, inteligența artificială preia informații reale și externe înainte de a vă răspunde. Gândiți-vă la RAG ca la o inteligență artificială care își pune ochelari de citit și verifică de două ori faptele.
Unde se încadrează Vector retrieval (recuperarea vectorilor)?
Când AI încearcă să „recupereze” informații utile din bibiografie sau documentatia privata, de unde știe ce este relevant?
- Nu este o căutare de cuvinte cheie („găsiți documente cu cuvintele exacte „al 8-lea președinte”).
- Nu este noroc chior
- Este vorba despre recuperarea vectorului.
Ce inseamna embeddings (încorporari) ?
Embeddings = Transformarea lucrurilor în liste de numere care surprind sensul
Ei bine, toate documentele pe care doriți să le căutați sunt încorporate în vectori, mai pe romaneste spus, transformate in numere. Astfel, când pui o întrebare, interogarea ta este transformată într-un vector (numar). Apoi sistemul caută cei mai apropiați vectori- adică cele mai relevante informații, chiar dacă formularea este diferită.
Daca intrebi „Cine a condus Romania după Traian Basescu?
Vector retrieval găsește documente despre „Klaus Johanis” fără a fi nevoie să-l numiți.
Fără cuvinte cheie, fără magie- doar potrivire de numere bazată pe matematică.
Punând totul împreună
Iată fluxul complet al unui sistem RAG folosind recuperarea vectorilor:
- Puneți o întrebare: Care este politica noastră de rambursare pentru clienții internaționali?Sistemul vă transformă întrebarea într-un vector.
- Sistemul caută în baza de date vectorială documente care sunt legate în mod semnificativ.
- Gaseste primele câteva potriviri (recuperare vectori).
- Introduce aceste documente (potriviri) în modelul AI ca si context.
- AI citește informațiile și scrie un răspuns inteligent și personalizat.
- Și astfel apare ca și cum AI „știa” politica companiei tale. Dar nu a fost așa. A folosit recuperarea vectorului + RAG.
Avantajele uriașe ale RAG + Vector Retrieval
Nu este necesară reinstruirea modelelor AI: nu trebuie să antrenati un model AI de fiecare dată când actualizați documentatia. Doar actualizați baza de date de documente. (Mult mai ieftin și mai rapid.)
Informații actualizate: AI poate face referire la documente noi, chiar dacă acestea nu existau atunci când modelul a fost antrenat.
AI mai de încredere: Puteți urmări răspunsurile înapoi la documentele sursă în loc să obțineți halucinatii și presupuneri.
Personalizare: Vrei o inteligență artificială care îți „cunoaște” afacerea de nișă , catalogul de produse, documentele legale sau arhiva? Doar hrănește-l cu documentele potrivite.