สถานะ: 🟢 Complete | อัพเดท: 2026-06-27
RAG — Retrieval Augmented Generation
ปัญหาที่ RAG แก้
LLM รู้เฉพาะ training data — ไม่รู้เอกสารของบริษัท, ข้อมูลใหม่, หรือ private data
RAG Flow
flowchart LR Q["❓ User Query"] E["🔍 Embed Query"] DB["📚 Vector Database (เอกสารที่ index ไว้)"] R["📄 Relevant Chunks"] LLM["🤖 Claude"] A["💬 Answer"] Q --> E --> DB --> R --> LLM --> A Q --> LLM
ขั้นตอน
- Index: แปลงเอกสารเป็น embeddings เก็บใน vector DB (เช่น Pinecone, pgvector)
- Query: embed คำถาม user
- Retrieve: หา top-k chunks ที่ embedding ใกล้เคียงที่สุด
- Generate: ส่ง query + chunks เป็น context ให้ Claude ตอบ
เมื่อไหรใช้ RAG
Private documents, knowledge base ขนาดใหญ่ที่ใส่ทั้งหมดใน context ไม่ได้, ข้อมูลที่ update บ่อย
ข้อจำกัด
RAG ดีแค่ไหนขึ้นอยู่กับ retrieval quality — ถ้า chunks ผิด answer ก็ผิด