สถานะ: 🟢 Complete | อัพเดท: 2026-06-27

RAG — Retrieval Augmented Generation

ปัญหาที่ RAG แก้

LLM รู้เฉพาะ training data — ไม่รู้เอกสารของบริษัท, ข้อมูลใหม่, หรือ private data

RAG Flow

flowchart LR
    Q["❓ User Query"]
    E["🔍 Embed Query"]
    DB["📚 Vector Database
(เอกสารที่ index ไว้)"]
    R["📄 Relevant Chunks"]
    LLM["🤖 Claude"]
    A["💬 Answer"]

    Q --> E --> DB --> R --> LLM --> A
    Q --> LLM

ขั้นตอน

  1. Index: แปลงเอกสารเป็น embeddings เก็บใน vector DB (เช่น Pinecone, pgvector)
  2. Query: embed คำถาม user
  3. Retrieve: หา top-k chunks ที่ embedding ใกล้เคียงที่สุด
  4. Generate: ส่ง query + chunks เป็น context ให้ Claude ตอบ

เมื่อไหรใช้ RAG

Private documents, knowledge base ขนาดใหญ่ที่ใส่ทั้งหมดใน context ไม่ได้, ข้อมูลที่ update บ่อย

ข้อจำกัด

RAG ดีแค่ไหนขึ้นอยู่กับ retrieval quality — ถ้า chunks ผิด answer ก็ผิด