สถานะ: 🟢 Complete | อัพเดท: 2026-06-27

LLM คืออะไร ทำงานยังไง

LLM (Large Language Model) คือ neural network ที่ trained บน text จำนวนมหาศาลเพื่อ predict token ถัดไป

Pipeline

sequenceDiagram
    participant U as User Input
    participant T as Tokenizer
    participant M as Transformer Model
    participant D as Decoder
    participant O as Output

    U->>T: "สวัสดี Claude"
    T->>M: [token IDs: 1234, 567, 89]
    M->>M: attention layers (x96 สำหรับ large model)
    M->>D: probability distribution
    D->>O: sample next token
    O-->>M: feed back (autoregressive)

Transformer Architecture

Core ของ LLM คือ Transformer — ใช้ attention mechanism ให้ model “สนใจ” ส่วนของ input ที่เกี่ยวข้อง

Training

Pre-training: predict next token บน internet text หลาย trillion tokens Fine-tuning (RLHF): ปรับพฤติกรรมให้ helpful, harmless, honest ด้วย human feedback

ทำไม LLM “Hallucinate”

Model optimize ให้ text ฟังดูน่าเชื่อถือ ไม่ใช่ถูกต้อง — บางครั้ง generate text ที่ “สมเหตุสมผล” แต่ผิดข้อเท็จจริง