สถานะ: 🟢 Complete | อัพเดท: 2026-06-27
LLM คืออะไร ทำงานยังไง
LLM (Large Language Model) คือ neural network ที่ trained บน text จำนวนมหาศาลเพื่อ predict token ถัดไป
Pipeline
sequenceDiagram participant U as User Input participant T as Tokenizer participant M as Transformer Model participant D as Decoder participant O as Output U->>T: "สวัสดี Claude" T->>M: [token IDs: 1234, 567, 89] M->>M: attention layers (x96 สำหรับ large model) M->>D: probability distribution D->>O: sample next token O-->>M: feed back (autoregressive)
Transformer Architecture
Core ของ LLM คือ Transformer — ใช้ attention mechanism ให้ model “สนใจ” ส่วนของ input ที่เกี่ยวข้อง
Training
Pre-training: predict next token บน internet text หลาย trillion tokens Fine-tuning (RLHF): ปรับพฤติกรรมให้ helpful, harmless, honest ด้วย human feedback
ทำไม LLM “Hallucinate”
Model optimize ให้ text ฟังดูน่าเชื่อถือ ไม่ใช่ถูกต้อง — บางครั้ง generate text ที่ “สมเหตุสมผล” แต่ผิดข้อเท็จจริง