สถานะ: 🟢 Complete | อัพเดท: 2026-06-27

Embeddings คืออะไร

Embedding คือการแปลง text (หรือ data) เป็น vector ตัวเลขหลายมิติ ที่ความหมายใกล้กัน = vector ใกล้กัน

ตัวอย่างง่ายๆ

“กษัตริย์” - “ชาย” + “หญิง” ≈ “ราชินี” (ในมิติ embedding space)

ใช้ทำอะไร

  • Semantic search: หาเอกสารที่ “ความหมายใกล้เคียง” ไม่ใช่แค่ keyword match
  • Clustering: จัดกลุ่ม documents ที่เกี่ยวข้องกัน
  • RAG: หา chunks ที่เกี่ยวข้องกับ query ดู RAG

Anthropic Embeddings API

response = client.embeddings.create(
    model="voyage-3",  # Anthropic's embedding model
    input=["Hello world"]
)
vector = response.embeddings[0]  # list of floats

Dimension

Embedding vectors มักมี 1024-3072 dimensions — ยิ่งสูง ยิ่งละเอียด แต่ใช้ memory มากกว่า