Llama: โมเดลภาษาขนาดใหญ่จาก Meta
Llama (Large Language Model Meta AI)
คือโมเดลภาษาขนาดใหญ่ที่พัฒนาโดยบริษัท Meta
(เดิมคือ Facebook) ซึ่งเป็นคู่แข่งสำคัญของโมเดลอย่าง GPT จาก OpenAI
ทดลองใช้งาน Llama ได้ฟรีที่นี่

ประวัติความเป็นมา
- Llama 1: เปิดตัวเมื่อ 24 กุมภาพันธ์ 2023 เป็นโมเดลพื้นฐานที่มีขนาดตั้งแต่ 7 ถึง 65 พันล้านพารามิเตอร์
- Llama 2: เปิดตัวเมื่อ 18 กรกฎาคม 2023 เป็นโมเดลแบบโอเพนซอร์สที่สามารถใช้งานได้ทั้งในเชิงวิจัยและเชิงพาณิชย์ มีขนาด 7, 13 และ 70 พันล้านพารามิเตอร์
- Llama 3: เปิดตัวเมื่อ 18 เมษายน 2024 มีขนาด 8 และ 70 พันล้านพารามิเตอร์
- Llama 3.1: เปิดตัวเมื่อ 23 กรกฎาคม 2024 เพิ่มโมเดลขนาด 405 พันล้านพารามิเตอร์
ลักษณะเด่นของ Llama
สรุป:
- เป็นโมเดลแบบเปิด (Open Model):
- แตกต่างจากโมเดลปิดอย่าง GPT-4 เพราะ Meta เผยแพร่รายละเอียดการทำงานและเปิดให้นักวิจัยสามารถเข้าถึงได้ภายใต้เงื่อนไขที่กำหนด ช่วยให้นักพัฒนาสามารถเข้าถึง ปรับแต่ง และนำไปใช้งานได้อย่างอิสระ
- ประสิทธิภาพสูงแม้ขนาดเล็กกว่า:
- Llama ถูกออกแบบให้มีประสิทธิภาพสูงแม้ใช้ทรัพยากรคอมพิวเตอร์น้อยกว่าคู่แข่ง ทำให้สามารถนำไปใช้งานได้หลากหลายกว่า เช่น Llama-13B ทำงานได้ดีกว่า GPT-3 (175B) ในหลายการทดสอบ
- พัฒนาอย่างต่อเนื่อง:
- ปัจจุบันมีหลายเวอร์ชัน โดยล่าสุดคือ Llama 3 ที่ได้รับการปรับปรุงความสามารถหลายด้าน
- ฐานของโมเดลอื่นๆ:
- Llama กลายเป็นฐานสำหรับโมเดลภาษาอื่นๆ มากมาย โดยนักพัฒนาสามารถนำไปพัฒนาต่อเพื่อสร้างโมเดลเฉพาะทางได้
Llama เป็นตัวอย่างสำคัญของการพัฒนา AI แบบเปิดที่ช่วยกระจายการเข้าถึงเทคโนโลยี AI ให้กว้างขวางขึ้น และกระตุ้นให้เกิดนวัตกรรมจากชุมชนนักพัฒนาทั่วโลก
คำถามที่ถามบ่อย (FAQs)
คำถามที่ถามบ่อย เกี่ยวกับโมเดลภาษา Llama