DeepSeek
DeepSeek เป็นบริษัท AI สัญชาติจีนที่ก่อตั้งในเดือนกรกฎาคม 2023 โดยมีสำนักงานใหญ่อยู่ที่เมืองหางโจว มณฑลเจ้อเจียง บริษัทนี้เป็นของกองทุนเฮดจ์ฟันด์ High-Flyer และมีเลียง เหวินเฟิง ผู้ร่วมก่อตั้ง High-Flyer เป็น CEO
จุดเด่นของ DeepSeek คือการพัฒนาโมเดลภาษา AI ที่มีประสิทธิภาพใกล้เคียงกับ GPT-4 แต่ใช้ต้นทุนในการฝึกฝนต่ำกว่ามาก โดยใช้เงินเพียง 6 ล้านดอลลาร์ เทียบกับ OpenAI ที่ใช้ 100 ล้านดอลลาร์ และใช้พลังการประมวลผลเพียง 1 ใน 10 ของ LLaMA 3.1 ของ Meta
ความสำเร็จนี้เกิดขึ้นท่ามกลางการคว่ำบาตรชิป Nvidia จากสหรัฐฯ ทำให้บริษัทจีนต้องหาทางเลือกอื่น ซึ่งกลับกลายเป็นการค้นพบวิธีลดต้นทุนและเพิ่มประสิทธิภาพ ส่งผลกระทบต่อตลาดหุ้นสหรัฐฯ โดยเฉพาะ Nvidia ที่มูลค่าตลาดลดลงถึง 600 พันล้านดอลลาร์
อย่างไรก็ตาม โมเดลของ DeepSeek มีการกำกับดูแลเนื้อหาตามกฎหมายท้องถิ่น จำกัดการตอบคำถามเกี่ยวกับเหตุการณ์จัตุรัสเทียนอันเหมิน และสถานะทางการเมืองของไต้หวัน แม้จะมีอคติเอนเอียงไปทางรัฐบาลจีนในประเด็นที่มีข้อถกเถียง แต่ผู้ใช้ที่ดาวน์โหลดโมเดลไปใช้งานเองสามารถลบการเซ็นเซอร์เหล่านี้ออกได้

เกี่ยวกับโมเดล DeekSeek
สรุป:
DeepSeek AI ได้พัฒนาโมเดล AI รุ่นแรกที่ชื่อว่า DeepSeek-R1 ซึ่งมีความสามารถพิเศษในการคิดวิเคราะห์และใช้เหตุผล โดยใช้เทคนิคการเรียนรู้แบบพิเศษที่เรียกว่า "การเรียนรู้แบบเสริมกำลัง" เพื่อพัฒนาความสามารถในการประมวลผลภาษาให้ดียิ่งขึ้น
ในช่วงแรก ทีมได้สร้างรุ่น DeepSeek-R1-Zero ขึ้นมา โดยให้ AI เรียนรู้ด้วยตัวเองผ่านการลองผิดลองถูก โดยไม่มีการกำหนดทิศทางหรือแนวทางที่ชัดเจน
แม้ว่าวิธีนี้จะทำให้ AI มีความสามารถในการคิดวิเคราะห์ที่ดี แต่ก็พบปัญหาว่าการสื่อสารของ AI ยังไม่เป็นธรรมชาติ และบางครั้งก็สับสนในการใช้ภาษา
ด้วยเหตุนี้ ทีมจึงได้พัฒนา DeepSeek-R1 รุ่นใหม่ขึ้นมา โดยปรับปรุงวิธีการสอน AI ให้เป็นระบบมากขึ้น จนทำให้มีประสิทธิภาพใกล้เคียงกับ AI ของ OpenAI ในด้านการใช้เหตุผลและการวิเคราะห์
ที่สำคัญคือทีมวิจัยได้เปิดให้นักพัฒนาทั่วไปสามารถนำโค้ดของทั้ง DeepSeek-R1-Zero และ DeepSeek-R1 ไปใช้และพัฒนาต่อยอดได้ รวมถึงยังมีรุ่นที่ถูกย่อขนาดลงมาจาก Qwen Llama เพื่อให้ง่ายต่อการนำไปใช้งานอีกด้วย
จุดเด่นสำคัญ:
- รุ่นแรก (DeepSeek-R1-Zero) ถูกปล่อยให้เรียนรู้ด้วยตัวเองโดยไม่มีการชี้แนะ ทำให้คิดวิเคราะห์ได้ดี แต่ยังสื่อสารได้ไม่ค่อยเป็นธรรมชาติ
- รุ่นปรับปรุง (DeepSeek-R1) ได้รับการพัฒนาวิธีการสอนใหม่ที่เป็นระบบมากขึ้น เพื่อแก้ไขข้อบกพร่องจากรุ่นแรก
- เมื่อทดสอบความสามารถด้านการคิดวิเคราะห์ พบว่าทำได้ใกล้เคียงกับ AI ชั้นนำอื่นๆ ในปัจจุบัน
- ทีมผู้พัฒนาได้เปิดให้ใช้งานฟรีแบบโอเพ่นซอร์ส เพื่อให้ทุกคนสามารถนำไปพัฒนาต่อยอดได้
คำถามที่ถามบ่อย (FAQs)
คำถามที่ถามบ่อย เกี่ยวกับโมเดลภาษา DeepSeek