ในการพัฒนาครั้งสำคัญของวงการ AI ทาง DeepSeek ได้เปิดตัวโมเดล R1 อย่างเป็นทางการ ซึ่งถือเป็นความสำเร็จที่โดดเด่นในการพัฒนา AI แบบโอเพนซอร์ส การเปิดตัวครั้งนี้แสดงให้เห็นถึงกลยุทธ์ที่ผสมผสานระหว่างความสามารถระดับสูงกับแนวทางแบบโอเพนซอร์ส ซึ่งอาจเปลี่ยนโฉมหน้าการเข้าถึงและการพัฒนาโมเดล AI
วิธีการฝึกฝนที่ปฏิวัติวงการ
DeepSeek R1 นำเสนอวิธีการฝึกฝนแบบใหม่ที่พึ่งพาการเรียนรู้แบบเสริมแรง (RL) เป็นหลัก ซึ่งแตกต่างจากวิธีการปรับแต่งแบบมีผู้สอน (SFT) แบบดั้งเดิม โมเดล R1-Zero แสดงให้เห็นถึงประสิทธิภาพของการฝึกฝนด้วย RL ล้วนๆ โดยสามารถพัฒนาประสิทธิภาพได้อย่างน่าทึ่งโดยไม่ต้องใช้ข้อมูล SFT แบบดั้งเดิม วิธีการนี้ให้ผลลัพธ์ที่ยอดเยี่ยม โดยประสิทธิภาพของโมเดลใน AIME 2024 เพิ่มขึ้นจาก 15.6% เป็น 71.0% ด้วยการฝึกฝนแบบ RL เพียงอย่างเดียว
เกณฑ์มาตรฐานประสิทธิภาพ
โมเดลนี้แสดงความสามารถที่โดดเด่นในหลายด้าน โดยเฉพาะในด้านคณิตศาสตร์ การเขียนโค้ด และการให้เหตุผล DeepSeek R1 ทำคะแนนได้ 79.8% ใน AIME 2024 และได้คะแนนสูงถึง 97.3% ใน MATH-500 ซึ่งเทียบเท่าหรือสูงกว่าประสิทธิภาพของ OpenAI o1 เล็กน้อย ในการแข่งขันเขียนโค้ด โมเดลนี้ได้คะแนน Elo 2029 บน Codeforces ซึ่งดีกว่า 96.3% ของผู้เข้าแข่งขันที่เป็นมนุษย์
ผลการทดสอบเกณฑ์มาตรฐาน:
- AIME 2024: 79.8% (สูงกว่า OpenAI o1)
- MATH-500: 97.3% (เทียบเท่ากับ OpenAI o1)
- Codeforces: คะแนน Elo 2,029 (ดีกว่า 96.3% ของผู้เข้าร่วมที่เป็นมนุษย์)
Jim Fan พูดถึงสภาพการแข่งขันในวงการ AI โดยเน้นย้ำถึงการพัฒนาประสิทธิภาพของ DeepSeek-R1 |
กลยุทธ์ด้านราคาที่แข่งขันได้
DeepSeek กำหนดราคา R1 สำหรับบริการ API ในระดับที่แข่งขันได้สูง อัตราค่าบริการ API อยู่ที่ 0.14 ดอลลาร์สหรัฐต่อหนึ่งล้านโทเค็นสำหรับ cache hits และ 0.55 ดอลลาร์สหรัฐสำหรับ cache misses ในการรับข้อมูล ส่วนการส่งออกข้อมูลราคา 2.19 ดอลลาร์สหรัฐต่อหนึ่งล้านโทเค็น โครงสร้างราคานี้ถือว่าได้เปรียบด้านต้นทุนเมื่อเทียบกับบริการของ OpenAI ทำให้นักพัฒนาและธุรกิจต่างๆ สามารถเข้าถึงความสามารถของ AI ขั้นสูงได้ง่ายขึ้น
การเปรียบเทียบราคา API:
-
DeepSeek R1:
- อินพุต (cache hit): 0.14 ดอลลาร์สหรัฐต่อหนึ่งล้านโทเค็น
- อินพุต (cache miss): 0.55 ดอลลาร์สหรัฐต่อหนึ่งล้านโทเค็น
- เอาต์พุต: 2.19 ดอลลาร์สหรัฐต่อหนึ่งล้านโทเค็น
-
OpenAI o1:
- อินพุต: 15 ดอลลาร์สหรัฐต่อหนึ่งล้านโทเค็น
- เอาต์พุต: 60 ดอลลาร์สหรัฐต่อหนึ่งล้านโทเค็น
ความมุ่งมั่นในการเป็นโอเพนซอร์ส
การเปิดตัวครั้งนี้ไม่เพียงรวมถึงโมเดลเท่านั้น แต่ยังมีเอกสารทางเทคนิคที่ครอบคลุมและโมเดลขนาดเล็กที่ผ่านการกลั่นกรองถึงหกรุ่น ภายใต้ลิขสิทธิ์ MIT ผู้ใช้สามารถใช้งาน ดัดแปลง และใช้เชิงพาณิชย์ได้อย่างอิสระ รวมถึงค่าน้ำหนักและผลลัพธ์ของโมเดล แนวทางนี้แตกต่างอย่างมากจากโมเดล AI เชิงพาณิชย์อื่นๆ ซึ่งส่งเสริมความโปร่งใสและนวัตกรรมแบบร่วมมือในชุมชน AI
การกลั่นกรองและการพัฒนาระบบนิเวศ
DeepSeek ประสบความสำเร็จในการกลั่นกรองความสามารถของ R1 ลงสู่โมเดลขนาดเล็กที่ใช้งานได้จริงมากขึ้น โดยใช้สถาปัตยกรรมยอดนิยมอย่าง Qwen และ Llama เวอร์ชัน 32B และ 70B ที่ผ่านการกลั่นกรองสามารถทำงานได้ในระดับเดียวกับ OpenAI o1-mini แสดงให้เห็นถึงประสิทธิภาพในการถ่ายทอดความรู้จากโมเดลขนาดใหญ่สู่โมเดลขนาดเล็กโดยยังคงมาตรฐานประสิทธิภาพสูง
ผลกระทบในอนาคต
การเปิดตัวครั้งนี้ถือเป็นก้าวสำคัญสู่การทำให้ความสามารถของ AI ขั้นสูงเป็นประชาธิปไตยมากขึ้น ด้วยการผสมผสานประสิทธิภาพระดับแนวหน้ากับการเข้าถึงแบบโอเพนซอร์สและราคาที่แข่งขันได้ DeepSeek R1 อาจเร่งให้เกิดนวัตกรรมในวงการ AI ในขณะที่ทำให้เครื่องมือ AI ที่ทรงพลังเข้าถึงได้ง่ายขึ้นสำหรับนักพัฒนาและองค์กรในวงกว้าง