โมเดล R1 ของ DeepSeek สร้างความปั่นป่วนในวงการ AI ด้วยนวัตกรรมต้นทุนต่ำ จุดประเด็นถกเถียงในวงการเทคโนโลยีระดับโลก

BigGo Editorial Team
โมเดล R1 ของ DeepSeek สร้างความปั่นป่วนในวงการ AI ด้วยนวัตกรรมต้นทุนต่ำ จุดประเด็นถกเถียงในวงการเทคโนโลยีระดับโลก

ในจุดเปลี่ยนที่น่าทึ่งซึ่งได้ดึงดูดความสนใจจากวงการเทคโนโลยีทั่วโลก บริษัท AI จากจีนอย่าง DeepSeek ได้ก้าวขึ้นมาเป็นผู้สร้างความเปลี่ยนแปลงครั้งสำคัญในวงการปัญญาประดิษฐ์ โมเดลล่าสุดของบริษัทอย่าง R1 ไม่เพียงแต่มีประสิทธิภาพทัดเทียมกับบริษัทยักษ์ใหญ่ในอุตสาหกรรม แต่ยังทำได้ด้วยต้นทุนที่ต่ำกว่ามาก ท้าทายความเชื่อเดิมๆ เกี่ยวกับความต้องการในการพัฒนา AI

ความสำเร็จที่น่าทึ่ง

โมเดล R1 ของ DeepSeek ประสบความสำเร็จอย่างโดดเด่นในการทดสอบมาตรฐานระดับมืออาชีพ โดยได้อันดับที่สามในบรรดาโมเดลภาษาขนาดใหญ่ทั้งหมดในระดับโลก ในการจัดอันดับ Arena โมเดล R1 ได้คะแนน 1357 คะแนน เหนือกว่าโมเดล o1 ของ OpenAI ที่ได้ 1352 คะแนนเล็กน้อย ที่สำคัญคือสามารถทำได้โดยมีประสิทธิภาพเทียบเท่ากับ o1 ในด้านการควบคุมรูปแบบ แสดงให้เห็นว่าการพัฒนา AI ระดับสูงไม่ได้จำกัดอยู่แค่บริษัทยักษ์ใหญ่ที่มีทรัพยากรมหาศาลอีกต่อไป

ตัวชี้วัด DeepSeek R1 OpenAI o1
คะแนน Arena 1357 1352
ต้นทุนการพัฒนา ประมาณ 5.5 ล้านดอลลาร์สหรัฐ หลายร้อยล้านดอลลาร์
การใช้งาน GPU 2000 การ์ด มากกว่าอย่างมีนัยสำคัญ
การจัดอันดับระดับโลก อันดับ 3 ในทุกหมวดหมู่ -
การควบคุมรูปแบบ ร่วมอันดับ 1 ร่วมอันดับ 1
แบบจำลอง R1 ของ DeepSeek ได้รับการจัดอันดับเป็นอันดับที่สามในกลุ่มแบบจำลองภาษาขนาดใหญ่ แสดงให้เห็นถึงประสิทธิภาพที่สามารถแข่งขันกับบริษัทยักษ์ใหญ่ในอุตสาหกรรมได้
แบบจำลอง R1 ของ DeepSeek ได้รับการจัดอันดับเป็นอันดับที่สามในกลุ่มแบบจำลองภาษาขนาดใหญ่ แสดงให้เห็นถึงประสิทธิภาพที่สามารถแข่งขันกับบริษัทยักษ์ใหญ่ในอุตสาหกรรมได้

นวัตกรรมที่คุ้มค่า

สิ่งที่น่าประทับใจที่สุดของความสำเร็จของ DeepSeek คือความคุ้มค่าด้านต้นทุน บริษัทพัฒนาโมเดล V3 โดยใช้ GPU เพียง 2,000 ตัว และเงินลงทุนเพียง 5.5 ล้านดอลลาร์สหรัฐ เมื่อเทียบกับหลายร้อยล้านที่บริษัทอย่าง OpenAI มักจะใช้ ความสำเร็จด้านประสิทธิภาพนี้ได้สร้างความประทับใจให้กับวงการเทคโนโลยีอย่างมาก แสดงให้เห็นว่าการพัฒนา AI ระดับสูงสามารถทำได้ด้วยทรัพยากรที่น้อยกว่าที่เคยคิดกันไว้มาก

ผลกระทบต่ออุตสาหกรรมและการตอบสนองของตลาด

การปรากฏตัวของ DeepSeek ได้สร้างคลื่นในวงการเทคโนโลยี โดยเฉพาะอย่างยิ่งต่อความรู้สึกของตลาดที่มีต่อผู้เล่นรายใหญ่ Marc Andreessen ผู้ก่อตั้ง A16Z และนักลงทุนด้านเทคโนโลยีที่มีชื่อเสียง ได้ชื่นชม R1 ว่าเป็นหนึ่งในความก้าวหน้าที่น่าประทับใจที่สุดที่เขาเคยเห็น โดยเฉพาะการเป็นโอเพนซอร์ส การรับรองจากบุคคลสำคัญในวงการที่เคยสนับสนุนบริษัทอย่าง OpenAI และ Databricks นี้ยิ่งเพิ่มน้ำหนักให้กับความสำเร็จของ DeepSeek

การปรับตัวเชิงกลยุทธ์ภายใต้ข้อจำกัด

เรื่องราวความสำเร็จของ DeepSeek มีความน่าสนใจเป็นพิเศษเมื่อพิจารณาถึงบริบทของข้อจำกัดการส่งออกชิพของสหรัฐฯ Wenfeng Liang ผู้ก่อตั้งบริษัทได้แสดงให้เห็นถึงวิสัยทัศน์ที่ยอดเยี่ยมด้วยการสำรองชิพ NVIDIA A100 จำนวนมากก่อนที่ข้อจำกัดจะมีผลบังคับใช้ ที่สำคัญกว่านั้น บริษัทได้เปลี่ยนข้อจำกัดเหล่านี้ให้เป็นโอกาส โดยมุ่งเน้นที่การเพิ่มประสิทธิภาพและการปรับปรุงแทนที่จะพึ่งพาเพียงกำลังการประมวลผลอย่างเดียว

ไทม์ไลน์การพัฒนาที่สำคัญ:

  • กรกฎาคม 2566: ก่อตั้ง DeepSeek
  • ธันวาคม 2567: เปิดตัวโมเดล V3
  • 20 มกราคม 2568: เปิดตัวโมเดล R1
  • 24 มกราคม 2568: ได้รับการยอมรับในระดับโลก

นัยสำคัญในอนาคต

การเติบโตของ DeepSeek บ่งชี้ถึงการเปลี่ยนแปลงที่อาจเกิดขึ้นในภูมิทัศน์ของ AI ระดับโลก แม้จะยังเร็วเกินไปที่จะประกาศการเปลี่ยนแปลงผู้นำในอุตสาหกรรมอย่างชัดเจน แต่ความสำเร็จของบริษัทชี้ให้เห็นว่าอนาคตของการพัฒนา AI อาจไม่ได้ขึ้นอยู่กับการเข้าถึงทรัพยากรมหาศาลเพียงอย่างเดียว แต่ขึ้นอยู่กับแนวทางที่สร้างสรรค์ในการเพิ่มประสิทธิภาพและการปรับปรุง การพัฒนานี้อาจเร่งการกระจายเทคโนโลยี AI และส่งเสริมการมีส่วนร่วมที่หลากหลายมากขึ้นในการวิจัยและพัฒนา AI ขั้นสูง