ในการพัฒนาครั้งสำคัญของวงการ AI บริษัทสตาร์ทอัพจากจีน DeepSeek ได้เปิดตัว Janus-Pro โมเดล AI แบบหลายโมดูลใหม่ที่แสดงให้เห็นว่าแนวทางที่มีประสิทธิภาพและคุ้มค่าสามารถแข่งขันกับบริษัทยักษ์ใหญ่ในอุตสาหกรรมได้ การเปิดตัวนี้เกิดขึ้นในช่วงที่มีการถกเถียงเกี่ยวกับต้นทุนการพัฒนา AI และทรัพยากรที่จำเป็นกำลังทวีความรุนแรงขึ้น
แนวทางใหม่สู่ AI แบบหลายโมดูล
Janus-Pro ของ DeepSeek นำเสนอเฟรมเวิร์คแบบ autoregressive ใหม่ที่สามารถวิเคราะห์และสร้างภาพได้ ตระกูลโมเดลมีขนาดตั้งแต่ 1 พันล้านถึง 7 พันล้านพารามิเตอร์ โดยรุ่นเรือธง Janus-Pro-7B รายงานว่าทำผลงานได้ดีกว่า DALL-E 3 ของ OpenAI และ Stable Diffusion XL ของ Stability AI ในการทดสอบเกณฑ์มาตรฐานรวมถึง GenEval และ DPG-Bench
ข้อกำหนดของโมเดล:
- ช่วงพารามิเตอร์: 1B ถึง 7B
- ความต้องการในการเทรนโมเดล (สำหรับโมเดล 1.5B): GPU A100 จำนวน 128 เครื่อง, ใช้เวลา 7 วัน
- ความต้องการในการเทรนโมเดล (สำหรับโมเดล 7B): GPU A100 จำนวน 256 เครื่อง, ใช้เวลา 14 วัน
- ขีดจำกัดความละเอียดของภาพ: 384 x 384 (สำหรับโมเดลขนาดเล็ก)
นวัตกรรมที่คุ้มค่า
การพัฒนา Janus-Pro แสดงให้เห็นถึงกลยุทธ์ขนาดเล็กแต่ทรงพลังของ DeepSeek กระบวนการฝึกฝนแสดงให้เห็นถึงประสิทธิภาพที่โดดเด่น โดยโมเดลขนาด 1.5B พารามิเตอร์ต้องใช้ NVIDIA A100 GPU จำนวน 128 ตัวเป็นเวลาเจ็ดวัน ในขณะที่รุ่น 7B พารามิเตอร์ต้องใช้ A100 GPU 256 ตัวเป็นเวลาสิบสี่วัน แนวทางนี้แตกต่างอย่างชัดเจนกับแนวคิด ยิ่งใหญ่ยิ่งดี และความต้องการการประมวลผลขนาดใหญ่ของอุตสาหกรรม
โอเพนซอร์สและการเข้าถึง
Janus-Pro เผยแพร่ภายใต้ใบอนุญาต MIT สามารถใช้งานเชิงพาณิชย์ได้ฟรีผ่านแพลตฟอร์มพัฒนา AI อย่าง Hugging Face แนวทางโอเพนซอร์สนี้ทำให้เทคโนโลยี AI ขั้นสูงเข้าถึงได้สำหรับบุคคลทั่วไปและองค์กรขนาดเล็ก แม้ว่าบางโมเดลจะจำกัดการวิเคราะห์ภาพที่ความละเอียด 384 x 384 เท่านั้น
ผลกระทบต่อตลาดและการกำหนดราคา
โครงสร้างราคาบริการ API ของ DeepSeek ยังคงแข่งขันได้ โดยกำหนดราคาที่ 1 หยวนต่อหนึ่งล้านโทเค็นอินพุตสำหรับ cache hits และ 4 หยวนสำหรับ cache misses ในขณะที่โทเค็นเอาต์พุตมีราคา 16 หยวนต่อหนึ่งล้าน รูปแบบการกำหนดราคานี้ รวมกับประสิทธิภาพของโมเดล ท้าทายความเชื่อดั้งเดิมเกี่ยวกับทรัพยากรที่จำเป็นสำหรับการพัฒนา AI ที่แข่งขันได้
โครงสร้างราคา:
- โทเค็นอินพุต (แคชฮิต): CNY¥1/ล้าน
- โทเค็นอินพุต (แคชมิส): CNY¥4/ล้าน
- โทเค็นเอาท์พุต: CNY¥16/ล้าน
ความปลอดภัยและข้อพิจารณาในการเข้าถึง
หลังจากเผชิญความท้าทายด้านความปลอดภัยล่าสุด DeepSeek ได้นำมาตรการป้องกันมาใช้ โดยจำกัดการลงทะเบียนเฉพาะหมายเลขโทรศัพท์ +86 ชั่วคราว การเคลื่อนไหวนี้แสดงให้เห็นถึงความสำคัญที่เพิ่มขึ้นของความปลอดภัยในการใช้งาน AI ในขณะที่ยังคงรักษาการให้บริการสำหรับผู้ใช้หลัก