DeepSeek เปิดตัว Janus-Pro ท้าชน DALL-E 3 ด้วย AI หลายโมดูลแบบโอเพนซอร์สที่มีประสิทธิภาพ

BigGo Editorial Team

DeepSeek เปิดตัว Janus-Pro ท้าชน DALL-E 3 ด้วย AI หลายโมดูลแบบโอเพนซอร์สที่มีประสิทธิภาพ

ในการพัฒนาครั้งสำคัญของวงการ AI บริษัทสตาร์ทอัพจากจีน DeepSeek ได้เปิดตัว Janus-Pro โมเดล AI แบบหลายโมดูลใหม่ที่แสดงให้เห็นว่าแนวทางที่มีประสิทธิภาพและคุ้มค่าสามารถแข่งขันกับบริษัทยักษ์ใหญ่ในอุตสาหกรรมได้ การเปิดตัวนี้เกิดขึ้นในช่วงที่มีการถกเถียงเกี่ยวกับต้นทุนการพัฒนา AI และทรัพยากรที่จำเป็นกำลังทวีความรุนแรงขึ้น

แนวทางใหม่สู่ AI แบบหลายโมดูล

Janus-Pro ของ DeepSeek นำเสนอเฟรมเวิร์คแบบ autoregressive ใหม่ที่สามารถวิเคราะห์และสร้างภาพได้ ตระกูลโมเดลมีขนาดตั้งแต่ 1 พันล้านถึง 7 พันล้านพารามิเตอร์ โดยรุ่นเรือธง Janus-Pro-7B รายงานว่าทำผลงานได้ดีกว่า DALL-E 3 ของ OpenAI และ Stable Diffusion XL ของ Stability AI ในการทดสอบเกณฑ์มาตรฐานรวมถึง GenEval และ DPG-Bench

ข้อกำหนดของโมเดล:

ช่วงพารามิเตอร์: 1B ถึง 7B
ความต้องการในการเทรนโมเดล (สำหรับโมเดล 1.5B): GPU A100 จำนวน 128 เครื่อง, ใช้เวลา 7 วัน
ความต้องการในการเทรนโมเดล (สำหรับโมเดล 7B): GPU A100 จำนวน 256 เครื่อง, ใช้เวลา 14 วัน
ขีดจำกัดความละเอียดของภาพ: 384 x 384 (สำหรับโมเดลขนาดเล็ก)

นวัตกรรมที่คุ้มค่า

การพัฒนา Janus-Pro แสดงให้เห็นถึงกลยุทธ์ขนาดเล็กแต่ทรงพลังของ DeepSeek กระบวนการฝึกฝนแสดงให้เห็นถึงประสิทธิภาพที่โดดเด่น โดยโมเดลขนาด 1.5B พารามิเตอร์ต้องใช้ NVIDIA A100 GPU จำนวน 128 ตัวเป็นเวลาเจ็ดวัน ในขณะที่รุ่น 7B พารามิเตอร์ต้องใช้ A100 GPU 256 ตัวเป็นเวลาสิบสี่วัน แนวทางนี้แตกต่างอย่างชัดเจนกับแนวคิด ยิ่งใหญ่ยิ่งดี และความต้องการการประมวลผลขนาดใหญ่ของอุตสาหกรรม

โอเพนซอร์สและการเข้าถึง

Janus-Pro เผยแพร่ภายใต้ใบอนุญาต MIT สามารถใช้งานเชิงพาณิชย์ได้ฟรีผ่านแพลตฟอร์มพัฒนา AI อย่าง Hugging Face แนวทางโอเพนซอร์สนี้ทำให้เทคโนโลยี AI ขั้นสูงเข้าถึงได้สำหรับบุคคลทั่วไปและองค์กรขนาดเล็ก แม้ว่าบางโมเดลจะจำกัดการวิเคราะห์ภาพที่ความละเอียด 384 x 384 เท่านั้น

ผลกระทบต่อตลาดและการกำหนดราคา

โครงสร้างราคาบริการ API ของ DeepSeek ยังคงแข่งขันได้ โดยกำหนดราคาที่ 1 หยวนต่อหนึ่งล้านโทเค็นอินพุตสำหรับ cache hits และ 4 หยวนสำหรับ cache misses ในขณะที่โทเค็นเอาต์พุตมีราคา 16 หยวนต่อหนึ่งล้าน รูปแบบการกำหนดราคานี้ รวมกับประสิทธิภาพของโมเดล ท้าทายความเชื่อดั้งเดิมเกี่ยวกับทรัพยากรที่จำเป็นสำหรับการพัฒนา AI ที่แข่งขันได้

โครงสร้างราคา:

โทเค็นอินพุต (แคชฮิต): CNY¥1/ล้าน
โทเค็นอินพุต (แคชมิส): CNY¥4/ล้าน
โทเค็นเอาท์พุต: CNY¥16/ล้าน

ความปลอดภัยและข้อพิจารณาในการเข้าถึง

หลังจากเผชิญความท้าทายด้านความปลอดภัยล่าสุด DeepSeek ได้นำมาตรการป้องกันมาใช้ โดยจำกัดการลงทะเบียนเฉพาะหมายเลขโทรศัพท์ +86 ชั่วคราว การเคลื่อนไหวนี้แสดงให้เห็นถึงความสำคัญที่เพิ่มขึ้นของความปลอดภัยในการใช้งาน AI ในขณะที่ยังคงรักษาการให้บริการสำหรับผู้ใช้หลัก

ข่าวที่เกี่ยวข้อง

‌

‌
‌

‌

‌
‌

‌