DeepSeek ได้เปิดตัว Janus Pro โมเดล AI แบบมัลติโมดัลตัวใหม่ที่กำลังสร้างกระแสวิพากษ์วิจารณ์ในวงการเทคโนโลยี ด้วยแนวทางที่มีประสิทธิภาพในการสร้างและทำความเข้าใจภาพ ชื่อของโมเดลได้แรงบันดาลใจมาจากเทพเจ้าโรมันที่มีสองใบหน้า สะท้อนถึงความสามารถสองด้านทั้งการทำความเข้าใจและการสร้างเนื้อหาภาพ โมเดลขนาด 7B พารามิเตอร์นี้ถือเป็นอีกหนึ่งความสำเร็จของ DeepSeek ในวงการ AI
สถาปัตยกรรมที่มีประสิทธิภาพ
โมเดลนี้แสดงให้เห็นถึงประสิทธิภาพที่โดดเด่นในด้านสถาปัตยกรรม โดยใช้ทรัพยากรการประมวลผลน้อยกว่าคู่แข่งอย่างมาก การฝึกฝนโมเดลใช้เวลาเพียง 7-14 วัน โดยใช้คลัสเตอร์ 16-32 โหนด แต่ละโหนดติดตั้ง NVIDIA A100 GPU จำนวน 8 ตัว คิดเป็นค่าใช้จ่ายในการฝึกฝนประมาณ 110,000 ดอลลาร์สหรัฐ ซึ่งเป็นเพียงเศษเสี้ยวของค่าใช้จ่าย 1 ล้านดอลลาร์สหรัฐที่ใช้ในการฝึกฝนโมเดลรุ่นก่อนๆ อย่าง DALL-E 2
ข้อมูลทางเทคนิค:
- ขนาดโมเดล: 7B พารามิเตอร์
- โครงสร้างพื้นฐานในการเทรนนิ่ง: 16-32 โหนด พร้อม GPU NVIDIA A100 (40GB) จำนวน 8 ตัวต่อโหนด
- ระยะเวลาในการเทรนนิ่ง: 7-14 วัน
- ความละเอียดของภาพ: 384x384
- ประมาณการค่าใช้จ่ายในการเทรนนิ่ง: ประมาณ 110,000 ดอลลาร์สหรัฐ
คุณสมบัติหลัก:
- ความสามารถในการทำงานแบบมัลติโมดัล (การแปลงข้อความเป็นภาพและการทำความเข้าใจภาพ)
- อนุญาตให้ใช้ในเชิงพาณิชย์
- จำกัดการใช้งานทางการทหาร
- สามารถติดตั้งและใช้งานในระบบแบบโลคอลได้
ข้อจำกัดทางเทคนิคและความสามารถ
แม้ว่า Janus Pro จะแสดงศักยภาพที่ดีในการทดสอบประสิทธิภาพ แต่ก็มีข้อจำกัดที่สำคัญ ปัจจุบันโมเดลสามารถสร้างภาพได้ที่ความละเอียด 384x384 เท่านั้น ซึ่งต่ำกว่าความละเอียด 1024x1024 ที่คู่แข่งบางรายนำเสนอ อย่างไรก็ตาม จากการอภิปรายในชุมชนชี้ให้เห็นว่าข้อจำกัดนี้อาจเป็นความตั้งใจ โดยมุ่งเน้นที่การทำความเข้าใจคำสั่งและคุณภาพของการสร้างภาพมากกว่าความละเอียดของภาพ ซึ่งสามารถแก้ไขได้ด้วยการขยายขนาดภาพในภายหลัง
ยังไม่มีกลไกใน GenAI ที่บังคับใช้ข้อจำกัดเชิงอนุมาน (และการประกอบกัน) กล่าวคือ สถานการณ์ที่เมื่อได้ผลลัพธ์หนึ่งแล้ว พื้นที่การค้นหาสำหรับผลลัพธ์ในอนาคตจำเป็นต้องถูกจำกัด (และข้อจำกัดเหล่านั้นสามารถประกอบกันได้)
ผลกระทบต่อตลาด
การประกาศเปิดตัวครั้งนี้ส่งผลกระทบอย่างมากในตลาดเทคโนโลยี ส่งผลให้หุ้นของบริษัทที่เน้นด้าน AI มีการเคลื่อนไหวที่น่าสนใจ ประสิทธิภาพของโมเดลส่งผลต่อมุมมองของตลาดเกี่ยวกับความต้องการด้านฮาร์ดแวร์สำหรับการพัฒนา AI และท้าทายสมมติฐานเกี่ยวกับขนาดของโครงสร้างพื้นฐานที่จำเป็นสำหรับความสามารถด้าน AI ที่แข่งขันได้
การอนุญาตใช้งานและการเข้าถึง
DeepSeek ได้เผยแพร่ Janus Pro ภายใต้ใบอนุญาตของตนเอง ซึ่งอนุญาตให้ใช้ในเชิงพาณิชย์แต่จำกัดการใช้งานทางทหาร แนวทางที่เปิดกว้างนี้ รวมกับสถาปัตยกรรมที่มีประสิทธิภาพ อาจช่วยลดอุปสรรคในการเข้าถึงเทคโนโลยีการสร้างภาพด้วย AI สำหรับองค์กรต่างๆ
การพัฒนา Janus Pro ถือเป็นก้าวสำคัญในการทำให้เทคโนโลยีการสร้างภาพด้วย AI เป็นที่แพร่หลายมากขึ้น แม้ว่าจะยังมีคำถามเกี่ยวกับประสิทธิภาพการทำงานจริงเมื่อเทียบกับโซลูชันที่มีอยู่แล้ว การมุ่งเน้นด้านประสิทธิภาพและการเข้าถึงอาจเปลี่ยนแปลงวิธีการที่เราใช้ในการพัฒนาและใช้งานโมเดล AI
อ้างอิง: Janus Pro Technical Report