DeepSeek เปิดตัว Janus Pro รุกตลาด AI สร้างภาพด้วยโมเดลขนาด 7B พารามิเตอร์

BigGo Editorial Team
DeepSeek เปิดตัว Janus Pro รุกตลาด AI สร้างภาพด้วยโมเดลขนาด 7B พารามิเตอร์

DeepSeek ได้เปิดตัว Janus Pro โมเดล AI แบบมัลติโมดัลตัวใหม่ที่กำลังสร้างกระแสวิพากษ์วิจารณ์ในวงการเทคโนโลยี ด้วยแนวทางที่มีประสิทธิภาพในการสร้างและทำความเข้าใจภาพ ชื่อของโมเดลได้แรงบันดาลใจมาจากเทพเจ้าโรมันที่มีสองใบหน้า สะท้อนถึงความสามารถสองด้านทั้งการทำความเข้าใจและการสร้างเนื้อหาภาพ โมเดลขนาด 7B พารามิเตอร์นี้ถือเป็นอีกหนึ่งความสำเร็จของ DeepSeek ในวงการ AI

สถาปัตยกรรมที่มีประสิทธิภาพ

โมเดลนี้แสดงให้เห็นถึงประสิทธิภาพที่โดดเด่นในด้านสถาปัตยกรรม โดยใช้ทรัพยากรการประมวลผลน้อยกว่าคู่แข่งอย่างมาก การฝึกฝนโมเดลใช้เวลาเพียง 7-14 วัน โดยใช้คลัสเตอร์ 16-32 โหนด แต่ละโหนดติดตั้ง NVIDIA A100 GPU จำนวน 8 ตัว คิดเป็นค่าใช้จ่ายในการฝึกฝนประมาณ 110,000 ดอลลาร์สหรัฐ ซึ่งเป็นเพียงเศษเสี้ยวของค่าใช้จ่าย 1 ล้านดอลลาร์สหรัฐที่ใช้ในการฝึกฝนโมเดลรุ่นก่อนๆ อย่าง DALL-E 2

ข้อมูลทางเทคนิค:

  • ขนาดโมเดล: 7B พารามิเตอร์
  • โครงสร้างพื้นฐานในการเทรนนิ่ง: 16-32 โหนด พร้อม GPU NVIDIA A100 (40GB) จำนวน 8 ตัวต่อโหนด
  • ระยะเวลาในการเทรนนิ่ง: 7-14 วัน
  • ความละเอียดของภาพ: 384x384
  • ประมาณการค่าใช้จ่ายในการเทรนนิ่ง: ประมาณ 110,000 ดอลลาร์สหรัฐ

คุณสมบัติหลัก:

  • ความสามารถในการทำงานแบบมัลติโมดัล (การแปลงข้อความเป็นภาพและการทำความเข้าใจภาพ)
  • อนุญาตให้ใช้ในเชิงพาณิชย์
  • จำกัดการใช้งานทางการทหาร
  • สามารถติดตั้งและใช้งานในระบบแบบโลคอลได้

ข้อจำกัดทางเทคนิคและความสามารถ

แม้ว่า Janus Pro จะแสดงศักยภาพที่ดีในการทดสอบประสิทธิภาพ แต่ก็มีข้อจำกัดที่สำคัญ ปัจจุบันโมเดลสามารถสร้างภาพได้ที่ความละเอียด 384x384 เท่านั้น ซึ่งต่ำกว่าความละเอียด 1024x1024 ที่คู่แข่งบางรายนำเสนอ อย่างไรก็ตาม จากการอภิปรายในชุมชนชี้ให้เห็นว่าข้อจำกัดนี้อาจเป็นความตั้งใจ โดยมุ่งเน้นที่การทำความเข้าใจคำสั่งและคุณภาพของการสร้างภาพมากกว่าความละเอียดของภาพ ซึ่งสามารถแก้ไขได้ด้วยการขยายขนาดภาพในภายหลัง

ยังไม่มีกลไกใน GenAI ที่บังคับใช้ข้อจำกัดเชิงอนุมาน (และการประกอบกัน) กล่าวคือ สถานการณ์ที่เมื่อได้ผลลัพธ์หนึ่งแล้ว พื้นที่การค้นหาสำหรับผลลัพธ์ในอนาคตจำเป็นต้องถูกจำกัด (และข้อจำกัดเหล่านั้นสามารถประกอบกันได้)

ผลกระทบต่อตลาด

การประกาศเปิดตัวครั้งนี้ส่งผลกระทบอย่างมากในตลาดเทคโนโลยี ส่งผลให้หุ้นของบริษัทที่เน้นด้าน AI มีการเคลื่อนไหวที่น่าสนใจ ประสิทธิภาพของโมเดลส่งผลต่อมุมมองของตลาดเกี่ยวกับความต้องการด้านฮาร์ดแวร์สำหรับการพัฒนา AI และท้าทายสมมติฐานเกี่ยวกับขนาดของโครงสร้างพื้นฐานที่จำเป็นสำหรับความสามารถด้าน AI ที่แข่งขันได้

การอนุญาตใช้งานและการเข้าถึง

DeepSeek ได้เผยแพร่ Janus Pro ภายใต้ใบอนุญาตของตนเอง ซึ่งอนุญาตให้ใช้ในเชิงพาณิชย์แต่จำกัดการใช้งานทางทหาร แนวทางที่เปิดกว้างนี้ รวมกับสถาปัตยกรรมที่มีประสิทธิภาพ อาจช่วยลดอุปสรรคในการเข้าถึงเทคโนโลยีการสร้างภาพด้วย AI สำหรับองค์กรต่างๆ

การพัฒนา Janus Pro ถือเป็นก้าวสำคัญในการทำให้เทคโนโลยีการสร้างภาพด้วย AI เป็นที่แพร่หลายมากขึ้น แม้ว่าจะยังมีคำถามเกี่ยวกับประสิทธิภาพการทำงานจริงเมื่อเทียบกับโซลูชันที่มีอยู่แล้ว การมุ่งเน้นด้านประสิทธิภาพและการเข้าถึงอาจเปลี่ยนแปลงวิธีการที่เราใช้ในการพัฒนาและใช้งานโมเดล AI

อ้างอิง: Janus Pro Technical Report