การฝึกฝนโมเดล AI ลดต้นทุนได้ถึง 118 เท่า: การเติบโตของโมเดล Diffusion งบประมาณจิ๋ว

BigGo Editorial Team
การฝึกฝนโมเดล AI ลดต้นทุนได้ถึง 118 เท่า: การเติบโตของโมเดล Diffusion งบประมาณจิ๋ว

ภูมิทัศน์ของการฝึกฝนโมเดล AI กำลังเผชิญกับการเปลี่ยนแปลงครั้งสำคัญ เมื่อนักวิจัยได้แสดงให้เห็นถึงความเป็นไปได้ในการฝึกฝนโมเดล diffusion ขนาดใหญ่ด้วยงบประมาณที่ต่ำอย่างน่าทึ่ง การพัฒนานี้ถือเป็นจุดเริ่มต้นของการกระจายโอกาสในการฝึกฝนโมเดล AI ให้เข้าถึงได้ง่ายขึ้นสำหรับองค์กรขนาดเล็กและนักวิจัยอิสระ

ภาพแสดงให้เห็นถึงศักยภาพด้านความคิดสร้างสรรค์ของ AI โดยแสดงภาพนักบินอวกาศขี่ม้าในรูปแบบศิลปะที่หลากหลาย สื่อถึงความเป็นไปได้ไม่มีที่สิ้นสุดของโมเดล AI ที่ใช้งบประมาณน้อย
ภาพแสดงให้เห็นถึงศักยภาพด้านความคิดสร้างสรรค์ของ AI โดยแสดงภาพนักบินอวกาศขี่ม้าในรูปแบบศิลปะที่หลากหลาย สื่อถึงความเป็นไปได้ไม่มีที่สิ้นสุดของโมเดล AI ที่ใช้งบประมาณน้อย

เศรษฐศาสตร์ของการฝึกฝนด้วยงบประมาณจิ๋ว

ชุมชนนักพัฒนาให้ความสนใจอย่างมากกับผลกระทบด้านต้นทุนของแนวทางใหม่นี้ แม้ว่าตัวเลขต้นทุน 1,890 ดอลลาร์สหรัฐ สำหรับการฝึกฝนจะแสดงถึงการลดลงอย่างมากจากต้นทุนแบบดั้งเดิม แต่ก็มีการถกเถียงเชิงลึกเกี่ยวกับการเข้าถึงที่แท้จริงของโมเดลงบประมาณจิ๋วเหล่านี้ การฝึกฝนต้องใช้ GPU H100 จำนวน 8 ตัว ซึ่งต้องลงทุนด้านฮาร์ดแวร์สูง อย่างไรก็ตาม ทางเลือกการใช้ cloud computing ทำให้เป็นไปได้มากขึ้น:

คุณสามารถทำได้บน GPU ตัวเดียว แต่จำเป็นต้องใช้การสะสมเกรเดียนต์ และการฝึกฝนอาจใช้เวลา 1-2 เดือนบน GPU สำหรับผู้บริโภคทั่วไป

ข้อมูลนี้ชี้ให้เห็นว่าการกระจายโอกาสยิ่งเป็นไปได้มากขึ้น แม้จะต้องใช้เวลาฝึกฝนที่นานขึ้นก็ตาม

ค่าใช้จ่ายในการประมวลผลบนระบบคลาวด์ (อ้างอิงจากความคิดเห็น):

  • Lambda Labs: ประมาณ 215 ดอลลาร์สหรัฐ สำหรับการเทรนนิ่ง 2.6 วัน
  • ผู้ให้บริการทางเลือกอื่นๆ ที่นำเสนอการประหยัดต้นทุนเพิ่มเติม
  • ทางเลือกสำหรับผู้บริโภคที่ใช้ GPU: ใช้เวลาเทรนนิ่ง 1-2 เดือนบน GPU ตัวเดียว

ข้อได้เปรียบเสียเปรียบทางเทคนิคและความสำเร็จ

โมเดลสามารถทำผลงานได้น่าประทับใจแม้จะมีข้อจำกัดด้านงบประมาณ โดยฝึกฝน sparse transformer ขนาด 1.16 พันล้านพารามิเตอร์ โดยใช้ภาพเพียง 37 ล้านภาพ การอภิปรายในชุมชนชี้ให้เห็นว่าแม้ความต้องการด้านฮาร์ดแวร์จะดูมาก แต่แนวทางนี้แสดงถึงการใช้ทรัพยากรอย่างมีประสิทธิภาพเมื่อเทียบกับวิธีที่มีอยู่ โดยได้คะแนน FID ที่ 12.7 ในการสร้างภาพแบบ zero-shot บนชุดข้อมูล COCO

ข้อมูลจำเพาะในการฝึกฝน:

  • ต้นทุนรวม: USD $1,890
  • ระยะเวลาในการฝึกฝน: 2.6 วัน
  • ฮาร์ดแวร์: เครื่องที่ใช้ GPU H100 จำนวน 8 ตัว
  • ขนาดชุดข้อมูล: 37 ล้านภาพ
  • ขนาดโมเดล: 1.16 พันล้านพารามิเตอร์
  • ประสิทธิภาพ: ค่า FID 12.7 บนชุดข้อมูล COCO
  • การลดต้นทุน: ต่ำกว่าโมเดล Stable Diffusion 118 เท่า

ผลกระทบในอนาคต

การอภิปรายเผยให้เห็นแนวโน้มที่กำลังเกิดขึ้นซึ่งสมาชิกในชุมชนบางคนอธิบายว่าเป็นคลื่นของโมเดล AI ขนาดเล็กที่มีความคิดสร้างสรรค์ไม่สิ้นสุด ด้วยต้นทุนการฝึกฝนที่อาจลดลงเหลือเพียงเท่ากับการลงทุนคอมพิวเตอร์เกมระดับไฮเอนด์ (ประมาณ 5,000 ดอลลาร์สหรัฐ รวมฮาร์ดแวร์) เรากำลังเห็นความเป็นไปได้ของการเกิดระบบนิเวศใหม่ของโมเดล AI เฉพาะทางที่พัฒนาโดยนักพัฒนาอิสระและทีมขนาดเล็ก

ข้อพิจารณาด้านข้อมูลและการกระจาย

มีการถกเถียงทางเทคนิคที่น่าสนใจเกี่ยวกับแนวคิดการสร้างภาพนอกชุดข้อมูล โดยสมาชิกในชุมชนสังเกตว่าเกณฑ์มาตรฐานแบบดั้งเดิมของภาพนักบินอวกาศขี่ม้าอาจไม่ได้อยู่นอกชุดข้อมูลอย่างที่เคยคิดกัน สิ่งนี้ชี้ให้เห็นความสำคัญของการพิจารณาอย่างรอบคอบในการเลือกงานทดสอบเพื่อประเมินความสามารถของโมเดล

การพัฒนาแนวทางการฝึกฝนด้วยงบประมาณจิ๋วถือเป็นก้าวสำคัญสู่การกระจายโอกาสในการพัฒนาโมเดล AI ซึ่งอาจนำไปสู่คลื่นนวัตกรรมใหม่จากผู้เล่นรายเล็กในวงการ แม้จะยังมีอุปสรรคด้านฮาร์ดแวร์อยู่บ้าง แต่การลดลงอย่างมากของต้นทุนการฝึกฝนบ่งชี้ว่าเรากำลังก้าวเข้าสู่ยุคใหม่ของการเข้าถึงการพัฒนาโมเดล AI

อ้างอิง: Stretching Each Dollar: Diffusion Training from Scratch on a Micro-Budget