AMD เปิดตัว 135M: โมเดลภาษาขนาดเล็กรุ่นแรกพร้อมการถอดรหัสเชิงคาดการณ์

BigGo Editorial Team

AMD เปิดตัว 135M: โมเดลภาษาขนาดเล็กรุ่นแรกพร้อมการถอดรหัสเชิงคาดการณ์

AMD ได้ก้าวเข้าสู่โลกของโมเดลภาษาขนาดเล็กเป็นครั้งแรกด้วยการเปิดตัว AMD-135M แสดงให้เห็นถึงความทะเยอทะยานที่เพิ่มขึ้นของบริษัทในด้าน AI โมเดลใหม่นี้มีจุดมุ่งหมายเพื่อมอบความสามารถด้าน AI ที่มีประสิทธิภาพสำหรับธุรกิจ ในขณะที่ใช้ประโยชน์จากจุดแข็งด้านฮาร์ดแวร์ของ AMD

จุดเด่นสำคัญของ AMD-135M:

สองรุ่น : AMD-Llama-135M สำหรับการใช้งานทั่วไป และ AMD-Llama-135M-code ที่ปรับแต่งสำหรับงานเขียนโค้ด
กระบวนการฝึกฝน :
- โมเดลพื้นฐานได้รับการฝึกฝนด้วยโทเค็น 670 พันล้านตัวเป็นเวลา 6 วัน
- รุ่นสำหรับเขียนโค้ดได้รับการปรับแต่งเพิ่มเติมด้วยโทเค็นอีก 20 พันล้านตัวเป็นเวลา 4 วัน
- ใช้โหนด AMD Instinct MI250 แบบ 8 ทางจำนวนสี่โหนดสำหรับการฝึกฝน
การถอดรหัสเชิงคาดการณ์ : ใช้โมเดลร่างขนาดเล็กกว่าเพื่อสร้างโทเค็นหลายตัวเลือกพร้อมกัน โดยได้รับการตรวจสอบจากโมเดลเป้าหมายที่ใหญ่กว่า
การอ้างประสิทธิภาพ : AMD รายงานว่ามีการเพิ่มความเร็วอย่างมีนัยสำคัญบนฮาร์ดแวร์ของตนเมื่อเทียบกับการอนุมานโดยไม่ใช้การถอดรหัสเชิงคาดการณ์

การเปิดตัว AMD-135M แสดงให้เห็นถึงความตั้งใจของบริษัทในการแข่งขันในพื้นที่โมเดล AI ซึ่งอาจท้าทายความเป็นผู้นำของ NVIDIA โดยการมุ่งเน้นไปที่โมเดลภาษาขนาดเล็ก AMD กำลังเล็งเป้าไปที่ตลาดเฉพาะที่อาจมีคุณค่าเป็นพิเศษสำหรับธุรกิจที่ต้องการโซลูชัน AI แบบออนพรีมิสที่มีความต้องการด้านการคำนวณที่ต่ำกว่า

แนวทางของ AMD ในการเปิดเผยโค้ดการฝึกฝน ชุดข้อมูล และค่าน้ำหนักสำหรับ AMD-135M อาจส่งเสริมการทำงานร่วมกันและนวัตกรรมในชุมชน AI สิ่งนี้สอดคล้องกับแนวโน้มที่เพิ่มขึ้นของการพัฒนา AI ที่เข้าถึงได้ง่ายขึ้นและโปร่งใสมากขึ้น

แม้ว่าการอ้างประสิทธิภาพจะดูน่าสนใจ แต่ควรสังเกตว่าการทดสอบเปรียบเทียบนั้นดำเนินการโดย AMD เอง การทดสอบโดยอิสระจะมีความสำคัญในการตรวจสอบผลลัพธ์เหล่านี้ในสถานการณ์และการกำหนดค่าฮาร์ดแวร์ที่แตกต่างกัน

ในขณะที่ AMD ยังคงพัฒนาพอร์ตโฟลิโอด้าน AI ของตน ซึ่งรวมถึงทั้งผลิตภัณฑ์ฮาร์ดแวร์และซอฟต์แวร์ อุตสาหกรรมเทคโนโลยีจะจับตามองอย่างใกล้ชิดเพื่อดูว่าสิ่งนี้จะส่งผลกระทบต่อภูมิทัศน์การแข่งขันและขับเคลื่อนนวัตกรรมในเทคโนโลยี AI อย่างไร

ข่าวที่เกี่ยวข้อง

‌

‌
‌

‌

‌
‌

‌