วงการปัญญาประดิษฐ์กำลังเผชิญกับพัฒนาการครั้งสำคัญ เมื่อโมเดล AI แบบโอเพนซอร์สของ DeepSeek แสดงให้เห็นถึงความเข้ากันได้กับ GPU ที่ผลิตโดย Moore Threads จากประเทศจีน ซึ่งอาจช่วยลดการพึ่งพาฮาร์ดแวร์ของ NVIDIA ในงานประมวลผล AI
ความสำเร็จด้านเทคนิค
Moore Threads ประสบความสำเร็จในการติดตั้งโมเดล DeepSeek-R1-Distill-Qwen-7B บนการ์ดจอ MTT S80 สำหรับผู้ใช้ทั่วไป และการ์ดจอระดับศูนย์ข้อมูล MTT S4000 โดยใช้เฟรมเวิร์ก Ollama ซึ่งเป็นโซลูชันขนาดเบาที่ออกแบบมาสำหรับรันโมเดลภาษาขนาดใหญ่บนระบบปฏิบัติการต่างๆ ร่วมกับการปรับแต่งเอนจินประมวลผลเฉพาะของ Moore Threads
- ราคา API ของ DeepSeek: 2.2 ดอลลาร์สหรัฐต่อหนึ่งล้านโทเค็นเอาท์พุต
- ราคา API ของ OpenAI: 60 ดอลลาร์สหรัฐต่อหนึ่งล้านโทเค็นเอาท์พุต
- ฮาร์ดแวร์ที่รองรับ: MTT S80 (การ์ดจอสำหรับผู้ใช้), MTT S4000 (การ์ดจอสำหรับดาต้าเซ็นเตอร์)
- รองรับเฟรมเวิร์ก: Ollama (ใช้งานได้บน MacOS, Linux, Windows)
- โมเดลที่เข้ากันได้: DeepSeek-R1-Distill-Qwen-7B
ผลกระทบต่อตลาด
พัฒนาการนี้เกิดขึ้นในจังหวะสำคัญที่ DeepSeek กำลังสร้างความเปลี่ยนแปลงในวงการ AI ระดับโลก กลยุทธ์ด้านราคาของบริษัทมีความก้าวร้าวเป็นพิเศษ โดยเสนอบริการ API ในราคา 2.2 ดอลลาร์สหรัฐต่อหนึ่งล้านโทเค็นเอาต์พุต ซึ่งต่ำกว่าราคาของ OpenAI ที่คิด 60 ดอลลาร์สหรัฐต่อหนึ่งล้านโทเค็นอย่างมาก บริษัทเทคโนโลยียักษ์ใหญ่ของจีนอย่าง Alibaba, ByteDance, Baidu และ JD Cloud ได้นำโมเดลของ DeepSeek ไปใช้ในบริการคลาวด์ของตนแล้ว
ประสิทธิภาพและการผสานการทำงาน
แม้ว่าจะยังไม่มีการเปิดเผยตัวเลขประสิทธิภาพที่ชัดเจน แต่ Moore Threads อ้างว่าได้ผลลัพธ์ที่ยอดเยี่ยมผ่านการปรับแต่งการคำนวณและการจัดการหน่วยความจำที่ดีขึ้น GPU ของบริษัทแสดงให้เห็นถึงความเข้ากันได้กับ CUDA ซึ่งเป็นประโยชน์อย่างยิ่งสำหรับแอปพลิเคชันภาษาจีน การผสานการทำงานนี้ถือเป็นก้าวสำคัญของความสามารถด้านฮาร์ดแวร์ AI ในประเทศจีน
นัยสำคัญในอนาคต
ความสำเร็จในการติดตั้งโมเดลของ DeepSeek บน GPU ของ Moore Threads บ่งชี้ถึงการเปลี่ยนแปลงที่อาจเกิดขึ้นในวงการฮาร์ดแวร์ AI พัฒนาการนี้อาจนำไปสู่ทางเลือกในการใช้งาน AI ที่มีราคาถูกลงและเข้าถึงได้ง่ายขึ้น โดยเฉพาะในตลาดจีน อย่างไรก็ตาม สิ่งสำคัญที่ต้องระบุคือการสาธิตในปัจจุบันยังจำกัดอยู่ที่โมเดลแบบ distilled และยังไม่มีการเปรียบเทียบประสิทธิภาพอย่างครอบคลุมกับโซลูชันของ AMD, Apple หรือ NVIDIA