โมเดล AI ของ DeepSeek แสดงศักยภาพอันโดดเด่นบน GPU ของ Moore Threads จากจีน

BigGo Editorial Team

โมเดล AI ของ DeepSeek แสดงศักยภาพอันโดดเด่นบน GPU ของ Moore Threads จากจีน

วงการปัญญาประดิษฐ์กำลังเผชิญกับพัฒนาการครั้งสำคัญ เมื่อโมเดล AI แบบโอเพนซอร์สของ DeepSeek แสดงให้เห็นถึงความเข้ากันได้กับ GPU ที่ผลิตโดย Moore Threads จากประเทศจีน ซึ่งอาจช่วยลดการพึ่งพาฮาร์ดแวร์ของ NVIDIA ในงานประมวลผล AI

ความสำเร็จด้านเทคนิค

Moore Threads ประสบความสำเร็จในการติดตั้งโมเดล DeepSeek-R1-Distill-Qwen-7B บนการ์ดจอ MTT S80 สำหรับผู้ใช้ทั่วไป และการ์ดจอระดับศูนย์ข้อมูล MTT S4000 โดยใช้เฟรมเวิร์ก Ollama ซึ่งเป็นโซลูชันขนาดเบาที่ออกแบบมาสำหรับรันโมเดลภาษาขนาดใหญ่บนระบบปฏิบัติการต่างๆ ร่วมกับการปรับแต่งเอนจินประมวลผลเฉพาะของ Moore Threads

ราคา API ของ DeepSeek: 2.2 ดอลลาร์สหรัฐต่อหนึ่งล้านโทเค็นเอาท์พุต
ราคา API ของ OpenAI: 60 ดอลลาร์สหรัฐต่อหนึ่งล้านโทเค็นเอาท์พุต
ฮาร์ดแวร์ที่รองรับ: MTT S80 (การ์ดจอสำหรับผู้ใช้), MTT S4000 (การ์ดจอสำหรับดาต้าเซ็นเตอร์)
รองรับเฟรมเวิร์ก: Ollama (ใช้งานได้บน MacOS, Linux, Windows)
โมเดลที่เข้ากันได้: DeepSeek-R1-Distill-Qwen-7B

ผลกระทบต่อตลาด

พัฒนาการนี้เกิดขึ้นในจังหวะสำคัญที่ DeepSeek กำลังสร้างความเปลี่ยนแปลงในวงการ AI ระดับโลก กลยุทธ์ด้านราคาของบริษัทมีความก้าวร้าวเป็นพิเศษ โดยเสนอบริการ API ในราคา 2.2 ดอลลาร์สหรัฐต่อหนึ่งล้านโทเค็นเอาต์พุต ซึ่งต่ำกว่าราคาของ OpenAI ที่คิด 60 ดอลลาร์สหรัฐต่อหนึ่งล้านโทเค็นอย่างมาก บริษัทเทคโนโลยียักษ์ใหญ่ของจีนอย่าง Alibaba, ByteDance, Baidu และ JD Cloud ได้นำโมเดลของ DeepSeek ไปใช้ในบริการคลาวด์ของตนแล้ว

ประสิทธิภาพและการผสานการทำงาน

แม้ว่าจะยังไม่มีการเปิดเผยตัวเลขประสิทธิภาพที่ชัดเจน แต่ Moore Threads อ้างว่าได้ผลลัพธ์ที่ยอดเยี่ยมผ่านการปรับแต่งการคำนวณและการจัดการหน่วยความจำที่ดีขึ้น GPU ของบริษัทแสดงให้เห็นถึงความเข้ากันได้กับ CUDA ซึ่งเป็นประโยชน์อย่างยิ่งสำหรับแอปพลิเคชันภาษาจีน การผสานการทำงานนี้ถือเป็นก้าวสำคัญของความสามารถด้านฮาร์ดแวร์ AI ในประเทศจีน

นัยสำคัญในอนาคต

ความสำเร็จในการติดตั้งโมเดลของ DeepSeek บน GPU ของ Moore Threads บ่งชี้ถึงการเปลี่ยนแปลงที่อาจเกิดขึ้นในวงการฮาร์ดแวร์ AI พัฒนาการนี้อาจนำไปสู่ทางเลือกในการใช้งาน AI ที่มีราคาถูกลงและเข้าถึงได้ง่ายขึ้น โดยเฉพาะในตลาดจีน อย่างไรก็ตาม สิ่งสำคัญที่ต้องระบุคือการสาธิตในปัจจุบันยังจำกัดอยู่ที่โมเดลแบบ distilled และยังไม่มีการเปรียบเทียบประสิทธิภาพอย่างครอบคลุมกับโซลูชันของ AMD, Apple หรือ NVIDIA

ข่าวที่เกี่ยวข้อง

‌

‌
‌

‌

‌
‌

‌