ในการพัฒนาที่สำคัญในวงการ AI บริษัท Xai ได้เปิดตัว Grok 3 โดยอ้างว่าสามารถทำสถิติประสิทธิภาพที่ไม่เคยมีมาก่อน พร้อมกับก่อให้เกิดคำถามสำคัญเกี่ยวกับความปลอดภัยและความโปร่งใสของ AI ในวงการแบบจำลองภาษาขนาดใหญ่ที่กำลังพัฒนาอย่างรวดเร็ว
ความก้าวหน้าด้านประสิทธิภาพ
มีรายงานว่า Grok 3 ได้คะแนน Elo 1400 ในการทดสอบเกณฑ์มาตรฐาน ซึ่งสูงกว่าผู้นำในอุตสาหกรรมก่อนหน้านี้ แบบจำลองนี้แสดงให้เห็นถึงความสามารถที่เหนือกว่าในด้านการให้เหตุผลทางวิทยาศาสตร์ การเขียนโปรแกรม และการแก้ปัญหาที่ซับซ้อน โดยทำผลงานได้ดีกว่า Gemini 2 Pro และ GPT-4 ความสำเร็จนี้เกิดขึ้นหลังจากการพัฒนาเพียง 18 เดือน โดยได้รับการสนับสนุนจากโครงสร้างพื้นฐานด้านการประมวลผลขนาดใหญ่ที่ประกอบด้วย GPU H100 จำนวน 200,000 ตัว
เกณฑ์การวัดประสิทธิภาพ:
- คะแนน Elo: 1400
- โครงสร้างพื้นฐานการประมวลผล: GPU รุ่น H100 จำนวน 200,000 หน่วย
- ระยะเวลาในการพัฒนา: 18 เดือน
- ค่าสมาชิกรายเดือน: 49 ดอลลาร์สหรัฐสำหรับ Super Grok
นวัตกรรมทางเทคนิค
แบบจำลองนี้ได้นำเสนอกลไกการสะท้อนคิดแบบไดนามิกและเทคโนโลยีการให้เหตุผลแบบลูกโซ่ความคิด ช่วยให้สามารถแยกย่อยงานที่ซับซ้อนและแก้ไขช่องว่างทางตรรกะแบบเรียลไทม์ การสาธิตที่น่าสนใจแสดงให้เห็น Grok 3 สร้างเส้นทางการเดินทางของยานอวกาศจากโลกไปยังดาวอังคารในเวลาเพียง 30 วินาที พร้อมการคำนวณผลกระทบแรงโน้มถ่วงช่วยเหวี่ยง ระบบนี้ยังมีโหมด Big Brain ใหม่ที่ช่วยเพิ่มทรัพยากรการคำนวณและความสามารถในการให้เหตุผล
การเปรียบเทียบประสิทธิภาพ:
ประเภทการทดสอบ | Grok-3 Reasoning Beta | Grok-3 mini Reasoning | O3mini | O1 | DeepSeek-R1 |
---|---|---|---|---|---|
คณิตศาสตร์ | 91 | 96 | 87 | 83 | 80 |
การลงทุนด้านโครงสร้างพื้นฐาน
การขยายโครงสร้างพื้นฐานอย่างรวดเร็วของ Xai มีความสำคัญต่อการพัฒนา Grok 3 บริษัทได้สร้างศูนย์ข้อมูลขนาดใหญ่ในเมือง Memphis รัฐ Tennessee ซึ่งมี GPU Nvidia H100 จำนวน 100,000 ตัว การลงทุนครั้งใหญ่นี้ได้รับการสนับสนุนด้วยเงินทุน 6 พันล้านดอลลาร์สหรัฐ ถือเป็นหนึ่งในคลัสเตอร์การประมวลผล AI ที่ใหญ่ที่สุดในโลก
![]() |
---|
ศูนย์ข้อมูลแห่งใหม่ของ Xai ใน Memphis ซึ่งเป็นส่วนสำคัญของโครงสร้างพื้นฐานในการพัฒนา Grok 3 โดยมี Nvidia H100 GPU จำนวน 100,000 ตัว |
ความกังวลด้านความปลอดภัย
แม้จะมีความก้าวหน้าเหล่านี้ ผู้เชี่ยวชาญด้านความปลอดภัยทางไซเบอร์ได้แสดงความกังวลที่สำคัญเกี่ยวกับความปลอดภัยของแบบจำลอง AI The Hackers' Almanack ที่เผยแพร่ร่วมกับมหาวิทยาลัย Chicago เตือนว่าแนวปฏิบัติด้านความปลอดภัยในปัจจุบัน รวมถึงการทดสอบแบบ red-teaming ยังไม่เพียงพอที่จะป้องกันช่องโหว่ที่อาจเกิดขึ้น ซึ่งรวมถึงการโจมตีด้วยการแทรกคำสั่ง การรั่วไหลของข้อมูลส่วนบุคคล และการสร้างเนื้อหาที่เป็นอันตราย
กลยุทธ์ทางการตลาด
Xai ได้ประกาศแผนที่จะเปิดซอร์สโค้ดของ Grok 2 ภายในหนึ่งเดือน และได้เปิดตัวบริการ Super Grok ในราคา 49 ดอลลาร์สหรัฐต่อเดือน บริการนี้รวมถึงการเข้าถึงฟังก์ชัน DeepSearch ซึ่งท้าทายโดยตรงกับแบบจำลองแบบปิดของ OpenAI บริษัทยังมีแผนที่จะผสานรวม Grok 3 กับระบบยานยนต์ของ Tesla และหุ่นยนต์มนุษย์ Optimus เพื่อขยายการใช้งานในทางปฏิบัติ
ผลกระทบต่ออุตสาหกรรม
การพัฒนานี้ถือเป็นการเปลี่ยนแปลงครั้งสำคัญในพลวัตของอุตสาหกรรม AI ซึ่งอาจส่งผลต่อแนวทางการพัฒนาและการใช้งาน AI ในอนาคต การเน้นย้ำเรื่องการพัฒนาแบบเปิดเผยซอร์สโค้ดและความโปร่งใสอาจเปลี่ยนแปลงวิธีที่บริษัท AI จัดการกับการพัฒนาแบบจำลองและมาตรการด้านความปลอดภัยต่อไปในอนาคต