Grok 3 ของ Xai อ้างว่าเป็นผู้นำด้านประสิทธิภาพ AI พร้อมกับปลุกประเด็นด้านความปลอดภัย

BigGo Editorial Team

Grok 3 ของ Xai อ้างว่าเป็นผู้นำด้านประสิทธิภาพ AI พร้อมกับปลุกประเด็นด้านความปลอดภัย

ในการพัฒนาที่สำคัญในวงการ AI บริษัท Xai ได้เปิดตัว Grok 3 โดยอ้างว่าสามารถทำสถิติประสิทธิภาพที่ไม่เคยมีมาก่อน พร้อมกับก่อให้เกิดคำถามสำคัญเกี่ยวกับความปลอดภัยและความโปร่งใสของ AI ในวงการแบบจำลองภาษาขนาดใหญ่ที่กำลังพัฒนาอย่างรวดเร็ว

ความก้าวหน้าด้านประสิทธิภาพ

มีรายงานว่า Grok 3 ได้คะแนน Elo 1400 ในการทดสอบเกณฑ์มาตรฐาน ซึ่งสูงกว่าผู้นำในอุตสาหกรรมก่อนหน้านี้ แบบจำลองนี้แสดงให้เห็นถึงความสามารถที่เหนือกว่าในด้านการให้เหตุผลทางวิทยาศาสตร์ การเขียนโปรแกรม และการแก้ปัญหาที่ซับซ้อน โดยทำผลงานได้ดีกว่า Gemini 2 Pro และ GPT-4 ความสำเร็จนี้เกิดขึ้นหลังจากการพัฒนาเพียง 18 เดือน โดยได้รับการสนับสนุนจากโครงสร้างพื้นฐานด้านการประมวลผลขนาดใหญ่ที่ประกอบด้วย GPU H100 จำนวน 200,000 ตัว

เกณฑ์การวัดประสิทธิภาพ:

คะแนน Elo: 1400
โครงสร้างพื้นฐานการประมวลผล: GPU รุ่น H100 จำนวน 200,000 หน่วย
ระยะเวลาในการพัฒนา: 18 เดือน
ค่าสมาชิกรายเดือน: 49 ดอลลาร์สหรัฐสำหรับ Super Grok

นวัตกรรมทางเทคนิค

แบบจำลองนี้ได้นำเสนอกลไกการสะท้อนคิดแบบไดนามิกและเทคโนโลยีการให้เหตุผลแบบลูกโซ่ความคิด ช่วยให้สามารถแยกย่อยงานที่ซับซ้อนและแก้ไขช่องว่างทางตรรกะแบบเรียลไทม์ การสาธิตที่น่าสนใจแสดงให้เห็น Grok 3 สร้างเส้นทางการเดินทางของยานอวกาศจากโลกไปยังดาวอังคารในเวลาเพียง 30 วินาที พร้อมการคำนวณผลกระทบแรงโน้มถ่วงช่วยเหวี่ยง ระบบนี้ยังมีโหมด Big Brain ใหม่ที่ช่วยเพิ่มทรัพยากรการคำนวณและความสามารถในการให้เหตุผล

การเปรียบเทียบประสิทธิภาพ:

ประเภทการทดสอบ	Grok-3 Reasoning Beta	Grok-3 mini Reasoning	O3mini	O1	DeepSeek-R1
คณิตศาสตร์	91	96	87	83	80

การลงทุนด้านโครงสร้างพื้นฐาน

การขยายโครงสร้างพื้นฐานอย่างรวดเร็วของ Xai มีความสำคัญต่อการพัฒนา Grok 3 บริษัทได้สร้างศูนย์ข้อมูลขนาดใหญ่ในเมือง Memphis รัฐ Tennessee ซึ่งมี GPU Nvidia H100 จำนวน 100,000 ตัว การลงทุนครั้งใหญ่นี้ได้รับการสนับสนุนด้วยเงินทุน 6 พันล้านดอลลาร์สหรัฐ ถือเป็นหนึ่งในคลัสเตอร์การประมวลผล AI ที่ใหญ่ที่สุดในโลก


ศูนย์ข้อมูลแห่งใหม่ของ Xai ใน Memphis ซึ่งเป็นส่วนสำคัญของโครงสร้างพื้นฐานในการพัฒนา Grok 3 โดยมี Nvidia H100 GPU จำนวน 100,000 ตัว

ความกังวลด้านความปลอดภัย

แม้จะมีความก้าวหน้าเหล่านี้ ผู้เชี่ยวชาญด้านความปลอดภัยทางไซเบอร์ได้แสดงความกังวลที่สำคัญเกี่ยวกับความปลอดภัยของแบบจำลอง AI The Hackers' Almanack ที่เผยแพร่ร่วมกับมหาวิทยาลัย Chicago เตือนว่าแนวปฏิบัติด้านความปลอดภัยในปัจจุบัน รวมถึงการทดสอบแบบ red-teaming ยังไม่เพียงพอที่จะป้องกันช่องโหว่ที่อาจเกิดขึ้น ซึ่งรวมถึงการโจมตีด้วยการแทรกคำสั่ง การรั่วไหลของข้อมูลส่วนบุคคล และการสร้างเนื้อหาที่เป็นอันตราย

กลยุทธ์ทางการตลาด

Xai ได้ประกาศแผนที่จะเปิดซอร์สโค้ดของ Grok 2 ภายในหนึ่งเดือน และได้เปิดตัวบริการ Super Grok ในราคา 49 ดอลลาร์สหรัฐต่อเดือน บริการนี้รวมถึงการเข้าถึงฟังก์ชัน DeepSearch ซึ่งท้าทายโดยตรงกับแบบจำลองแบบปิดของ OpenAI บริษัทยังมีแผนที่จะผสานรวม Grok 3 กับระบบยานยนต์ของ Tesla และหุ่นยนต์มนุษย์ Optimus เพื่อขยายการใช้งานในทางปฏิบัติ

ผลกระทบต่ออุตสาหกรรม

การพัฒนานี้ถือเป็นการเปลี่ยนแปลงครั้งสำคัญในพลวัตของอุตสาหกรรม AI ซึ่งอาจส่งผลต่อแนวทางการพัฒนาและการใช้งาน AI ในอนาคต การเน้นย้ำเรื่องการพัฒนาแบบเปิดเผยซอร์สโค้ดและความโปร่งใสอาจเปลี่ยนแปลงวิธีที่บริษัท AI จัดการกับการพัฒนาแบบจำลองและมาตรการด้านความปลอดภัยต่อไปในอนาคต

ข่าวที่เกี่ยวข้อง

‌

‌
‌

‌

‌
‌

‌