ตลาด GPU กำลังเผชิญกับความเปลี่ยนแปลงครั้งใหญ่เมื่อบริษัทสตาร์ทอัพ Bolt Graphics ปรากฏตัวพร้อมคำกล่าวอ้างที่น่าตื่นเต้นเกี่ยวกับแพลตฟอร์ม GPU Zeus ใหม่ที่ใช้ RISC-V เป็นพื้นฐาน ในอุตสาหกรรมที่ถูกครอบงำโดยผู้เล่นหลักสามราย—Nvidia, AMD และ Intel—บริษัทน้องใหม่จากแคลิฟอร์เนียนี้กำลังสัญญาว่าจะมอบประสิทธิภาพที่ไม่เคยมีมาก่อนในงานเฉพาะทาง โดยเฉพาะการเรนเดอร์แบบ path tracing ซึ่งอ้างว่ามีความเหนือกว่า GeForce RTX 5090 รุ่นธงของ Nvidia ถึง 10 เท่า
สถาปัตยกรรมปฏิวัติวงการบนพื้นฐาน RISC-V
Bolt Graphics ได้ใช้แนวทางที่แตกต่างอย่างสิ้นเชิงในการออกแบบ GPU ต่างจากสถาปัตยกรรมแบบกรรมสิทธิ์ที่ใช้โดยผู้เล่นรายใหญ่ GPU Zeus ถูกสร้างขึ้นบนสถาปัตยกรรมชุดคำสั่ง RISC-V แบบโอเพนซอร์ส มันประกอบด้วยคอร์สเกลาร์ RVA23 แบบ out-of-order ร่วมกับ FP64 ALUs และ RISC-V Vector Extension Version 1.0 ที่รองรับประเภทข้อมูลตั้งแต่ 8-bit ไปจนถึง 64-bit บริษัทยังได้พัฒนาส่วนขยายเฉพาะที่ออกแบบมาเพื่อเร่งความเร็วในงานวิทยาศาสตร์อีกด้วย
สิ่งที่ทำให้ Zeus น่าสนใจเป็นพิเศษคือการออกแบบแบบชิปเล็ต รุ่นเริ่มต้น Zeus 1c26-032 มีหน่วยประมวลผลเพียงหนึ่งหน่วย ในขณะที่รุ่นขั้นสูงกว่าอย่าง Zeus 2c26-064/128 และ Zeus 4c26-256 มีหน่วยประมวลผลสองและสี่หน่วยตามลำดับ แนวทางแบบโมดูลาร์นี้ช่วยให้ Bolt สามารถเพิ่มประสิทธิภาพได้อย่างมีนัยสำคัญในขณะที่ยังคงรักษาประสิทธิภาพการใช้พลังงาน
เชี่ยวชาญเฉพาะด้าน Path Tracing และการคำนวณทางวิทยาศาสตร์
Zeus ดูเหมือนจะถูกสร้างขึ้นมาเพื่อการเรนเดอร์แบบ path tracing และแอปพลิเคชันวิทยาศาสตร์ที่ต้องการการคำนวณสูงมากกว่าเกมแบบดั้งเดิม ต่างจาก GPU ทั่วไป Zeus ไม่มีฮาร์ดแวร์กราฟิกแบบ fixed-function ดั้งเดิมเช่น texture units (TMUs) และ raster operation units (ROPs) แต่อาศัย compute shaders สำหรับการสุ่มตัวอย่างพื้นผิวและการแสดงผลกราฟิก ทางเลือกในการออกแบบนี้จัดสรรพื้นที่ซิลิคอนให้กับองค์ประกอบการคำนวณมากขึ้น ซึ่งช่วยเพิ่มประสิทธิภาพ GPU สำหรับงานเป้าหมาย
เพื่อใช้ประโยชน์จากความสามารถของฮาร์ดแวร์ Bolt ได้พัฒนาเอนจิ้นเรนเดอร์แบบ path tracing ของตัวเองที่เรียกว่า Glowstick บริษัทอ้างว่าโซลูชันภายในบริษัทนี้ให้ประสิทธิภาพเร็วกว่าถึง 2.5 เท่าบนรุ่นชิปเดี่ยวเมื่อเทียบกับโซลูชันที่มีอยู่ โดยมีการปรับขนาดประสิทธิภาพที่ดีขึ้นอีกเมื่อใช้หลาย GPU
การอ้างสิทธิ์ด้านประสิทธิภาพและข้อมูลจำเพาะ
ตามข้อมูลจาก Bolt Graphics แม้แต่รุ่นเริ่มต้นชิปเล็ตเดี่ยว Zeus 1c26-32 ก็ยังมีประสิทธิภาพเหนือกว่า GeForce RTX 5090 ของ Nvidia อย่างมีนัยสำคัญในการคำนวณ FP64 (5 TFLOPS เทียบกับ 1.6 TFLOPS) และ path tracing (77 Gigarays เทียบกับ 32 Gigarays) นอกจากนี้ Zeus ยังมีแคชบนชิปขนาดใหญ่กว่า (128 MB เทียบกับ 120 MB) ในขณะที่ใช้พลังงานน้อยกว่ามาก (120W เทียบกับ 575W)
อย่างไรก็ตาม RTX 5090 ยังคงมีข้อได้เปรียบที่ชัดเจนในงาน AI ด้วย 105 FP16 TFLOPS และ 1,637 INT8 TFLOPS เมื่อเทียบกับ Zeus ที่มี 10 FP16 TFLOPS และ 614 INT8 TFLOPS สำหรับงานเรนเดอร์แบบดั้งเดิมที่วัดในประสิทธิภาพ FP32 Zeus จะล้าหลัง RTX 5090 ที่มี 105 TFLOPS อย่างมากด้วยเพียง 10 TFLOPS
การกำหนดค่า Zeus ที่ทรงพลังที่สุด คือ quad-chiplet 4c26-256 ถูกออกแบบมาสำหรับการใช้งานในเซิร์ฟเวอร์มากกว่าเป็นการ์ดแยก มันรวมหน่วยประมวลผลสี่หน่วย, ชิปเล็ต I/O สี่ตัว, หน่วยความจำ LPDDR5X 256 GB และรองรับหน่วยความจำ DDR5 สูงสุด 2 TB รุ่นนี้ได้รับการปรับแต่งเป็นพิเศษสำหรับการจำลองสนามแม่เหล็กไฟฟ้า, การวิจัยด้านโฟโทนิกส์ และการคำนวณ FFT
การกำหนดค่า Zeus GPU
รุ่น | หน่วยประมวลผล | หน่วยความจำ | การใช้พลังงาน |
---|---|---|---|
Zeus 1c26-032 | 1 | 32 GB LPDDR5X + สูงสุดถึง 128 GB DDR5 | 120W |
Zeus 2c26-064/128 | 2 | 64/128 GB LPDDR5X | ไม่ระบุ |
Zeus 4c26-256 | 4 | 256 GB LPDDR5X + สูงสุดถึง 2 TB DDR5 | น้อยกว่า 575W |
การเปรียบเทียบประสิทธิภาพ (Zeus ชิปเดี่ยว เทียบกับ RTX 5090)
เมตริก | Zeus 1c26-32 | RTX 5090 |
---|---|---|
Path Tracing | 77 Gigarays | 32 Gigarays |
การคำนวณ FP64 | 5 TFLOPS | 1.6 TFLOPS |
การคำนวณ FP32 | 10 TFLOPS | 105 TFLOPS |
การคำนวณ FP16 | 10 TFLOPS | 105 TFLOPS |
การคำนวณ INT8 | 614 TFLOPS | 1,637 TFLOPS |
แคชบนชิป | 128 MB | 120 MB |
การใช้พลังงาน | 120W | 575W |
นวัตกรรมด้านหน่วยความจำและการเชื่อมต่อ
Zeus ใช้แนวทางที่ไม่เหมือนใครสำหรับสถาปัตยกรรมหน่วยความจำ โดยให้ความสำคัญกับความจุมากกว่าแบนด์วิดท์เพื่อจัดการชุดข้อมูลขนาดใหญ่ รุ่นเริ่มต้นรวมหน่วยความจำ LPDDR5X 32 GB ที่ 273 GB/s กับหน่วยความจำ DDR5 สูงสุด 128 GB ผ่าน SO-DIMMs สองตัวที่ 80 GB/s ระบบหน่วยความจำแบบไฮบริดนี้อาจให้ข้อได้เปรียบที่สำคัญสำหรับการจำลองและงานเรนเดอร์ขนาดใหญ่
อีกคุณสมบัติที่โดดเด่นคือความสามารถในการเชื่อมต่อเครือข่ายในตัวของ Zeus แต่ละ GPU มีชิปเล็ต I/O พร้อมพอร์ต QSFP-DD ที่รองรับ 400GbE/800GbE, สล็อต PCIe Gen5 x16 สองสล็อตพร้อม CXL 3.0 (ช่วยให้การแบ่งปันหน่วยความจำระหว่างการ์ดหลายใบมีประสิทธิภาพ) และพอร์ต GbE สำหรับ BMC คุณสมบัติด้านเครือข่ายเหล่านี้แสดงให้เห็นชัดเจนว่า Zeus มุ่งเน้นไปที่แอปพลิเคชันศูนย์ข้อมูลที่ GPU หลายตัวต้องสื่อสารกันอย่างมีประสิทธิภาพ
ความท้าทายของระบบนิเวศซอฟต์แวร์
แม้จะมีข้อมูลจำเพาะด้านฮาร์ดแวร์ที่น่าประทับใจ Bolt Graphics ก็ยังเผชิญกับความท้าทายที่สำคัญในการสนับสนุนซอฟต์แวร์ ไม่เหมือนกับระบบนิเวศ CUDA ที่เติบโตเต็มที่ของ Nvidia หรือ ROCm ของ AMD, Zeus ยังขาดแพลตฟอร์มซอฟต์แวร์ที่เป็นที่ยอมรับ แม้ว่าพื้นฐาน RISC-V อาจช่วยให้สามารถใช้ประโยชน์จากเครื่องมือและไลบรารีโอเพนซอร์สที่มีอยู่ได้ แต่การยอมรับอย่างแพร่หลายจะขึ้นอยู่กับความสามารถของ Bolt ในการให้การสนับสนุนนักพัฒนาที่แข็งแกร่ง
ยังไม่ชัดเจนว่า Zeus จะสนับสนุนเฟรมเวิร์กมาตรฐานอุตสาหกรรมเช่น OpenCL, Vulkan หรือเลเยอร์แปลง CUDA หรือไม่—ซึ่งเป็นองค์ประกอบสำคัญสำหรับการได้รับแรงดึงดูดในตลาดการคำนวณระดับมืออาชีพและวิทยาศาสตร์ เอนจิ้น path tracing Glowstick ภายในบริษัทแสดงให้เห็นถึงความหวัง แต่ความเข้ากันได้ของซอฟต์แวร์ที่กว้างขวางจะเป็นสิ่งสำคัญสำหรับความสำเร็จ
ตำแหน่งทางการตลาดและความพร้อมใช้งาน
Bolt Graphics กำลังมุ่งเป้าไปที่ตลาดการเรนเดอร์ระดับมืออาชีพและการคำนวณทางวิทยาศาสตร์มากกว่าเกมสำหรับผู้บริโภค บริษัทวางแผนที่จะเปิดตัวชุดพัฒนาสำหรับนักพัฒนาในช่วงปลายปี 2025 โดยมีกำหนดการผลิตเต็มรูปแบบในช่วงปลายปี 2026 ไทม์ไลน์นี้ให้เวลานักพัฒนาซอฟต์แวร์ในการปรับแอปพลิเคชันของพวกเขาให้เข้ากับสถาปัตยกรรมใหม่
แม้ว่า Zeus อาจไม่ท้าทาย Nvidia ในตลาดเกม แต่การมุ่งเน้นเฉพาะด้าน path tracing และการคำนวณทางวิทยาศาสตร์อาจสร้างตลาดเฉพาะกลุ่มที่มีคุณค่าได้ หากบริษัทสามารถส่งมอบตามสัญญาด้านประสิทธิภาพและพัฒนาการสนับสนุนซอฟต์แวร์ที่เพียงพอ Zeus อาจกลายเป็นทางเลือกที่น่าสนใจสำหรับแอปพลิเคชันการคำนวณประสิทธิภาพสูงเฉพาะทาง โดยเฉพาะอย่างยิ่งที่เกี่ยวข้องกับฟาร์มเรนเดอร์และการจำลองทางวิทยาศาสตร์