Nvidia กำลังจะปฏิวัติวงการ AI ด้วยแพลตฟอร์ม Blackwell ที่กำลังจะมาถึง โดยแสดงให้เห็นถึงความก้าวหน้าอย่างก้าวกระโดดในเทคโนโลยี GPU และการประมวลผล AI ในขณะที่บริษัทเตรียมนำเสนอในงาน Hot Chips 2024 พวกเขาได้เปิดเผยภาพรวมของอนาคตของการประมวลผล AI ในศูนย์ข้อมูล
เทคโนโลยี NVIDIA Blackwell ที่แสดงในตู้เซิร์ฟเวอร์ล้ำสมัย |
Blackwell: มากกว่าแค่ GPU
Blackwell เป็นระบบนิเวศที่ครอบคลุมของฮาร์ดแวร์ที่มุ่งเน้น AI:
- Blackwell GPU: จุดศูนย์กลาง ประกอบด้วยทรานซิสเตอร์ 208 พันล้านตัวบนกระบวนการผลิต TSMC 4NP
- Grace CPU: โปรเซสเซอร์ ARM ที่ Nvidia ออกแบบเอง
- NVLink Switch Chip: ช่วยให้เชื่อมต่อ GPU ได้อย่างรวดเร็ว
- BlueField-3: หน่วยประมวลผลข้อมูลขั้นสูง
- ConnectX-7 และ ConnectX-8: การ์ดเชื่อมต่อเครือข่ายรุ่นถัดไป
- Spectrum-4 และ Quantum-3: สวิตช์เครือข่ายล้ำสมัย
ประสิทธิภาพและประสิทธิผลที่ไม่เคยมีมาก่อน
GPU Blackwell มีคุณสมบัติที่น่าประทับใจ:
- ประสิทธิภาพ AI แบบ FP4 20 Peta FLOPS
- แบนด์วิดท์หน่วยความจำ 8 TB/s ด้วยหน่วยความจำ HBM3e
- แบนด์วิดท์ NVLink แบบสองทิศทาง 1.8 TB/s
แนวทางที่เป็นนวัตกรรมของ Nvidia ในการรวม GPU สองตัวที่จำกัดด้วย reticle เข้าด้วยกันในแพ็คเกจเดียว ช่วยให้ได้ความหนาแน่นในการสื่อสาร ความหน่วง และประสิทธิภาพการใช้พลังงานที่เหมาะสมที่สุด
การเปรียบเทียบอย่างละเอียดของแพลตฟอร์มล่าสุดของ Nvidia รวมถึงข้อมูลจำเพาะของประสิทธิภาพที่เหนือกว่าของแพลตฟอร์ม Blackwell |
NVLink: กุญแจสำคัญสำหรับประสิทธิภาพ Multi-GPU
NVLink Switch ที่อัพเกรดแล้วเพิ่มแบนด์วิดท์ของแฟบริคเป็นสองเท่าเป็น 1.8 TB/s ช่วยให้สามารถสื่อสารระหว่าง GPU สูงสุด 72 ตัวใน GB200 NVL72 racks ได้อย่างราบรื่น ความก้าวหน้านี้มีความสำคัญอย่างยิ่งในการจัดการกับโมเดล AI ที่ซับซ้อนมากขึ้น เช่น Llama-3.1 ของ Meta ที่มีพารามิเตอร์ 405B
การบุกเบิกความแม่นยำแบบ FP4
ในครั้งแรกของโลก Nvidia ได้สาธิตการสร้างภาพ AI โดยใช้การคำนวณแบบ FP4 แสดงให้เห็นถึงศักยภาพของระบบ Quasar Quantization ของพวกเขา การค้นพบนี้ช่วยประหยัดแบนด์วิดท์ได้อย่างมีนัยสำคัญ ในขณะที่ยังคงรักษาคุณภาพของภาพให้เทียบเท่ากับโมเดล FP16
การเปรียบเทียบภาพที่สร้างโดย AI แสดงให้เห็นถึงความก้าวหน้าของความแม่นยำแบบ FP4 ของ Nvidia ในการสร้างภาพด้วย AI |
นวัตกรรมการระบายความร้อนด้วยของเหลว
Nvidia กำลังศึกษาวิธีการระบายความร้อนแบบ warm water direct-to-chip ซึ่งสัญญาว่าจะลดค่าใช้จ่ายด้านพลังงานของศูนย์ข้อมูลได้ถึง 28% วิธีการนี้ไม่เพียงแต่ปรับปรุงประสิทธิภาพการระบายความร้อน แต่ยังช่วยยืดอายุการใช้งานของเซิร์ฟเวอร์และเปิดโอกาสในการนำความร้อนกลับมาใช้ใหม่
AI สร้าง AI
ที่น่าสนใจที่สุดคือ Nvidia กำลังใช้ AI เพื่อปรับปรุงกระบวนการออกแบบชิป AI แบบ Generative กำลังถูกใช้ในการสร้างโค้ด Verilog ซึ่งอาจช่วยเร่งการพัฒนาสถาปัตยกรรม GPU ในอนาคต
ในขณะที่ Nvidia เตรียมส่งมอบ Blackwell ให้กับลูกค้าในช่วงปลายปีนี้ วงการเทคโนโลยีกำลังรอคอยผลกระทบของนวัตกรรมเหล่านี้ต่อวงการ AI อย่างใจจดใจจ่อ ด้วยผลิตภัณฑ์ต่อเนื่องอย่าง Blackwell Ultra, Rubin และ Rubin Ultra ที่กำลังจะมาถึง Nvidia ดูเหมือนจะพร้อมที่จะรักษาความเป็นผู้นำในการประมวลผล AI ต่อไปอีกหลายปี