AMD เปิดตัวสถาปัตยกรรม RDNA 4 และเทคโนโลยีการอัปสเกล FSR 4 สำหรับซีรีส์ Radeon RX 9000

BigGo Editorial Team
AMD เปิดตัวสถาปัตยกรรม RDNA 4 และเทคโนโลยีการอัปสเกล FSR 4 สำหรับซีรีส์ Radeon RX 9000

AMD ได้เปิดเผยสถาปัตยกรรมกราฟิกรุ่นถัดไป โดยเผยรากฐานทางเทคนิคที่จะขับเคลื่อน Radeon RX 9000 ซีรีส์ที่กำลังจะมาถึง สถาปัตยกรรม RDNA 4 แสดงถึงวิวัฒนาการที่สำคัญในปรัชญาการออกแบบ GPU ของ AMD โดยมุ่งเน้นที่ประสิทธิภาพการเล่นเกมควบคู่ไปกับการปรับปรุงความสามารถในการติดตามรังสี (ray tracing) และการประมวลผล AI อย่างมีนัยสำคัญ

สถาปัตยกรรมที่เน้นเกมเป็นอันดับแรก

RDNA 4 ของ AMD ได้รับการออกแบบตั้งแต่เริ่มต้นโดยมีนักเล่นเกมเป็นกลุ่มเป้าหมายหลัก ต่างจากรุ่นก่อนหน้าที่พยายามสร้างความสมดุลระหว่างการเล่นเกมกับงานระดับมืออาชีพ RDNA 4 มุ่งเน้นเฉพาะประสิทธิภาพการเล่นเกมระดับสูง สถาปัตยกรรมนี้แนะนำหน่วยคำนวณที่ได้รับการปรับแต่งอย่างมากซึ่งให้การปรับปรุงประสิทธิภาพการแรสเตอร์ไรเซชันสูงถึง 2 เท่าเมื่อเทียบกับ RDNA 2 พร้อมกับการเพิ่มประสิทธิภาพที่มากขึ้นในงานเฉพาะทางเช่น ray tracing (2.5 เท่า) และการเรียนรู้ของเครื่อง (3.5 เท่า) ต่อหน่วยคำนวณ

การปรับปรุงที่สำคัญของ RDNA 4

  • การประมวลผลภาพแบบแรสเตอร์: เพิ่มประสิทธิภาพได้มากถึง 2 เท่าเมื่อเทียบกับ RDNA 2 ต่อหน่วยประมวลผล
  • เรย์เทรซซิ่ง: เพิ่มประสิทธิภาพได้มากถึง 2.5 เท่าเมื่อเทียบกับ RDNA 2 ต่อหน่วยประมวลผล
  • ประสิทธิภาพการเรียนรู้ของเครื่อง: เพิ่มประสิทธิภาพได้มากถึง 3.5 เท่าในงานเมทริกซ์หนาแน่น FP16 เมื่อเทียบกับ RDNA 2 ต่อหน่วยประมวลผล
  • การเดินทางของรังสี: ประสิทธิภาพเพิ่มขึ้น 2 เท่าเมื่อเทียบกับ RDNA 3 ที่ความเร็วนาฬิกาเท่ากัน
  • ความต้องการหน่วยความจำ BVH: ลดลงเหลือน้อยกว่า 60% เมื่อเทียบกับ RDNA 3

การออกแบบ Compute Engine ใหม่

หัวใจของ RDNA 4 คือ Compute Engine ที่ได้รับการออกแบบใหม่ซึ่งมี Dual SIMD32 Vector Units และ Enhanced Matrix Operations หน่วยเหล่านี้รองรับรูปแบบความแม่นยำหลากหลายรวมถึง 2x-16b และ 4x-8b/4b dense matrix rates พร้อมด้วย 4:2 Structured Sparsity สำหรับอัตราการประมวลผลที่เพิ่มขึ้นเป็นสองเท่า นวัตกรรมที่โดดเด่นคือระบบการจัดสรรรีจิสเตอร์แบบไดนามิก ซึ่งช่วยให้เชดเดอร์สามารถขอรีจิสเตอร์จากพูลที่ใช้ร่วมกันตามความจำเป็นและปล่อยคืนเมื่อทำงานเสร็จสิ้น วิธีการนี้ช่วยปรับปรุงการจัดการความล่าช้าของหน่วยความจำและเพิ่มประสิทธิภาพโดยรวมของคอร์ที่ใช้ร่วมกัน

Ray Tracing รุ่นที่สาม

การปรับปรุงที่น่าประทับใจที่สุดอาจอยู่ในส่วนของ ray tracing ซึ่ง AMD ได้ใช้หน่วย ray tracing รุ่นที่สามที่เพิ่มอัตราการตัดกันของรังสีเป็นสองเท่าเมื่อเทียบกับ RDNA 3 ที่ความเร็วนาฬิกาและแบนด์วิดท์เท่ากัน ตัวเร่งความเร็วรังสีรุ่นใหม่มีการบีบอัด BVH (Bounding Volume Hierarchy) ที่ปรับปรุงแล้วซึ่งลดความต้องการหน่วยความจำเหลือน้อยกว่า 60% ของสิ่งที่ RDNA 3 ต้องการ ด้วยการออกแบบแบบ 8-wide ใหม่ การปรับปรุงเพิ่มเติมรวมถึงการแปลงอินสแตนซ์ฮาร์ดแวร์ การจัดการสแต็ค RT ที่ดีขึ้น และ Oriented Bounding Boxes ที่สามารถลดต้นทุนการทราเวอร์ซัลได้ถึง 10%

ความสามารถในการติดตามเส้นทาง (Path Tracing)

AMD ยังวางตำแหน่ง RDNA 4 สำหรับอนาคตของการเรนเดอร์ด้วยการสนับสนุน path tracing ในขณะที่ ray tracing ส่งรังสีหลักเดี่ยวสำหรับการสะท้อน เงา และการหักเห path tracing คำนึงถึงเส้นทางแสงที่เป็นไปได้ทั้งหมด สร้างฉากที่สมจริงมากขึ้นด้วยต้นทุนการคำนวณที่สูงขึ้น เพื่อให้สิ่งนี้เป็นไปได้ในทางปฏิบัติ AMD กำลังใช้เทคนิค Neural Supersampling และ Denoising ที่ปรับให้เหมาะสำหรับงาน path tracing โดยเฉพาะ คล้ายกับวิธีการของ NVIDIA กับเกมเช่น Cyberpunk 2077 และ Alan Wake II

FSR 4: โซลูชันการอัปสเกลขับเคลื่อนด้วย AI ของ AMD

ควบคู่ไปกับการประกาศฮาร์ดแวร์ AMD ได้เปิดเผย FSR 4 เทคโนโลยีการอัปสเกลรุ่นถัดไป ต่างจาก FSR รุ่นก่อนหน้าที่ใช้อัลกอริธึมเชิงพื้นที่หรือเชิงเวลา FSR 4 ใช้ประโยชน์จากการเรียนรู้ของเครื่องผ่านความสามารถในการประมวลผล FP8 ใหม่ใน RDNA 4 การสาธิตเบื้องต้นที่ CES แสดงให้เห็นถึงการปรับปรุงที่สำคัญเมื่อเทียบกับ FSR 3.1 โดยเฉพาะในโหมดประสิทธิภาพที่รุ่นก่อนหน้ามีปัญหาเรื่องคุณภาพของภาพที่ความละเอียดการเรนเดอร์ต่ำ

การเปรียบเทียบวิธีการ upscaling ที่แสดงให้เห็นถึงการปรับปรุงที่นำเสนอด้วยเทคโนโลยี FSR 4 ของ AMD
การเปรียบเทียบวิธีการ upscaling ที่แสดงให้เห็นถึงการปรับปรุงที่นำเสนอด้วยเทคโนโลยี FSR 4 ของ AMD

การใช้งานและประสิทธิภาพของ FSR 4

ในช่วงเปิดตัว FSR 4 จะถูกรวมเข้ากับระดับไดรเวอร์ อัพเกรดเกมใดก็ตามที่รองรับ FSR 3.1 โดยอัตโนมัติให้ใช้อัลกอริธึมการอัปสเกลที่ใช้ AI ใหม่ AMD อ้างว่า FSR 4 ในโหมดประสิทธิภาพให้ประสิทธิภาพเพิ่มขึ้น 65% เมื่อเทียบกับการเรนเดอร์ 4K แบบเนทีฟในเกมที่ทดสอบเจ็ดเกม โดยบางเกมเช่น Ratchet & Clank: Rift Apart มีประสิทธิภาพเพิ่มขึ้นเป็นสองเท่า เทคโนโลยีนี้จะมีให้ใช้งานในเกมมากกว่า 30 เกมในช่วงเปิดตัว รวมถึงเกมสำคัญๆ เช่น Kingdom Come: Deliverance 2, Spider-Man 2 และ Call of Duty: Black Ops 6

ข้อมูลประสิทธิภาพของ FSR 4

  • โดยรวม: เพิ่มประสิทธิภาพขึ้น 65% เมื่อเทียบกับการเรนเดอร์แบบเนทีฟ 4K (เฉลี่ยจาก 7 เกม)
  • Ratchet & Clank: Rift Apart: เพิ่มประสิทธิภาพ 100% (เร็วขึ้น 2 เท่า)
  • Horizon Zero Dawn Remastered: เพิ่มประสิทธิภาพ 38%
  • รองรับเกมตั้งแต่เปิดตัว: มากกว่า 30 เกม รวมถึง Kingdom Come: Deliverance 2, Spider-Man 2 และ Call of Duty: Black Ops 6

ข้อมูลจำเพาะของฮาร์ดแวร์

GPU RDNA 4 รุ่นเรือธง รหัส Navi 48 มีทรานซิสเตอร์ 53.9 พันล้านตัวบนไดขนาด 356.5 ตร.มม. ผลิตโดยใช้กระบวนการ 4nm ของ TSMC ชิปนี้มีเอนจิ้นเชดเดอร์สี่ตัว แต่ละตัวมี Dual Compute Units (DCUs) แปดตัว รวมทั้งหมด 64 Compute Units และสตรีมโปรเซสเซอร์ 4,096 ตัว สถาปัตยกรรมนี้มีเอนจิ้น Ray Accelerator 64 ตัวและ Matrix Acceleration Engines 128 ตัวกระจายอยู่ทั่วเอนจิ้นเชดเดอร์ การรองรับหน่วยความจำรวมถึงหน่วยความจำ GDDR6 สูงถึง 16GB ที่ความเร็วสูงถึง 20 Gbps บนอินเทอร์เฟซบัส 256 บิต เสริมด้วย Infinity Cache รุ่นที่สามสูงถึง 64MB

ข้อมูลจำเพาะของ Navi 48 (RX 9070 XT)

  • กระบวนการผลิต: TSMC 4nm
  • จำนวนทรานซิสเตอร์: 53.9 พันล้านตัว
  • ขนาดไดอ์: 356.5 ตารางมิลลิเมตร
  • หน่วยประมวลผล: 64 CUs (4,096 สตรีมโปรเซสเซอร์)
  • ตัวเร่งการประมวลผลเรย์เทรซซิ่ง: 64 RAs
  • เอนจินเร่งการคำนวณเมทริกซ์: 128 MAs
  • หน่วยความจำ: สูงสุด 16GB GDDR6 ที่ความเร็ว 20 Gbps
  • บัสหน่วยความจำ: 256-bit
  • Infinity Cache: สูงสุด 64MB (รุ่นที่ 3)

การปรับปรุงสื่อและการแสดงผล

RDNA 4 ยังนำมาซึ่งการปรับปรุงความสามารถในการเข้ารหัสและถอดรหัสสื่อ โดยมีคุณภาพการเข้ารหัส AVC/H.264 ดีขึ้นถึง 25% คุณภาพการเข้ารหัส HEVC ดีขึ้น 11% และปริมาณงาน AV1 เพิ่มขึ้นเป็นสองเท่า Radiance Display Engine ที่อัปเดตรองรับเอาต์พุต DisplayPort 2.1a และ HDMI 2.1b ในขณะที่โหมด FreeSync Power Optimization ที่ปรับปรุงแล้วให้การใช้พลังงานขณะไม่ได้ใช้งานที่ต่ำลงในการกำหนดค่าหลายจอแสดงผล AMD ยังได้แนะนำ Radeon Image Sharpening 2 ซึ่งทำงานกับ API ทั้งหมดผ่านการสลับเพียงครั้งเดียวเพื่อให้ภาพที่มีคุณภาพสูงขึ้น

เส้นทางข้างหน้า

ในขณะที่ AMD ก้าวหน้าอย่างมีนัยสำคัญด้วย RDNA 4 และ FSR 4 แต่ยังคงมีความท้าทายในการแข่งขันกับระบบนิเวศที่มั่นคงของ NVIDIA การปรับปรุงคุณภาพของ FSR 4 มีแนวโน้มที่ดี แต่เทคโนโลยีนี้เริ่มต้นด้วยช่องว่างที่สำคัญที่ต้องปิดเมื่อเทียบกับ DLSS 4 ของ NVIDIA ซึ่งรองรับเกมมากกว่า 70 เกมแล้ว เพื่อให้ FSR 4 ประสบความสำเร็จในระยะยาว AMD จะต้องมุ่งมั่นอย่างแน่วแน่ในการขยายการสนับสนุนเกมและปรับปรุงคุณภาพของอัลกอริธึมอย่างต่อเนื่อง อย่างไรก็ตาม RDNA 4 ถือเป็นสถาปัตยกรรมเกมที่มุ่งเน้นมากที่สุดของ AMD จนถึงปัจจุบัน ด้วยการปรับปรุงที่สำคัญทั้งในด้านการแรสเตอร์ไรเซชัน ray tracing และการประมวลผล AI ซึ่งควรทำให้ Radeon RX 9000 ซีรีส์มีความสามารถในการแข่งขันในตลาดเกมระดับไฮเอนด์