AMD ได้ทำการเปลี่ยนแปลงสถาปัตยกรรมที่สำคัญในโปรเซสเซอร์ Zen 4 ผ่านการอัปเดตไมโครโค้ด AGESA ล่าสุด ซึ่งแสดงให้เห็นถึงความพยายามในการปรับปรุงประสิทธิภาพสถาปัตยกรรมโปรเซสเซอร์อย่างต่อเนื่อง การเปลี่ยนแปลงนี้เกี่ยวข้องกับการปิดการใช้งานฟีเจอร์ Loop Buffer ซึ่งเดิมถูกออกแบบมาเพื่อเพิ่มประสิทธิภาพของซีพียู แต่กลับพบว่าให้ผลกระทบน้อยกว่าที่คาดการณ์ไว้
ทำความเข้าใจการถอด Loop Buffer
ฟีเจอร์ Loop Buffer เดิมถูกรวมเข้ากับซีพียู Zen 4 ในฐานะส่วนประกอบหน่วยความจำพิเศษที่ออกแบบมาเพื่อจัดการกับลำดับคำสั่งที่ทำซ้ำ ผ่านการอัปเดต AGESA เวอร์ชัน 1.2.0.2a AMD ได้ปิดการใช้งานฟีเจอร์นี้ในโปรเซสเซอร์ Zen 4 ทั้งหมด รวมถึงซีรีส์ Ryzen 7000 และโปรเซสเซอร์เซิร์ฟเวอร์ Epyc การเปลี่ยนแปลงนี้ถูกค้นพบครั้งแรกโดย Chips and Cheese ระหว่างการทดสอบ Ryzen 9 7950X3D บนเมนบอร์ด ASRock B650 PG Lightning
การเปรียบเทียบเวอร์ชัน BIOS:
- เวอร์ชันเก่า: BIOS 1.21 ( AGESA 1.0.0.6) - เปิดใช้งาน Loop Buffer
- เวอร์ชันปัจจุบัน: BIOS 3.10 ( AGESA 1.2.0.2a) - ปิดการใช้งาน Loop Buffer
ผลกระทบทางเทคนิคและประสิทธิภาพ
การถอด Loop Buffer ออกแสดงให้เห็นผลกระทบต่อประสิทธิภาพโดยรวมของโปรเซสเซอร์น้อยมาก เนื่องจากการมีอยู่ของ Op Cache ซึ่งจัดการงานเดียวกันที่ Loop Buffer ถูกออกแบบมาได้อย่างมีประสิทธิภาพ Op Cache หรือ micro-op cache ที่มีอยู่ในสถาปัตยกรรม Zen สามารถให้แบนด์วิดธ์และความสามารถที่เพียงพอในการรักษาระดับประสิทธิภาพที่เหมาะสมโดยไม่จำเป็นต้องใช้ฟีเจอร์ Loop Buffer เพิ่มเติม
ผลการทดสอบประสิทธิภาพ
การทดสอบเบนช์มาร์กอย่างละเอียดแสดงให้เห็นผลกระทบต่อประสิทธิภาพเพียงเล็กน้อยจากการเปลี่ยนแปลงนี้ การทดสอบโดยใช้ SPEC CPU2017 แสดงความแตกต่างของประสิทธิภาพน้อยกว่า 1% ทั้งในการประมวลผลแบบ integer และ floating-point ในขณะที่การทดสอบเกม Cyberpunk 2077 ไม่แสดงผลกระทบเมื่อทำงานบนไดว์ V-Cache แต่พบความแตกต่างของประสิทธิภาพประมาณ 5% บนไดว์ที่ไม่ใช่ V-Cache อย่างไรก็ตามสิ่งนี้ไม่ส่งผลกระทบอย่างมีนัยสำคัญต่อการใช้งานจริง
ผลกระทบต่อประสิทธิภาพ:
- SPEC CPU2017: ประสิทธิภาพแตกต่างน้อยกว่า 1%
- Cyberpunk 2077 บนไดที่มี V-Cache: ไม่มีผลกระทบ
- Cyberpunk 2077 บนไดที่ไม่มี V-Cache: ประสิทธิภาพลดลง 5%
นัยสำคัญในอนาคต
การตัดสินใจถอดฟีเจอร์ Loop Buffer ของ AMD ดูเหมือนจะเป็นการมองการณ์ไกล เนื่องจากสถาปัตยกรรม Zen 5 ที่กำลังจะมาถึงได้ถูกออกแบบมาโดยไม่มีส่วนประกอบนี้ ต่างจากคู่แข่งอย่าง Intel และ Arm ที่ประสบความสำเร็จในการใช้ฟีเจอร์ที่คล้ายคลึงกัน AMD พบว่าการนำไปใช้ของพวกเขาไม่ได้ให้ประโยชน์ตามที่คาดหวัง ส่วนใหญ่เป็นเพราะเอกสารประกอบและการปรับแต่งสำหรับนักพัฒนาที่ไม่เพียงพอ บริษัทจึงเลือกที่จะพึ่งพากลไก Op Cache ที่พิสูจน์แล้วว่าใช้ได้ดีในการจัดการลูปคำสั่งอย่างมีประสิทธิภาพ