DeepSeek ได้เปิดตัวระบบไฟล์ Fire-Flyer File System (3FS) ซึ่งเป็นระบบไฟล์แบบกระจายที่มีประสิทธิภาพสูง ออกแบบมาเฉพาะสำหรับการทำงานด้านการเทรนและการอนุมานของ AI ระบบนี้ได้รับการพัฒนามาตั้งแต่ปี 2019 โดยเริ่มแรกถูกสร้างขึ้นสำหรับแอปพลิเคชันการซื้อขายความถี่สูง และตอนนี้ได้รับการปรับให้เหมาะกับรูปแบบการเข้าถึงข้อมูลที่เฉพาะเจาะจงของการเทรน AI ในระดับใหญ่
ประสิทธิภาพที่โดดเด่นสำหรับการอ่านแบบสุ่ม
3FS มีประสิทธิภาพที่น่าทึ่ง โดยการทดสอบเบนช์มาร์กแสดงให้เห็นว่ามีความเร็วในการอ่านประมาณ 6.6 TiB/s บนคลัสเตอร์ของโหนดจัดเก็บข้อมูล 180 โหนด ระดับประสิทธิภาพนี้เหนือกว่าระบบไฟล์แบบกระจายแบบดั้งเดิมอย่าง Ceph อย่างมีนัยสำคัญ ซึ่งเพิ่งฉลองความสำเร็จที่ 1 TiB/s ระบบนี้ถูกออกแบบมาโดยเฉพาะสำหรับรูปแบบการอ่านแบบสุ่มที่พบบ่อยในงานเทรน AI ซึ่งกลไกแคชแบบดั้งเดิมให้ประโยชน์เพียงเล็กน้อย
สำหรับผู้ที่สนใจ การออกแบบนี้ได้รับการเผยแพร่ครั้งแรกที่นี่... ระบบไฟล์นี้ได้รับการพัฒนาและใช้งานโดยพวกเขามาหลายปีแล้ว เมื่อเทียบกับระบบไฟล์แบบดั้งเดิม ระบบนี้มุ่งเน้นไปที่การเทรนโมเดลที่มีการอ่านแบบสุ่มจำนวนมาก การแคชการอ่านและการอ่านล่วงหน้าไม่มีประโยชน์ในกรณีนี้
สิ่งที่ทำให้ 3FS มีความพิเศษคือการตั้งใจละเว้นการแคชการอ่านและการอ่านล่วงหน้า—คุณสมบัติที่เป็นหลักในระบบไฟล์แบบดั้งเดิมแต่ไม่มีข้อได้เปรียบสำหรับงานเทรน AI ที่ข้อมูลแทบจะไม่ถูกนำมาใช้ซ้ำในระยะสั้น แทนที่จะเป็นเช่นนั้น 3FS ใช้อินเทอร์เฟซ AIO และ io_uring ที่อิงกับ Linux ด้วยโหมด Direct I/O ซึ่งข้ามแคชไฟล์ไปโดยสิ้นเชิงเพื่อป้องกันการใช้หน่วยความจำที่ไม่จำเป็น
![]() |
---|
เมตริกประสิทธิภาพที่แสดงความสามารถในการอ่านข้อมูลแบบสุ่มที่โดดเด่นของระบบไฟล์ Fire-Flyer |
สถาปัตยกรรมและการนำไปใช้ทางเทคนิค
ระบบนี้ใช้สถาปัตยกรรมแบบแยกส่วนที่รวมความเร็วของ SSD นับพันตัวเข้ากับแบนด์วิดธ์เครือข่ายของโหนดจัดเก็บข้อมูลหลายร้อยโหนด มีการใช้ Chain Replication with Apportioned Queries (CRAQ) สำหรับความสอดคล้องที่แข็งแกร่งและใช้บริการเมตาดาต้าแบบไร้สถานะที่รองรับด้วยคีย์-แวลูสโตร์แบบทรานแซคชัน
ในขณะที่ 3FS ใช้ FUSE สำหรับการจัดการเมตาดาต้า การบรรลุประสิทธิภาพสูงต้องการให้แอปพลิเคชันเชื่อมโยงโดยตรงกับไลบรารีไคลเอนต์ C++ สำหรับการอ่านและเขียน ทางเลือกในการออกแบบนี้ได้จุดประกายการอภิปรายบางอย่างในชุมชนเกี่ยวกับว่าสิ่งนี้จำกัดประโยชน์การใช้งานทั่วไปหรือไม่ แม้ว่าจะมี Python bindings เพื่อปรับปรุงการเข้าถึง
คลัสเตอร์เบนช์มาร์กที่ทำความเร็วได้ 6.6 TiB/s ประกอบด้วยโหนดจัดเก็บข้อมูล 180 โหนด แต่ละโหนดมี InfiniBand NICs 2x200Gbps และ NVMe SSDs ขนาด 14TiB สิบหกตัว พร้อมกับโหนดไคลเอนต์ประมาณ 500+ โหนดสำหรับการทดสอบความเครียดการอ่าน การกำหนดค่านี้แสดงให้เห็นถึงความสามารถของระบบในการขยายขนาดอย่างมีประสิทธิภาพในคลัสเตอร์ขนาดใหญ่
จุดเด่นด้านประสิทธิภาพของ 3FS:
- ปริมาณข้อมูลสูงสุด: อัตราการอ่านข้อมูล 6.6 TiB/s ผ่านโหนดเก็บข้อมูล 180 โหนด
- การกำหนดค่าโหนด: แต่ละโหนดเก็บข้อมูลติดตั้งด้วย InfiniBand NICs 2x200Gbps และ NVMe SSDs ขนาด 14TiB จำนวน 16 ตัว
- ประสิทธิภาพ GraySort: เรียงข้อมูล 110.5 TiB ในเวลา 30 นาทีและ 14 วินาที (3.66 TiB/นาที)
- ประสิทธิภาพ KVCache: อัตราการอ่านข้อมูลสูงสุดถึง 40 GiB/s
เปรียบเทียบกับ Ceph:
- 3FS: 180 โหนด, InfiniBand 2x200Gbps, NVMe SSDs 16x 14TiB ต่อโหนด, ไคลเอนต์ประมาณ 500, อัตราการอ่านข้อมูล 6.6 TiB/s
- Ceph: 68 โหนด, Mellanox 2x100Gbps, NVMe SSDs 10x 14TiB ต่อโหนด, ไคลเอนต์ 504, อัตราการอ่านข้อมูลแบบสุ่ม 1 TiB/s
![]() |
---|
เมตริกประสิทธิภาพของเซิร์ฟเวอร์ที่แสดงให้เห็นถึงการปรับขยายและประสิทธิภาพที่มีประสิทธิผลของสถาปัตยกรรมแบบแยกส่วนใน 3FS |
ตำแหน่งในหมู่คู่แข่ง
การอภิปรายในชุมชนเน้นย้ำว่า 3FS เข้าสู่สนามที่ครอบงำโดยโซลูชันที่มีอยู่แล้วอย่าง Lustre และตัวเลือกใหม่ๆ อย่าง Weka สำหรับการจัดเก็บข้อมูลแบบกระจายประสิทธิภาพสูง ระบบจัดเก็บวัตถุแบบดั้งเดิมอย่าง MinIO, Ceph และ SeaweedFS โดยทั่วไปถือว่าช้าเกินไปสำหรับความต้องการความเร็วสูงของการเทรน AI ขนาดใหญ่
Lustre ยังคงเป็นผู้นำของระบบไฟล์แบบขนานกระจาย แต่เป็นที่รู้กันว่ายากต่อการตั้งค่าและดำเนินการ 3FS มีเป้าหมายที่จะให้ประสิทธิภาพที่เทียบเท่าหรือดีกว่าด้วยสถาปัตยกรรมที่ทันสมัยและจัดการได้ง่ายกว่า ความเร็ว 6.6 TiB/s ของระบบเร็วกว่าเป้าหมายที่ Ceph เพิ่งฉลองที่ 1 TiB/s อย่างมีนัยสำคัญ ซึ่งทำได้ด้วยคลัสเตอร์ที่เล็กกว่าที่มี 68 โหนด
นอกเหนือจากการเทรน: KVCache สำหรับการอนุมาน
นอกเหนือจากการเข้าถึงข้อมูลการเทรน 3FS ยังมีฟังก์ชัน KVCache ซึ่งเพิ่มประสิทธิภาพการอนุมาน LLM โดยการแคชเวกเตอร์คีย์และค่าจากโทเค็นก่อนหน้าในเลเยอร์ดีโคเดอร์ คุณสมบัตินี้ช่วยหลีกเลี่ยงการคำนวณซ้ำระหว่างการอนุมาน โดยผลเบนช์มาร์กแสดงให้เห็นว่าความเร็วในการอ่านสูงสุดสามารถถึง 40 GiB/s
ความสามารถนี้ดูเหมือนจะเป็นส่วนหนึ่งของกลยุทธ์ของ DeepSeek สำหรับบริการอนุมานที่คุ้มค่า ซึ่งอาจอธิบายได้ว่าพวกเขาสามารถเสนอราคาที่แข่งขันได้สำหรับการฮิตแคชพรอมต์อย่างไร
การเปิดตัว 3FS เพิ่มเติมในพอร์ตโฟลิโอเครื่องมือโครงสร้างพื้นฐานที่เติบโตของ DeepSeek ตามหลังการเผยแพร่องค์ประกอบอื่นๆ ของสแต็ก AI ของพวกเขาเมื่อเร็วๆ นี้ ตามที่ผู้แสดงความคิดเห็นรายหนึ่งกล่าวว่า พื้นฐานของบริษัทในการซื้อขายความถี่สูง ซึ่งประสิทธิภาพวัดเป็นนาโนวินาทีแทนที่จะเป็นมิลลิวินาที น่าจะมีอิทธิพลต่อแนวทางของพวกเขาในการสร้างโครงสร้างพื้นฐาน AI ประสิทธิภาพสูง
สำหรับองค์กรที่กำลังต่อสู้กับต้นทุนสูงและข้อจำกัดด้านประสิทธิภาพของโซลูชันที่มีอยู่เช่น AWS EFS, 3FS อาจเป็นทางเลือกที่น่าสนใจ แม้ว่าลักษณะเฉพาะของมันหมายความว่าเหมาะสมที่สุดสำหรับงาน AI เฉพาะทางมากกว่าความต้องการในการจัดเก็บข้อมูลทั่วไป
อ้างอิง: Fire-Flyer File System