การเปิดตัว Monolith ของ ByteDance ซึ่งเป็นเฟรมเวิร์กการเรียนรู้เชิงลึกสำหรับการสร้างโมเดลแนะนำขนาดใหญ่ ได้จุดประเด็นการถกเถียงในชุมชนเทคโนโลยีเกี่ยวกับความสัมพันธ์กับอัลกอริทึมแนะนำที่มีชื่อเสียงของ TikTok อย่างไรก็ตาม การวิเคราะห์อย่างละเอียดชี้ให้เห็นว่าการเปิดเผยซอร์สโค้ดนี้ไม่ใช่เทคโนโลยีหลักที่อยู่เบื้องหลังความสำเร็จของ TikTok
เฟรมเวิร์กกับอัลกอริทึม
ในขณะที่ Monolith ให้โครงสร้างพื้นฐานสำหรับการรันและฝึกฝนโมเดลแนะนำแบบกระจาย แต่ดูเหมือนว่าจะมุ่งเน้นไปที่โซลูชันระบบแนะนำเชิงพาณิชย์ของ ByteDance ที่เรียกว่า BytePlus มากกว่าเทคโนโลยีหลักของ TikTok เฟรมเวิร์กนี้มีฟีเจอร์ต่างๆ เช่น ตารางการฝังข้อมูลแบบไม่มีการชนกัน และความสามารถในการเทรนนิ่งแบบเรียลไทม์ แต่ตรรกะการแนะนำที่แท้จริงถูกจำกัดอยู่เพียงแค่การสาธิตการใช้งานพื้นฐาน
คุณสมบัติหลักของเฟรมเวิร์ค:
- ตารางการฝังข้อมูลแบบไม่มีการชนกัน
- รองรับการเทรนนิ่งแบบเรียลไทม์
- พัฒนาบนพื้นฐานของ TensorFlow
- รองรับการเทรนนิ่งและการให้บริการทั้งแบบแบตช์และเรียลไทม์
- รองรับการคอมไพล์บนระบบปฏิบัติการ Linux เท่านั้น
บริบททางกฎหมายและกลยุทธ์
กฎหมายจีนห้ามการส่งออกระบบการแนะนำ ทำให้เป็นไปได้ยากมากที่ ByteDance จะเปิดเผยอัลกอริทึมที่แท้จริงของ TikTok ดังที่สมาชิกในชุมชนคนหนึ่งได้กล่าวไว้:
นี่เป็นเพียงเฟรมเวิร์กสำหรับการทำงานของระบบแนะนำของพวกเขา แต่ส่วนที่ทำหน้าที่กำหนดการแนะนำจริงๆ เป็นเพียงโมเดลสาธิต ดังนั้นผมจึงสันนิษฐานว่านี่ไม่ใช่โมเดล ML ที่พวกเขาใช้จริงในการผลิต
ข้อได้เปรียบที่แท้จริงของ TikTok
การวิเคราะห์จากชุมชนเผยว่าความสำเร็จของ TikTok น่าจะมาจากวิธีการเฉพาะในการสร้างโมเดลความสนใจของผู้ใช้ ต่างจาก Meta ที่ใช้การแนะนำบนพื้นฐานของกราฟสังคม TikTok มุ่งเน้นไปที่การแสดงความสนใจของผู้ใช้ตามช่วงเวลา โดยติดตามเนื้อหาที่ผู้ใช้มีปฏิสัมพันธ์โดยตรงแทนที่จะพึ่งพาการเชื่อมต่อทางสังคม วิธีการนี้ผสานกับการออกแบบอินเตอร์เฟซที่สร้างสัญญาณการมีส่วนร่วมที่ชัดเจน ทำให้เกิดระบบแนะนำที่มีประสิทธิภาพมากขึ้น
ปัจจัยการคัดกรองโดยมนุษย์
นอกเหนือจากอัลกอริทึม การกระจายเนื้อหาของ TikTok ยังเกี่ยวข้องกับการคัดกรองด้วยมนุษย์อย่างมาก องค์ประกอบที่เป็นมนุษย์นี้ช่วยให้มั่นใจในคุณภาพประสบการณ์ของผู้ใช้ แต่ก็ยังมีคำถามเกี่ยวกับการส่งเสริมเนื้อหาและการจัดการที่อาจเกิดขึ้น การผสมผสานระหว่างอัลกอริทึมและการคัดกรองโดยมนุษย์สร้างระบบที่ซับซ้อนซึ่งไม่สามารถลดทอนให้เหลือเพียงเฟรมเวิร์กโอเพนซอร์สเดียวได้
สรุปได้ว่า แม้ Monolith จะให้ข้อมูลเชิงลึกที่มีค่าเกี่ยวกับความสามารถทางเทคนิคของ ByteDance แต่มันเป็นเพียงองค์ประกอบหนึ่งของระบบนิเวศการแนะนำที่ใหญ่กว่าและซับซ้อนกว่ามาก พลังที่แท้จริงของระบบแนะนำของ TikTok น่าจะอยู่ที่การผสมผสานระหว่างอัลกอริทึมขั้นสูง การออกแบบการโต้ตอบกับผู้ใช้ และการคัดกรองโดยมนุษย์ ซึ่งส่วนใหญ่ยังคงเป็นความลับทางการค้า
อ้างอิง: Monolith: A Deep Learning Framework for Large Scale Recommendation Modeling