ในการพัฒนาที่น่าประหลาดใจ ByteDance บริษัทแม่ของ TikTok ได้ปล่อยบอทรวบรวมข้อมูลเว็บที่กำลังทำงานเร็วกว่าคู่แข่งอย่างรวดเร็วในการแข่งขันเพื่อเก็บข้อมูล บอทที่มีชื่อว่า Bytespider นี้รายงานว่ากำลังรวบรวมข้อมูลจากอินเทอร์เน็ตด้วยความเร็วที่มากกว่า GPTbot ของ OpenAI ถึง 25 เท่า และเร็วกว่า ClaudeBot ของ Anthropic ถึง 3,000 เท่า
การเติบโตของ Bytespider
เปิดตัวในเดือนเมษายน 2024 Bytespider ได้กลายเป็นหนึ่งในเครื่องมือเก็บรวบรวมข้อมูลที่ทำงานเชิงรุกมากที่สุดบนอินเทอร์เน็ตอย่างรวดเร็ว ตามการวิจัยจากบริษัทจัดการบอท Kasada และบริการตรวจสอบ Dark Visitors เครื่องมือรวบรวมข้อมูลของ ByteDance กำลังทำงานด้วยความเร็วที่ไม่เคยมีมาก่อนเมื่อเทียบกับเครื่องมือที่คล้ายกันที่ใช้โดยบริษัทเทคยักษ์ใหญ่อย่าง Google, Meta, Amazon, OpenAI และ Anthropic
ผลกระทบต่อการพัฒนา AI
กลยุทธ์การเก็บข้อมูลเชิงรุกนี้บ่งชี้ว่า ByteDance กำลังพยายามอย่างหนักเพื่อตามทันในการแข่งขันด้าน AI บริษัทซึ่งมีรายงานว่าใช้เทคโนโลยีของ OpenAI เพื่อสร้างโมเดลภาษาขนาดใหญ่ (LLMs) ของตัวเองเมื่อปีที่แล้ว ดูเหมือนจะมุ่งมั่นที่จะรวบรวมข้อมูลจำนวนมหาศาลสำหรับการฝึกฝน AI ของตน
แนวปฏิบัติที่เป็นที่ถกเถียง
วิธีการของ Bytespider ได้สร้างความสงสัยในชุมชนเทคโนโลยี เช่นเดียวกับคู่แข่งบางราย บอทนี้รายงานว่าละเลยไฟล์ robots.txt ซึ่งเจ้าของเว็บไซต์ใช้เพื่อระบุส่วนของเว็บไซต์ที่ไม่ควรถูกรวบรวมข้อมูล แนวปฏิบัตินี้แม้จะไม่ผิดกฎหมาย แต่ถือเป็นประเด็นที่ถกเถียงกันในการอภิปรายเกี่ยวกับสิทธิ์ข้อมูลและการฝึกฝน AI
การใช้งานที่เป็นไปได้
แหล่งข่าวที่คุ้นเคยกับความทะเยอทะยานของ ByteDance แนะนำว่าบริษัทอาจกำลังพัฒนา LLM ใหม่ ซึ่งอาจเป็นไปเพื่อเพิ่มประสิทธิภาพฟังก์ชันการค้นหาของ TikTok สภาพแวดล้อมการค้นหาที่ขับเคลื่อนด้วย AI ที่ดีขึ้นอาจทำให้ TikTok น่าดึงดูดมากขึ้นสำหรับนักโฆษณาที่ปัจจุบันใช้จ่ายเงินจำนวนมากบนแพลตฟอร์มอย่าง Google
ผลกระทบในอนาคต
ในขณะที่ ByteDance ยังคงเพิ่มความพยายามในการเก็บรวบรวมข้อมูล คำถามเกี่ยวกับอนาคตของการพัฒนา AI และการใช้ข้อมูลก็เกิดขึ้น วิธีการเชิงรุกของบริษัทอาจจุดประกายการอภิปรายเพิ่มเติมเกี่ยวกับสิทธิ์ข้อมูล จริยธรรม AI และความจำเป็นในการสร้างกรอบการกำกับดูแลในสาขาปัญญาประดิษฐ์ที่กำลังพัฒนาอย่างรวดเร็ว
ในขณะที่ Bytespider ของ ByteDance แสดงให้เห็นถึงความมุ่งมั่นของบริษัทในการพัฒนาความสามารถด้าน AI ของตน มันยังเน้นย้ำถึงการแข่งขันที่เข้มข้นขึ้นในอุตสาหกรรมเทคโนโลยีและความสำคัญที่เพิ่มขึ้นของข้อมูลในการแข่งขันด้าน AI