Bytespider ของ ByteDance: เครื่องมือรวบรวมข้อมูลเว็บที่ทำงานเร็วกว่าบริษัทเทคยักษ์ใหญ่ถึง 25 เท่า

BigGo Editorial Team
Bytespider ของ ByteDance: เครื่องมือรวบรวมข้อมูลเว็บที่ทำงานเร็วกว่าบริษัทเทคยักษ์ใหญ่ถึง 25 เท่า

ในการพัฒนาที่น่าประหลาดใจ ByteDance บริษัทแม่ของ TikTok ได้ปล่อยบอทรวบรวมข้อมูลเว็บที่กำลังทำงานเร็วกว่าคู่แข่งอย่างรวดเร็วในการแข่งขันเพื่อเก็บข้อมูล บอทที่มีชื่อว่า Bytespider นี้รายงานว่ากำลังรวบรวมข้อมูลจากอินเทอร์เน็ตด้วยความเร็วที่มากกว่า GPTbot ของ OpenAI ถึง 25 เท่า และเร็วกว่า ClaudeBot ของ Anthropic ถึง 3,000 เท่า

การเติบโตของ Bytespider

เปิดตัวในเดือนเมษายน 2024 Bytespider ได้กลายเป็นหนึ่งในเครื่องมือเก็บรวบรวมข้อมูลที่ทำงานเชิงรุกมากที่สุดบนอินเทอร์เน็ตอย่างรวดเร็ว ตามการวิจัยจากบริษัทจัดการบอท Kasada และบริการตรวจสอบ Dark Visitors เครื่องมือรวบรวมข้อมูลของ ByteDance กำลังทำงานด้วยความเร็วที่ไม่เคยมีมาก่อนเมื่อเทียบกับเครื่องมือที่คล้ายกันที่ใช้โดยบริษัทเทคยักษ์ใหญ่อย่าง Google, Meta, Amazon, OpenAI และ Anthropic

ผลกระทบต่อการพัฒนา AI

กลยุทธ์การเก็บข้อมูลเชิงรุกนี้บ่งชี้ว่า ByteDance กำลังพยายามอย่างหนักเพื่อตามทันในการแข่งขันด้าน AI บริษัทซึ่งมีรายงานว่าใช้เทคโนโลยีของ OpenAI เพื่อสร้างโมเดลภาษาขนาดใหญ่ (LLMs) ของตัวเองเมื่อปีที่แล้ว ดูเหมือนจะมุ่งมั่นที่จะรวบรวมข้อมูลจำนวนมหาศาลสำหรับการฝึกฝน AI ของตน

แนวปฏิบัติที่เป็นที่ถกเถียง

วิธีการของ Bytespider ได้สร้างความสงสัยในชุมชนเทคโนโลยี เช่นเดียวกับคู่แข่งบางราย บอทนี้รายงานว่าละเลยไฟล์ robots.txt ซึ่งเจ้าของเว็บไซต์ใช้เพื่อระบุส่วนของเว็บไซต์ที่ไม่ควรถูกรวบรวมข้อมูล แนวปฏิบัตินี้แม้จะไม่ผิดกฎหมาย แต่ถือเป็นประเด็นที่ถกเถียงกันในการอภิปรายเกี่ยวกับสิทธิ์ข้อมูลและการฝึกฝน AI

การใช้งานที่เป็นไปได้

แหล่งข่าวที่คุ้นเคยกับความทะเยอทะยานของ ByteDance แนะนำว่าบริษัทอาจกำลังพัฒนา LLM ใหม่ ซึ่งอาจเป็นไปเพื่อเพิ่มประสิทธิภาพฟังก์ชันการค้นหาของ TikTok สภาพแวดล้อมการค้นหาที่ขับเคลื่อนด้วย AI ที่ดีขึ้นอาจทำให้ TikTok น่าดึงดูดมากขึ้นสำหรับนักโฆษณาที่ปัจจุบันใช้จ่ายเงินจำนวนมากบนแพลตฟอร์มอย่าง Google

ผลกระทบในอนาคต

ในขณะที่ ByteDance ยังคงเพิ่มความพยายามในการเก็บรวบรวมข้อมูล คำถามเกี่ยวกับอนาคตของการพัฒนา AI และการใช้ข้อมูลก็เกิดขึ้น วิธีการเชิงรุกของบริษัทอาจจุดประกายการอภิปรายเพิ่มเติมเกี่ยวกับสิทธิ์ข้อมูล จริยธรรม AI และความจำเป็นในการสร้างกรอบการกำกับดูแลในสาขาปัญญาประดิษฐ์ที่กำลังพัฒนาอย่างรวดเร็ว

ในขณะที่ Bytespider ของ ByteDance แสดงให้เห็นถึงความมุ่งมั่นของบริษัทในการพัฒนาความสามารถด้าน AI ของตน มันยังเน้นย้ำถึงการแข่งขันที่เข้มข้นขึ้นในอุตสาหกรรมเทคโนโลยีและความสำคัญที่เพิ่มขึ้นของข้อมูลในการแข่งขันด้าน AI