Browser-use เครื่องมือโอเพนซอร์สที่ออกแบบมาเพื่อให้เอเจนต์ AI สามารถควบคุมเว็บเบราว์เซอร์ได้ ได้จุดประกายให้เกิดการถกเถียงในชุมชนอย่างมากเกี่ยวกับผลกระทบด้านความปลอดภัย แม้ว่าเครื่องมือนี้สัญญาว่าจะปฏิวัติการทำงานอัตโนมัติบนเบราว์เซอร์โดยอนุญาตให้ AI ทำงานที่ซับซ้อนบนเว็บได้ แต่ผู้เชี่ยวชาญด้านความปลอดภัยได้แสดงความกังวลเกี่ยวกับวิธีการควบคุมเบราว์เซอร์และช่องโหว่ที่อาจเกิดขึ้น
ช่องโหว่ด้านความปลอดภัยในโหมดดีบักของเบราว์เซอร์
ความกังวลที่โดดเด่นที่สุดที่สมาชิกในชุมชนยกขึ้นมาคือการใช้งานเครื่องมือดีบักของ Chrome ใน Browser-use ผู้ใช้รายหนึ่งชี้ให้เห็นว่าไลบรารีนี้ใช้ Chrome DevTools Protocol (CDP) และแนะนำให้ผู้ใช้เปิด Chrome ในโหมดดีบัก ซึ่งอาจสร้างความเสี่ยงด้านความปลอดภัยอย่างร้ายแรง:
ลืมเรื่องเอเจนต์ไปเลย คำแนะนำการติดตั้งที่เผยแพร่ของ Browser-use ที่ให้ใช้กับโปรไฟล์ Chrome และรหัสผ่านของคุณเอง เป็นการเปิดเซสชัน Chrome โดยเปิดใช้งาน Remote Debugging เครื่องมือเหล่านี้ที่พวกเขาแนะนำให้ผู้ใช้ติดตั้งและดำเนินการนั้นไม่ปลอดภัยโดยธรรมชาติ
เครื่องมือดีบักที่ Browser-use ใช้มีช่องโหว่ที่เป็นที่รู้จักซึ่ง Google รายงานว่าไม่ได้แก้ไขเพราะมีไว้สำหรับวัตถุประสงค์ในการพัฒนามากกว่าสภาพแวดล้อมการผลิต เมื่อผู้ใช้ทำตามคำแนะนำในเอกสารเพื่อเชื่อมต่อกับเบราว์เซอร์จริงที่มีข้อมูลประจำตัวและรหัสผ่านที่บันทึกไว้ พวกเขาอาจเปิดเผยตัวเองต่อการโจมตีแบบ cross-site scripting (XSS) เนื่องจากพอร์ต DevTools ขาดการตรวจสอบสิทธิ์
ประเด็นความกังวลด้านความปลอดภัยหลักเกี่ยวกับการใช้เบราว์เซอร์:
- ใช้ Chrome DevTools Protocol (CDP) ซึ่งมีช่องโหว่ด้านความปลอดภัยที่เป็นที่รู้จัก
- แนะนำให้ผู้ใช้เปิด Chrome ในโหมดดีบักพร้อมเปิดใช้งาน Remote Debugging
- พอร์ต DevTools ขาดการรับรองความถูกต้อง ทำให้มีความเสี่ยงต่อการโจมตีแบบ XSS
- มีความเสี่ยงในการเปิดเผยข้อมูลรหัสผ่านและข้อมูลประจำตัวที่บันทึกไว้
ทางเลือกที่แนะนำ:
- ใช้ ChromeDriver แทนโหมดดีบัก
- ใช้ Unix sockets สำหรับ CDP เพื่อลดช่องโหว่ในการรับรองความถูกต้อง
- การแยกส่วนด้วย Container (แม้ว่าจะไม่สามารถแก้ไขปัญหาเกี่ยวกับการเชื่อมต่อกับเบราว์เซอร์หลักได้อย่างสมบูรณ์)
วิธีการทางเลือกและโซลูชัน
นักพัฒนาที่ใส่ใจเรื่องความปลอดภัยในการสนทนาได้แนะนำวิธีการทางเลือกสำหรับการควบคุมเบราว์เซอร์ บางคนกล่าวถึงการใช้ ChromeDriver แทนโหมดดีบัก ในขณะที่คนอื่นๆ ชี้ไปที่ unix sockets สำหรับ CDP เป็นโซลูชันที่อาจบรรเทาช่องโหว่ในการตรวจสอบสิทธิ์ ผู้แสดงความคิดเห็นคนหนึ่งระบุว่าพวกเขาได้พัฒนาวิธีที่ปลอดภัยในการควบคุมเบราว์เซอร์ด้วยเอเจนต์ AI โดยไม่จำเป็นต้องมีสิทธิ์ในการดีบัก
ผู้ดูแลโครงการรับทราบข้อกังวลเหล่านี้ แต่ยังไม่ได้มุ่งมั่นที่จะออกแบบใหม่โดยเน้นความปลอดภัยอย่างเฉพาะเจาะจง พวกเขาแนะนำว่าเมื่อทำงานในสภาพแวดล้อมการผลิต เบราว์เซอร์มักอยู่ใน Docker containers ที่แยกออกมา แม้ว่านักวิจารณ์จะชี้ให้เห็นว่าสิ่งนี้ไม่ได้แก้ปัญหาเมื่อผู้ใช้ทำตามเอกสารเพื่อเชื่อมต่อกับเบราว์เซอร์หลักของพวกเขา
การรวม MCP และการทำให้เป็นมาตรฐาน
นอกเหนือจากความปลอดภัย อีกหนึ่งประเด็นสำคัญในการสนทนาคือการรวม Model Context Protocol (MCP) ผู้ใช้หลายคนแสดงความสนใจที่จะเห็น Browser-use นำ MCP มาใช้เพื่อทำให้การโต้ตอบของเครื่องมือกับ LLMs เป็นมาตรฐาน แม้ว่าในตอนแรกจะลังเลเกี่ยวกับคุณค่าของ MCP แต่นักพัฒนาดูเหมือนจะพิจารณาใหม่หลังจากเห็นความสนใจของชุมชน:
ผมต่อต้านมันมาก แต่โพสต์ HN นี้ทำให้ผมคิดว่า 'คนต้องการ MCP' นักพัฒนาคนหนึ่งกล่าว ซึ่งเน้นให้เห็นว่าข้อเสนอแนะของชุมชนกำลังกำหนดทิศทางของโครงการอย่างไร
MCP จะทำให้ Browser-use สามารถทำงานร่วมกับแพลตฟอร์มและกรณีการใช้งานได้มากขึ้น โดยผู้ใช้บางรายกล่าวว่าพวกเขากำลังใช้ทางเลือกอื่นอยู่ในขณะนี้เนื่องจาก Browser-use ขาดการสนับสนุน MCP
ข้อพิจารณาด้านจริยธรรมและแนวปฏิบัติในการดึงข้อมูลเว็บ
ชุมชนยังแสดงความกังวลเกี่ยวกับการทำงานอัตโนมัติบนเว็บอย่างมีความรับผิดชอบ ผู้แสดงความคิดเห็นบางคนชี้ให้เห็นว่าเอเจนต์ AI นำไปสู่กิจกรรมการดึงข้อมูลที่เพิ่มขึ้นซึ่งไม่ได้ปฏิบัติตามแนวทางที่กำหนดไว้เสมอไป เช่น การเคารพไฟล์ robots.txt หรือการใช้การจำกัดอัตรา สิ่งนี้สามารถส่งผลเสียต่อเจ้าของเว็บไซต์ผ่านต้นทุนที่เพิ่มขึ้นและการหยุดทำงานที่อาจเกิดขึ้น
นักพัฒนาแนะนำว่าวิธีการของพวกเขาจริงๆ แล้วลดภาระเมื่อเทียบกับการดึงข้อมูลแบบดั้งเดิม เนื่องจากพวกเขาดึงเฉพาะองค์ประกอบที่โต้ตอบได้แทนที่จะดาวน์โหลดสินทรัพย์ทั้งหมด พวกเขายังระบุว่าในระยะยาว พวกเขาเชื่อว่าเอเจนต์จะต้องจ่ายเงินสำหรับข้อมูลจากผู้ให้บริการเว็บไซต์ ซึ่งจะปรับแนวแรงจูงใจใหม่
ในขณะที่ Browser-use ยังคงพัฒนาทั้งเฟรมเวิร์กโอเพนซอร์สและบริการคลาวด์ การสนทนาเหล่านี้เกี่ยวกับความปลอดภัย การทำให้เป็นมาตรฐาน และการโต้ตอบกับเว็บอย่างมีจริยธรรมจะมีแนวโน้มที่จะกำหนดวิวัฒนาการของมัน ใบอนุญาต MIT ของโครงการได้เปิดใช้งานการนำไปใช้อย่างแพร่หลาย แต่ยังก่อให้เกิดคำถามเกี่ยวกับแรงกดดันในการแข่งขันที่อาจเกิดขึ้นจากบริษัทขนาดใหญ่ที่อาจเสนอบริการคล้ายกัน
สำหรับนักพัฒนาที่สนใจในการทำงานอัตโนมัติของเบราว์เซอร์ด้วย AI Browser-use เป็นเครื่องมือที่น่าตื่นเต้นแต่กำลังพัฒนา ซึ่งต้องการการพิจารณาอย่างรอบคอบเกี่ยวกับผลกระทบด้านความปลอดภัยเมื่อนำไปใช้ในสภาพแวดล้อมการผลิต