ชุมชนโอเพนซอร์สกำลังถกเถียงอย่างคึกคักเกี่ยวกับ Cerebellum ระบบอัตโนมัติบนเว็บที่ขับเคลื่อนด้วย AI ตัวใหม่ที่ใช้ Claude 3.5 Sonnet สำหรับการโต้ตอบกับเบราว์เซอร์ แม้ว่าเครื่องมือนี้จะแสดงให้เห็นถึงศักยภาพ แต่สมาชิกในชุมชนได้ยกประเด็นคำถามสำคัญเกี่ยวกับการเก็บข้อมูล ความเป็นส่วนตัว และการรองรับโมเดลแบบ local
ความกังวลด้านการเก็บข้อมูลและความเป็นส่วนตัว
ประเด็นสำคัญที่มีการถกเถียงในชุมชนเกี่ยวข้องกับแผนในอนาคตของ Cerebellum ในการรวบรวมเซสชันการใช้งานเบราว์เซอร์ ตามคำตอบของ Han Wang โครงการนี้มีเป้าหมายที่จะพัฒนาฟังก์ชันการแปลง BrowserStep[] เป็นรูปแบบไฟล์ที่พกพาได้ และสร้างไฟล์ .jsonl ที่เข้ากันได้กับไลบรารี transformers อย่างไรก็ตาม สมาชิกในชุมชนได้แสดงความกังวลที่มีเหตุผลเกี่ยวกับข้อมูลส่วนบุคคลที่สามารถระบุตัวตนได้ (PII) ในกรณีที่มีการยืนยันตัวตน เนื่องจากโครงการยังขาดฟีเจอร์การปกปิดตัวตนที่มีมาในตัว
ความท้าทายในการรวมโมเดลแบบ Local
อีกหัวข้อที่ได้รับความสนใจคือความเป็นไปได้ในการใช้โมเดลแบบ local กับ Cerebellum ผู้ดูแลโครงการได้อธิบายว่าโมเดลแบบ local ในปัจจุบันยังขาดความสามารถในการแบ่งส่วนพิกัด x และ y ที่จำเป็น ทำให้ไม่เหมาะสมกับงานนี้ แม้ว่าสมาชิกบางคนในชุมชนได้เสนอวิธีแก้ปัญหาที่อาจเป็นไปได้โดยใช้โปรโตคอล WebDriver ของ Selenium และการแก้ไข DOM แต่วิธีแก้ไขเหล่านี้ยังอยู่ในขั้นทดลองและต้องการการพัฒนาเพิ่มเติม
การนำไปใช้งานทางเทคนิค
ปัจจุบัน Cerebellum ใช้ Selenium WebDriver v4 สำหรับการโต้ตอบกับเบราว์เซอร์ โดยภาพหน้าจอจะถูกส่งผ่านโปรโตคอล WebDriver สมาชิกในชุมชนได้เสนอแนวทางที่อาจเป็นไปได้เกี่ยวกับการแก้ไข DOM ก่อนการจับภาพหน้าจอ แม้ว่าจะต้องมีการนำไปใช้อย่างระมัดระวังเพื่อรักษาฟังก์ชันการทำงาน
แนวทางการพัฒนาในอนาคต
แผนงานของโครงการระบุถึงแผนที่จะจัดการกับความกังวลของชุมชนเหล่านี้ โดยมีเป้าหมายดังนี้:
- สร้างฟังก์ชันการบันทึกเซสชันการท่องเว็บเป็นชุดข้อมูลสำหรับการฝึกฝน
- พัฒนาและรวมโมเดลแบบ local ที่มีความสามารถตามที่ต้องการ
- ปรับปรุงประสิทธิภาพระบบและประสบการณ์ผู้ใช้
- ขยายการรองรับ LLM นอกเหนือจาก Claude 3.5 Sonnet
บทสรุป
แม้ว่า Cerebellum จะเป็นแนวทางที่นวัตกรรมสำหรับระบบอัตโนมัติบนเว็บที่ขับเคลื่อนด้วย AI แต่การอภิปรายในชุมชนได้เน้นย้ำถึงข้อพิจารณาสำคัญเกี่ยวกับความเป็นส่วนตัวของข้อมูลและการรองรับโมเดลแบบ local ที่จะต้องได้รับการแก้ไขเมื่อโครงการพัฒนาต่อไป การมีส่วนร่วมอย่างแข็งขันระหว่างนักพัฒนาและผู้ใช้แสดงให้เห็นถึงแนวทางความร่วมมือในการแก้ไขความท้าทายเหล่านี้