วงการระบบอัตโนมัติบนเว็บกำลังเผชิญกับการเปลี่ยนแปลงครั้งสำคัญด้วยการเปิดตัว Stagehand เฟรมเวิร์กที่ขับเคลื่อนด้วย AI ซึ่งแก้ไขปัญหาที่ยืดเยื้อมานานในการทำงานอัตโนมัติบนเบราว์เซอร์: การรักษาความเสถียรของสคริปต์แม้ว่า UI จะมีการเปลี่ยนแปลงบ่อยครั้ง
การปรับตัวแบบไดนามิกเทียบกับระบบอัตโนมัติแบบดั้งเดิม
ในขณะที่เครื่องมือทำงานอัตโนมัติบนเว็บแบบดั้งเดิมอย่าง Playwright ต้องพึ่งพา DOM selector ที่กำหนดไว้ตายตัว Stagehand นำเสนอวิธีการที่ทนทานกว่าผ่านระบบอัตโนมัติที่ขับเคลื่อนด้วย AI ความสามารถของเฟรมเวิร์กในการสร้างคำสั่ง Playwright แบบไดนามิกทำให้มีประโยชน์อย่างมากในสถานการณ์ที่เว็บไซต์มีการอัปเดตบ่อยหรือใช้มาตรการป้องกันการทำงานอัตโนมัติ ดังที่สมาชิกในชุมชนอธิบายว่า:
Playwright codegen นั้นมีประสิทธิภาพมาก แต่ยังค่อนข้างเปราะบาง DOM selector ของมันถูกกำหนดไว้ตายตัว ดังนั้นคุณเสี่ยงที่ Playwright จะเลือก DOM selector ที่ไม่ยั่งยืน ด้วย Stagehand โค้ดสามารถซ่อมแซมตัวเองได้เนื่องจากมีการสร้าง Playwright แบบไดนามิกทุกครั้ง ทำให้ทนทานต่อการเปลี่ยนแปลงของ DOM มากขึ้น
คุณสมบัติหลัก:
- สคริปต์อัตโนมัติที่สามารถซ่อมแซมตัวเองได้
- รองรับ proxy และ captcha แบบในตัว
- มี API หลักสามส่วน: act, extract, observe
- รองรับการทำงานร่วมกับ Playwright อย่างสมบูรณ์
- มีส่วนติดต่อผู้ใช้ด้วยภาษาธรรมชาติสำหรับการทำงานอัตโนมัติ
การประยุกต์ใช้งานจริงนอกเหนือจากการทดสอบ
แม้จะสร้างขึ้นบนพื้นฐานของ Playwright แต่ Stagehand ไม่ได้ถูกวางตำแหน่งเป็นเครื่องมือทดสอบเป็นหลัก แต่มุ่งเป้าไปที่นักพัฒนาที่สร้างเว็บเอเจนต์สำหรับงานต่างๆ เช่น RAG (Retrieval-Augmented Generation) แบบเรียลไทม์บนเว็บอีคอมเมิร์ซ และการจัดการการรวบรวมเนื้อหาแบบไดนามิก เฟรมเวิร์กนี้ได้รับความสนใจเป็นพิเศษจากนักพัฒนาที่ทำงานกับเว็บไซต์ที่มีการป้องกันการเข้าถึง เนื่องจากมีการรองรับพร็อกซี่และการจัดการ captcha ในตัว
การใช้งานหลัก:
- การพัฒนาตัวแทนเว็บ
- การรวบรวมข้อมูล E-commerce
- การจัดการเนื้อหาแบบไดนามิก
- การใช้งาน RAG แบบเรียลไทม์
การผสานและการขยายความสามารถ
เฟรมเวิร์กนี้ยังคงความเข้ากันได้อย่างสมบูรณ์กับ Playwright ในขณะที่นำเสนอ AI API หลัก 3 ส่วน: 'act', 'extract' และ 'observe' สถาปัตยกรรมนี้ช่วยให้นักพัฒนาสามารถผสานโค้ด Playwright ที่มีอยู่เข้ากับความสามารถใหม่ของ AI ได้อย่างราบรื่น ชุมชนได้แสดงความสนใจเป็นพิเศษในการผสานรวมกับโมเดล AI ในเครื่องผ่านแพลตฟอร์มอย่าง Ollama ซึ่งบ่งชี้ถึงความต้องการที่เพิ่มขึ้นสำหรับโซลูชันระบบอัตโนมัติแบบ self-hosted
ทิศทางในอนาคต
ทีมพัฒนา Stagehand ได้แสดงให้เห็นถึงความทะเยอทะยานที่กว้างขวางขึ้นด้วยการชนะการแข่งขัน Anthropic's Claude MCP hackathon ด้วยการพัฒนา MCP server ความสำเร็จนี้บ่งชี้ถึงการขยายตัวในอนาคตที่นอกเหนือจากระบบอัตโนมัติบนเว็บไปสู่การผสานการใช้งานคอมพิวเตอร์ในวงกว้าง ซึ่งอาจปฏิวัติวิธีการที่เราใช้ในการทำระบบอัตโนมัติสำหรับการปฏิสัมพันธ์ระหว่างมนุษย์กับคอมพิวเตอร์
เฟรมเวิร์กนี้แสดงถึงความสมดุลในทางปฏิบัติระหว่างการเข้าถึงได้ง่ายและประสิทธิภาพ ทำให้ระบบอัตโนมัติบนเว็บที่ซับซ้อนเข้าถึงได้ง่ายขึ้น ในขณะที่ยังคงความทนทานที่จำเป็นสำหรับสภาพแวดล้อมการผลิตจริง
อ้างอิง: Stagehand: An AI web browsing framework focused on simplicity and extensibility