Stagehand เฟรมเวิร์ก AI นำเสนอระบบซ่อมแซมตัวเองสำหรับการทำงานอัตโนมัติบนเว็บด้วย Playwright

BigGo Editorial Team
Stagehand เฟรมเวิร์ก AI นำเสนอระบบซ่อมแซมตัวเองสำหรับการทำงานอัตโนมัติบนเว็บด้วย Playwright

วงการระบบอัตโนมัติบนเว็บกำลังเผชิญกับการเปลี่ยนแปลงครั้งสำคัญด้วยการเปิดตัว Stagehand เฟรมเวิร์กที่ขับเคลื่อนด้วย AI ซึ่งแก้ไขปัญหาที่ยืดเยื้อมานานในการทำงานอัตโนมัติบนเบราว์เซอร์: การรักษาความเสถียรของสคริปต์แม้ว่า UI จะมีการเปลี่ยนแปลงบ่อยครั้ง

การปรับตัวแบบไดนามิกเทียบกับระบบอัตโนมัติแบบดั้งเดิม

ในขณะที่เครื่องมือทำงานอัตโนมัติบนเว็บแบบดั้งเดิมอย่าง Playwright ต้องพึ่งพา DOM selector ที่กำหนดไว้ตายตัว Stagehand นำเสนอวิธีการที่ทนทานกว่าผ่านระบบอัตโนมัติที่ขับเคลื่อนด้วย AI ความสามารถของเฟรมเวิร์กในการสร้างคำสั่ง Playwright แบบไดนามิกทำให้มีประโยชน์อย่างมากในสถานการณ์ที่เว็บไซต์มีการอัปเดตบ่อยหรือใช้มาตรการป้องกันการทำงานอัตโนมัติ ดังที่สมาชิกในชุมชนอธิบายว่า:

Playwright codegen นั้นมีประสิทธิภาพมาก แต่ยังค่อนข้างเปราะบาง DOM selector ของมันถูกกำหนดไว้ตายตัว ดังนั้นคุณเสี่ยงที่ Playwright จะเลือก DOM selector ที่ไม่ยั่งยืน ด้วย Stagehand โค้ดสามารถซ่อมแซมตัวเองได้เนื่องจากมีการสร้าง Playwright แบบไดนามิกทุกครั้ง ทำให้ทนทานต่อการเปลี่ยนแปลงของ DOM มากขึ้น

คุณสมบัติหลัก:

  • สคริปต์อัตโนมัติที่สามารถซ่อมแซมตัวเองได้
  • รองรับ proxy และ captcha แบบในตัว
  • มี API หลักสามส่วน: act, extract, observe
  • รองรับการทำงานร่วมกับ Playwright อย่างสมบูรณ์
  • มีส่วนติดต่อผู้ใช้ด้วยภาษาธรรมชาติสำหรับการทำงานอัตโนมัติ

การประยุกต์ใช้งานจริงนอกเหนือจากการทดสอบ

แม้จะสร้างขึ้นบนพื้นฐานของ Playwright แต่ Stagehand ไม่ได้ถูกวางตำแหน่งเป็นเครื่องมือทดสอบเป็นหลัก แต่มุ่งเป้าไปที่นักพัฒนาที่สร้างเว็บเอเจนต์สำหรับงานต่างๆ เช่น RAG (Retrieval-Augmented Generation) แบบเรียลไทม์บนเว็บอีคอมเมิร์ซ และการจัดการการรวบรวมเนื้อหาแบบไดนามิก เฟรมเวิร์กนี้ได้รับความสนใจเป็นพิเศษจากนักพัฒนาที่ทำงานกับเว็บไซต์ที่มีการป้องกันการเข้าถึง เนื่องจากมีการรองรับพร็อกซี่และการจัดการ captcha ในตัว

การใช้งานหลัก:

  • การพัฒนาตัวแทนเว็บ
  • การรวบรวมข้อมูล E-commerce
  • การจัดการเนื้อหาแบบไดนามิก
  • การใช้งาน RAG แบบเรียลไทม์

การผสานและการขยายความสามารถ

เฟรมเวิร์กนี้ยังคงความเข้ากันได้อย่างสมบูรณ์กับ Playwright ในขณะที่นำเสนอ AI API หลัก 3 ส่วน: 'act', 'extract' และ 'observe' สถาปัตยกรรมนี้ช่วยให้นักพัฒนาสามารถผสานโค้ด Playwright ที่มีอยู่เข้ากับความสามารถใหม่ของ AI ได้อย่างราบรื่น ชุมชนได้แสดงความสนใจเป็นพิเศษในการผสานรวมกับโมเดล AI ในเครื่องผ่านแพลตฟอร์มอย่าง Ollama ซึ่งบ่งชี้ถึงความต้องการที่เพิ่มขึ้นสำหรับโซลูชันระบบอัตโนมัติแบบ self-hosted

ทิศทางในอนาคต

ทีมพัฒนา Stagehand ได้แสดงให้เห็นถึงความทะเยอทะยานที่กว้างขวางขึ้นด้วยการชนะการแข่งขัน Anthropic's Claude MCP hackathon ด้วยการพัฒนา MCP server ความสำเร็จนี้บ่งชี้ถึงการขยายตัวในอนาคตที่นอกเหนือจากระบบอัตโนมัติบนเว็บไปสู่การผสานการใช้งานคอมพิวเตอร์ในวงกว้าง ซึ่งอาจปฏิวัติวิธีการที่เราใช้ในการทำระบบอัตโนมัติสำหรับการปฏิสัมพันธ์ระหว่างมนุษย์กับคอมพิวเตอร์

เฟรมเวิร์กนี้แสดงถึงความสมดุลในทางปฏิบัติระหว่างการเข้าถึงได้ง่ายและประสิทธิภาพ ทำให้ระบบอัตโนมัติบนเว็บที่ซับซ้อนเข้าถึงได้ง่ายขึ้น ในขณะที่ยังคงความทนทานที่จำเป็นสำหรับสภาพแวดล้อมการผลิตจริง

อ้างอิง: Stagehand: An AI web browsing framework focused on simplicity and extensibility