การทำออโตเมชันบนเบราว์เซอร์กำลังพัฒนาไปไกลกว่าวิธีการเขียนสคริปต์แบบดั้งเดิม และโปรเจกต์ใหม่ที่ชื่อว่า Workflow Use กำลังได้รับความสนใจจากแนวทางที่เป็นนวัตกรรมในการสร้างเวิร์กโฟลว์ที่กำหนดไว้แน่นอนและสามารถซ่อมแซมตัวเองได้ โปรเจกต์นี้ถูกอธิบายว่าเป็น RPA 2.0 มีเป้าหมายเพื่อทำให้กระบวนการออโตเมชันงานที่ทำซ้ำๆ บนเบราว์เซอร์ง่ายขึ้น โดยอนุญาตให้ผู้ใช้บันทึกการกระทำเพียงครั้งเดียวและเล่นซ้ำได้อย่างเชื่อถือได้
Workflow Use แสดงถึงวิวัฒนาการที่สำคัญในเทคโนโลยีออโตเมชันบนเบราว์เซอร์ ที่แก้ไขปัญหาทั่วไปที่นักพัฒนาและผู้ทดสอบประสบเมื่อทำงานกับเครื่องมือเช่น Playwright และ Selenium แม้ว่าจะยังอยู่ในช่วงเริ่มต้นของการพัฒนาและยังไม่แนะนำให้ใช้ในการผลิตจริง แต่โปรเจกต์นี้ก็ได้จุดประกายความสนใจอย่างมากในชุมชนออโตเมชัน
คุณสมบัติหลักของ Workflow Use
- บันทึกครั้งเดียว ใช้ซ้ำได้ตลอดไป: บันทึกการโต้ตอบกับเบราว์เซอร์เพียงครั้งเดียวและเล่นซ้ำได้ไม่จำกัด
- แสดงให้เห็น ไม่ต้องป้อนคำสั่ง: ขจัดการป้อนคำสั่งซ้ำๆ สำหรับงานอัตโนมัติ
- เวิร์กโฟลว์ที่มีโครงสร้างและสามารถดำเนินการได้: แปลงการบันทึกเป็นสคริปต์ที่แน่นอนพร้อมการดึงตัวแปรอัตโนมัติ
- เข้าใจการโต้ตอบแบบมนุษย์: กรองสัญญาณรบกวนจากการบันทึกเพื่อสร้างเวิร์กโฟลว์ที่มีความหมาย
- ความสามารถในการซ่อมแซมตัวเอง: กลับไปใช้ Browser Use หากขั้นตอนใดล้มเหลว
- พื้นฐานพร้อมสำหรับองค์กร: สร้างขึ้นเพื่อการขยายในอนาคต
ความสามารถในการซ่อมแซมตัวเอง
หนึ่งในคุณสมบัติที่ได้รับการพูดถึงมากที่สุดของ Workflow Use คือความสามารถในการซ่อมแซมตัวเอง เมื่อขั้นตอนของเวิร์กโฟลว์ล้มเหลว ระบบสามารถกลับไปใช้ Browser Use (เครื่องมือออโตเมชันเบราว์เซอร์ที่ขับเคลื่อนด้วย AI) โดยอัตโนมัติเพื่อพยายามกู้คืน แนวทางนี้แก้ไขความหงุดหงิดที่พบบ่อยกับเฟรมเวิร์กออโตเมชันแบบดั้งเดิมที่สคริปต์มักจะพังเมื่อเว็บไซต์มีการเปลี่ยนแปลง
Very cool to see the fallback to the agentic run when the automation breaks. For our e2e testing browser automation, we independently arrived at the same pattern and have been impressed with how well it works.
กลไกการซ่อมแซมตัวเองนี้ดูเหมือนจะได้รับการตอบรับที่ดีจากนักพัฒนาที่เคยประสบกับความเปราะบางของสคริปต์ออโตเมชันเบราว์เซอร์แบบดั้งเดิม ความสามารถในการอัปเดตเวิร์กโฟลว์โดยอัตโนมัติเมื่อเกิดข้อผิดพลาดอาจช่วยลดภาระในการบำรุงรักษาสำหรับทีมที่พึ่งพาออโตเมชันบนเบราว์เซอร์ได้อย่างมาก
ความท้าทายด้านเวลาและความน่าเชื่อถือ
การสนทนาในชุมชนเผยให้เห็นว่าปัญหาเรื่องเวลายังคงเป็นความกังวลสำคัญในการทำออโตเมชันบนเบราว์เซอร์ เมื่อดำเนินการตามลำดับของการกระทำบนเบราว์เซอร์ การทำให้แน่ใจว่าแต่ละขั้นตอนรอให้องค์ประกอบของหน้าเว็บโหลดอย่างเหมาะสมเป็นสิ่งสำคัญสำหรับความน่าเชื่อถือ
Workflow Use แก้ไขปัญหานี้ผ่านฟังก์ชันที่วิเคราะห์กิจกรรมเครือข่ายเพื่อกำหนดว่าเมื่อใดที่หน้าเว็บโหลดเสร็จสมบูรณ์ แทนที่จะพึ่งพาการหน่วงเวลาที่กำหนดไว้ตายตัว แนวทางนี้ช่วยกรองคำขอเครือข่ายที่ไม่จำเป็น เช่น การ ping วิเคราะห์ที่อาจสร้างความสับสนให้กับกลไกการจับเวลา
การประยุกต์ใช้ในองค์กรและกรณีการใช้งาน
มีหลายความคิดเห็นที่เน้นถึงการประยุกต์ใช้ Workflow Use ในองค์กร ความสามารถในการสร้างเวิร์กโฟลว์ที่กำหนดไว้แน่นอนซึ่งสามารถดำเนินการซ้ำๆ กับตัวแปรที่แตกต่างกันทำให้มีคุณค่าเป็นพิเศษสำหรับการทำออโตเมชันฟอร์ม การป้อนข้อมูล และสถานการณ์การทดสอบ
สมาชิกชุมชนคนหนึ่งสอบถามเป็นพิเศษเกี่ยวกับการใช้เครื่องมือนี้เพื่อดึงข้อมูลจากฐานข้อมูลและใช้ข้อมูลนั้นเพื่อกรอกแบบฟอร์มโดยอัตโนมัติ - ซึ่งเป็นความต้องการทั่วไปขององค์กรที่เน้นการประยุกต์ใช้งานจริงของเทคโนโลยีดังกล่าว
ความเป็นไปได้ในการขยายและการผสานรวม
มีความสนใจอย่างมากในการขยายความสามารถของ Workflow Use สมาชิกชุมชนได้แสดงความต้องการสำหรับการสนับสนุน Chrome Extension และความสามารถในการเรียกใช้ออโตเมชันโดยตรงในเซสชันเบราว์เซอร์ที่มีอยู่ สิ่งนี้จะมีคุณค่าเป็นพิเศษสำหรับเว็บไซต์ที่ใช้มาตรการต่อต้านการทำออโตเมชัน ซึ่งทำให้การทำออโตเมชันเบราว์เซอร์แบบ headless แบบดั้งเดิมมีความท้าทาย
โรดแมปของโปรเจกต์บ่งชี้ถึงการผสานรวมในอนาคตกับขั้นตอน LLM (Large Language Model) และความสามารถในการเปิดเผยเวิร์กโฟลว์เป็นเครื่องมือสำหรับระบบอื่นๆ ซึ่งบ่งชี้ถึงวิสัยทัศน์สำหรับ Workflow Use ในฐานะส่วนหนึ่งของระบบนิเวศออโตเมชันที่กว้างขึ้น
สรุปได้ว่า แม้ว่า Workflow Use จะยังอยู่ในช่วงเริ่มต้น แต่ก็แสดงถึงทิศทางที่น่าสนใจสำหรับเทคโนโลยีออโตเมชันบนเบราว์เซอร์ ด้วยการรวมเวิร์กโฟลว์ที่กำหนดไว้แน่นอนกับกลไกสำรองที่ขับเคลื่อนด้วย AI จึงแก้ไขจุดปวดหลักในแนวทางออโตเมชันปัจจุบัน เมื่อการพัฒนาดำเนินต่อไป โปรเจกต์นี้อาจส่งผลกระทบอย่างมีนัยสำคัญต่อวิธีที่ทีมต่างๆ เข้าถึงการทำออโตเมชันบนเว็บ โดยเฉพาะอย่างยิ่งสำหรับงานที่ทำซ้ำๆ ที่ต้องการความน่าเชื่อถือและความสามารถในการปรับตัวกับอินเทอร์เฟซเว็บที่เปลี่ยนแปลง
อ้างอิง: browser-use/workflow-use