AI Phone Agents ก่อให้เกิดความกังวลด้านความเป็นส่วนตัวและความปลอดภัยอย่างมาก แม้จะมีความสามารถที่น่าประทับใจ

BigGo Editorial Team
AI Phone Agents ก่อให้เกิดความกังวลด้านความเป็นส่วนตัวและความปลอดภัยอย่างมาก แม้จะมีความสามารถที่น่าประทับใจ

การนำเสนอ PhoneAgent เมื่อเร็วๆ นี้ ซึ่งเป็นระบบ AI ที่สามารถควบคุม iPhone ข้ามหลายแอปพลิเคชันโดยใช้คำสั่งภาษาธรรมชาติ ได้จุดประกายการถกเถียงอย่างเข้มข้นเกี่ยวกับผลกระทบด้านความเป็นส่วนตัวและความปลอดภัยของ AI agents ที่มีการเข้าถึงทั้งระบบ เครื่องมือทดลองนี้ซึ่งสร้างขึ้นระหว่าง hackathon ของ OpenAI แสดงให้เห็นทั้งศักยภาพที่น่าประทับใจและความเสี่ยงที่น่าตกใจของระบบ AI อัตโนมัติ

ฝันร้ายด้านความเป็นส่วนตัว: ราคาของความสะดวกสบาย

ความกังวลหลักมุ่งเน้นไปที่สิทธิ์การเข้าถึงที่กว้างขวางซึ่ง AI agents เหล่านี้ต้องการเพื่อให้ทำงานได้อย่างมีประสิทธิภาพ เพื่อทำงานที่ซับซ้อนเช่นการจองตั้วบินและส่งข้อความหาเพื่อน AI agent จะต้องเข้าถึงเบราว์เซอร์ ข้อมูลการชำระเงิน ปฏิทิน แอปส่งข้อความ และโดยพื้นฐานแล้วคือสิทธิ์ระดับ root ทั่วทั้งระบบ สิ่งนี้สร้างสิ่งที่ผู้เชี่ยวชาญเรียกว่าปัญหา blood-brain barrier ระหว่างแอปพลิเคชันและระบบปฏิบัติการ

ดังนั้นจึงมีปัญหาร้ายแรงเกี่ยวกับความปลอดภัยและความเป็นส่วนตัวที่กำลังหลอกหลอนการโฆษณาชวนเชื่อรอบ agents และนั่นคือการคุกคามที่จะทำลาย blood-brain barrier ระหว่างชั้นแอปพลิเคชันและชั้น OS โดยการรวมบริการแยกต่างหากเหล่านี้เข้าด้วยกัน ทำให้ข้อมูลของพวกเขาสับสน และทำสิ่งต่างๆ เช่นการบ่อนทำลายความเป็นส่วนตัวของข้อความ Signal ของคุณ

การใช้งานทางเทคนิคของ PhoneAgent เผยให้เห็นความท้าทายเหล่านี้ในทางปฏิบัติ ระบบใช้ UI testing framework ของ Xcode เพื่อหลีกเลี่ยงข้อจำกัดของ iOS sandboxing ทำให้สามารถโต้ตอบกับแอปใดก็ได้บนอุปกรณ์ แม้ว่าวิธีการนี้จะหลีกเลี่ยงความต้องการ jailbreaking แต่ก็แสดงให้เห็นว่า AI agents ต้องหลีกเลี่ยงมาตรการความปลอดภัยที่มีอยู่เพื่อให้บรรลุการทำงานของพวกเขา

ข้อมูลจำเพาะทางเทคนิคของ PhoneAgent :

  • โมเดล AI: OpenAI GPT-4.1
  • แพลตฟอร์ม: iOS (ผ่าน Xcode UI testing framework )
  • ความสามารถหลัก:
    • เข้าถึง accessibility trees ของแอป
    • แตะ ปัด เลื่อน พิมพ์ และเปิดแอป
    • รองรับคำสั่งเสียงพร้อมการตรวจจับคำสั่งปลุก
    • โหมดฟังเบื้องหลังตลอดเวลา
  • การสื่อสาร: เซิร์ฟเวอร์ TCP ระหว่างแอปหลักและการทดสอบ UI
  • ความปลอดภัย: API key เก็บไว้ใน device keychain

ปัญหาการควบคุม: เมื่อ AI Agents ทำงานอย่างคาดเดาไม่ได้

การอภิปรายในชุมชนได้เน้นย้ำคำถามพื้นฐานเกี่ยวกับพฤติกรรมและการควบคุมของ AI agent ความท้าทายไม่ใช่แค่ด้านเทคนิคแต่เป็นปรัชญา - เราจะมั่นใจได้อย่างไรว่าระบบ AI เข้าใจผลที่ตามมาในโลกแห่งความเป็นจริงของการกระทำของพวกเขา โมเดล AI ปัจจุบันเก่งในการทำตามคำสั่ง แต่อาจขาดความเข้าใจในบริบทเพื่อรับรู้ว่าเมื่อใดที่การกระทำของพวกเขาอาจก่อให้เกิดอันตราย

ความไม่แน่นอนนี้กลายเป็นเรื่องที่น่ากังวลเป็นพิเศษเมื่อ AI agents ทำงานด้วยสิทธิ์ระบบที่กว้างขวาง ไม่เหมือนซอฟต์แวร์แบบดั้งเดิมที่มีรูปแบบพฤติกรรมที่คาดเดาได้ AI agents สามารถตีความคำสั่งในวิธีที่ไม่คาดคิด ซึ่งอาจนำไปสู่ผลที่ตามมาที่ไม่ได้ตั้งใจข้ามหลายแอปพลิเคชันและบริการ

ข้อจำกัดปัจจุบัน:

  • ปัญหาความแม่นยำในการป้อนข้อมูลผ่านแป้นพิมพ์
  • ความสับสนระหว่างการแสดงผลแอนิเมชันของ UI
  • การยกเลิกงานก่อนเวลาอันควรสำหรับการดำเนินงานที่ใช้เวลานาน
  • ไม่มีการแสดงภาพหน้าจอ (มีเพียง accessibility tree เท่านั้น)
  • ต้องการการส่งข้อมูลไปยังเซิร์ฟเวอร์ของ OpenAI
  • ซอฟต์แวร์ทดลองที่อาจมีข้อผิดพลาดได้

ข้อจำกัดทางเทคนิคและผลกระทบในอนาคต

ข้อจำกัดปัจจุบันของ PhoneAgent เผยให้เห็นทั้งขั้นตอนเริ่มต้นของเทคโนโลยีนี้และพื้นที่สำหรับการปรับปรุง ระบบมีปัญหากับการป้อนข้อมูลคีย์บอร์ด สับสนระหว่างภาพเคลื่อนไหว และไม่รอให้งานที่ใช้เวลานานเสร็จสิ้น ที่สำคัญกว่านั้น ปัจจุบันมันส่งเนื้อหาแอปไปยังเซิร์ฟเวอร์ของ OpenAI เพื่อการประมวลผล ซึ่งเน้นย้ำความกังวลเกี่ยวกับการประมวลผลข้อมูลนอกอุปกรณ์

เมื่อมองไปข้างหน้า ชุมชนมองเห็น AI agents ที่กลายเป็นระบบที่ซับซ้อนมากขึ้น อาจพัฒนาเป็นระบบอัตโนมัติที่สามารถจัดการทรัพยากรและการจำลองตัวเองได้ แม้ว่าสิ่งนี้จะยังคงเป็นเรื่องคาดเดา แต่ก็เน้นย้ำความสำคัญของการแก้ไขปัญหาความปลอดภัยและการควบคุมก่อนที่เทคโนโลยีเหล่านี้จะแพร่หลายมากขึ้น

ความแตกต่างระหว่างการสาธิตที่น่าประทับใจของ PhoneAgent และแนวทาง Apple Intelligence ที่ระมัดระวังมากกว่าของ Apple สะท้อนถึงความตึงเครียดในอุตสาหกรรมที่กว้างขวางระหว่างนวัตกรรมและความรับผิดชอบ เมื่อ AI agents มีความสามารถมากขึ้น ความท้าทายจะเป็นการสร้างสมดุลระหว่างประโยชน์ของพวกเขากับหลักการความเป็นส่วนตัวและความปลอดภัยพื้นฐานที่ปกป้องผู้ใช้

อ้างอิง: PhoneAgent