การสาธิตโปรโตคอลเสียงของ AI Agents จุดประเด็นถกเถียงเรื่องการประดิษฐ์โมเด็มที่ไร้ประสิทธิภาพซ้ำ

BigGo Editorial Team
การสาธิตโปรโตคอลเสียงของ AI Agents จุดประเด็นถกเถียงเรื่องการประดิษฐ์โมเด็มที่ไร้ประสิทธิภาพซ้ำ

การสาธิตล่าสุดของโครงการ GibberLink ที่แสดงให้เห็นถึง AI agents สองตัวที่เปลี่ยนจากการสื่อสารด้วยเสียงไปเป็นการถ่ายโอนข้อมูลผ่านเสียง ได้จุดประเด็นการถกเถียงอย่างเข้มข้นในชุมชนเทคโนโลยีเกี่ยวกับประสิทธิภาพและความเป็นไปได้ในทางปฏิบัติของแนวทางดังกล่าวในโปรโตคอลการสื่อสารของ AI สมัยใหม่

องค์ประกอบการนำไปใช้งาน:

  • เอเจนต์ AI สนทนาของ ElevenLabs
  • โปรโตคอล 'ข้อมูลผ่านเสียง' ggwave
  • ฟังก์ชันเรียกใช้เครื่องมือ LLM

การประดิษฐ์ล้อขึ้นใหม่ แต่ช้ากว่า

การสาธิตที่แสดงให้เห็นถึง AI agents ที่เปลี่ยนไปใช้โปรโตคอลระดับเสียงหลังจากที่จำกันได้ ได้รับเสียงวิจารณ์ว่าเป็นเพียงการประดิษฐ์โมเด็มขึ้นใหม่ แต่มีประสิทธิภาพที่แย่กว่ามาก โปรโตคอล ggwave ที่ใช้นั้นทำงานได้เพียง 8-16 ไบต์ต่อวินาที ซึ่งต่ำกว่าความสามารถของโมเด็ม Bell 103 ในปี 1963 ที่ทำได้ 37 ไบต์ต่อวินาทีอย่างมาก ช่องว่างด้านประสิทธิภาพที่สำคัญนี้นำไปสู่การอภิปรายเกี่ยวกับคุณค่าในทางปฏิบัติของการใช้งานดังกล่าวในยุคที่การเชื่อมต่ออินเทอร์เน็ตแพร่หลาย

มันน่าเศร้าเล็กน้อยที่ได้ประดิษฐ์โมเด็มขึ้นใหม่แต่มีประสิทธิภาพน้อยกว่าถึง 10,000 เท่า

การเปรียบเทียบความเร็วในการถ่ายโอนข้อมูล:

  • GibberLink (ggwave): 8-16 ไบต์/วินาที
  • โมเด็ม Bell 103 (1963): 37 ไบต์/วินาที

ข้อเสนอทางเลือกที่ดีกว่า

ผู้เชี่ยวชาญทางเทคนิคจากชุมชนได้เสนอทางเลือกที่มีประสิทธิภาพมากกว่าหลายวิธีสำหรับการใช้งานในปัจจุบัน ข้อเสนอที่พบบ่อยที่สุดคือการแลกเปลี่ยนข้อมูลจุดสิ้นสุดหรือรหัสการสนทนาที่ไม่ซ้ำกันเมื่อ AI agents จำกันได้ ตามด้วยการเปลี่ยนไปใช้ช่องทางการสื่อสารผ่านอินเทอร์เน็ตโดยตรง แนวทางนี้จะกำจัดความจำเป็นในการถ่ายโอนข้อมูลผ่านเสียงที่ไร้ประสิทธิภาพ ในขณะที่ยังคงความสามารถให้ AI agents จำและสื่อสารกันได้

ความต้องการมาตรฐาน

ประเด็นสำคัญที่เกิดขึ้นจากการอภิปรายคือความจำเป็นในการมีโปรโตคอลมาตรฐานสำหรับการสื่อสารของ AI agent แม้ว่าการใช้งานในปัจจุบันอาจไม่เหมาะสมที่สุด แต่ชุมชนตระหนักถึงความสำคัญของการจัดทำเอกสารอย่างเป็นทางการสำหรับการจับมือและการเปลี่ยนโปรโตคอลระหว่าง AI การทำให้เป็นมาตรฐานนี้จะช่วยให้การสื่อสารระหว่าง AI agents บนแพลตฟอร์มและการใช้งานที่แตกต่างกันมีประสิทธิภาพและน่าเชื่อถือมากขึ้น

ความปลอดภัยและข้อพิจารณาในทางปฏิบัติ

การสาธิตนี้ยังได้ยกคำถามเกี่ยวกับสถานการณ์ในทางปฏิบัติที่การสื่อสารผ่านเสียงดังกล่าวจะมีความจำเป็น เมื่อพิจารณาถึงความแพร่หลายของการเชื่อมต่ออินเทอร์เน็ต สมาชิกบางคนในชุมชนชี้ให้เห็นว่าในกรณีส่วนใหญ่ที่การสื่อสารด้วยเสียงเป็นไปได้ การเข้าถึงอินเทอร์เน็ตก็มักจะมีอยู่ด้วย ทำให้โปรโตคอลเสียงเป็นสิ่งที่ซ้ำซ้อน

การอภิปรายเกี่ยวกับ GibberLink เป็นเครื่องเตือนใจว่าในขณะที่นวัตกรรมในการสื่อสารของ AI มีความสำคัญ แต่ก็จำเป็นต้องพิจารณาเทคโนโลยีที่มีอยู่และมาตรฐานประสิทธิภาพเมื่อพัฒนาโซลูชันใหม่ ๆ เมื่อ AI ยังคงพัฒนาต่อไป จุดเน้นควรอยู่ที่การสร้างวิธีการสื่อสารระหว่าง AI agents ที่ใช้งานได้จริง มีประสิทธิภาพ และเป็นมาตรฐาน

อ้างอิง: GibberLink: A Demo of Two Conversational AI Agents Switching from English to Sound-Level Protocol

การสาธิตเอเจนต์ AI ที่กำลังสื่อสารและตั้งคำถามเกี่ยวกับประสิทธิภาพของโปรโตคอลการสื่อสารด้วยเสียงของพวกเขา
การสาธิตเอเจนต์ AI ที่กำลังสื่อสารและตั้งคำถามเกี่ยวกับประสิทธิภาพของโปรโตคอลการสื่อสารด้วยเสียงของพวกเขา