การสาธิตล่าสุดของโครงการ GibberLink ที่แสดงให้เห็นถึง AI agents สองตัวที่เปลี่ยนจากการสื่อสารด้วยเสียงไปเป็นการถ่ายโอนข้อมูลผ่านเสียง ได้จุดประเด็นการถกเถียงอย่างเข้มข้นในชุมชนเทคโนโลยีเกี่ยวกับประสิทธิภาพและความเป็นไปได้ในทางปฏิบัติของแนวทางดังกล่าวในโปรโตคอลการสื่อสารของ AI สมัยใหม่
องค์ประกอบการนำไปใช้งาน:
- เอเจนต์ AI สนทนาของ ElevenLabs
- โปรโตคอล 'ข้อมูลผ่านเสียง' ggwave
- ฟังก์ชันเรียกใช้เครื่องมือ LLM
การประดิษฐ์ล้อขึ้นใหม่ แต่ช้ากว่า
การสาธิตที่แสดงให้เห็นถึง AI agents ที่เปลี่ยนไปใช้โปรโตคอลระดับเสียงหลังจากที่จำกันได้ ได้รับเสียงวิจารณ์ว่าเป็นเพียงการประดิษฐ์โมเด็มขึ้นใหม่ แต่มีประสิทธิภาพที่แย่กว่ามาก โปรโตคอล ggwave ที่ใช้นั้นทำงานได้เพียง 8-16 ไบต์ต่อวินาที ซึ่งต่ำกว่าความสามารถของโมเด็ม Bell 103 ในปี 1963 ที่ทำได้ 37 ไบต์ต่อวินาทีอย่างมาก ช่องว่างด้านประสิทธิภาพที่สำคัญนี้นำไปสู่การอภิปรายเกี่ยวกับคุณค่าในทางปฏิบัติของการใช้งานดังกล่าวในยุคที่การเชื่อมต่ออินเทอร์เน็ตแพร่หลาย
มันน่าเศร้าเล็กน้อยที่ได้ประดิษฐ์โมเด็มขึ้นใหม่แต่มีประสิทธิภาพน้อยกว่าถึง 10,000 เท่า
การเปรียบเทียบความเร็วในการถ่ายโอนข้อมูล:
- GibberLink (ggwave): 8-16 ไบต์/วินาที
- โมเด็ม Bell 103 (1963): 37 ไบต์/วินาที
ข้อเสนอทางเลือกที่ดีกว่า
ผู้เชี่ยวชาญทางเทคนิคจากชุมชนได้เสนอทางเลือกที่มีประสิทธิภาพมากกว่าหลายวิธีสำหรับการใช้งานในปัจจุบัน ข้อเสนอที่พบบ่อยที่สุดคือการแลกเปลี่ยนข้อมูลจุดสิ้นสุดหรือรหัสการสนทนาที่ไม่ซ้ำกันเมื่อ AI agents จำกันได้ ตามด้วยการเปลี่ยนไปใช้ช่องทางการสื่อสารผ่านอินเทอร์เน็ตโดยตรง แนวทางนี้จะกำจัดความจำเป็นในการถ่ายโอนข้อมูลผ่านเสียงที่ไร้ประสิทธิภาพ ในขณะที่ยังคงความสามารถให้ AI agents จำและสื่อสารกันได้
ความต้องการมาตรฐาน
ประเด็นสำคัญที่เกิดขึ้นจากการอภิปรายคือความจำเป็นในการมีโปรโตคอลมาตรฐานสำหรับการสื่อสารของ AI agent แม้ว่าการใช้งานในปัจจุบันอาจไม่เหมาะสมที่สุด แต่ชุมชนตระหนักถึงความสำคัญของการจัดทำเอกสารอย่างเป็นทางการสำหรับการจับมือและการเปลี่ยนโปรโตคอลระหว่าง AI การทำให้เป็นมาตรฐานนี้จะช่วยให้การสื่อสารระหว่าง AI agents บนแพลตฟอร์มและการใช้งานที่แตกต่างกันมีประสิทธิภาพและน่าเชื่อถือมากขึ้น
ความปลอดภัยและข้อพิจารณาในทางปฏิบัติ
การสาธิตนี้ยังได้ยกคำถามเกี่ยวกับสถานการณ์ในทางปฏิบัติที่การสื่อสารผ่านเสียงดังกล่าวจะมีความจำเป็น เมื่อพิจารณาถึงความแพร่หลายของการเชื่อมต่ออินเทอร์เน็ต สมาชิกบางคนในชุมชนชี้ให้เห็นว่าในกรณีส่วนใหญ่ที่การสื่อสารด้วยเสียงเป็นไปได้ การเข้าถึงอินเทอร์เน็ตก็มักจะมีอยู่ด้วย ทำให้โปรโตคอลเสียงเป็นสิ่งที่ซ้ำซ้อน
การอภิปรายเกี่ยวกับ GibberLink เป็นเครื่องเตือนใจว่าในขณะที่นวัตกรรมในการสื่อสารของ AI มีความสำคัญ แต่ก็จำเป็นต้องพิจารณาเทคโนโลยีที่มีอยู่และมาตรฐานประสิทธิภาพเมื่อพัฒนาโซลูชันใหม่ ๆ เมื่อ AI ยังคงพัฒนาต่อไป จุดเน้นควรอยู่ที่การสร้างวิธีการสื่อสารระหว่าง AI agents ที่ใช้งานได้จริง มีประสิทธิภาพ และเป็นมาตรฐาน
อ้างอิง: GibberLink: A Demo of Two Conversational AI Agents Switching from English to Sound-Level Protocol
![]() |
---|
การสาธิตเอเจนต์ AI ที่กำลังสื่อสารและตั้งคำถามเกี่ยวกับประสิทธิภาพของโปรโตคอลการสื่อสารด้วยเสียงของพวกเขา |