ในภูมิทัศน์ของปัญญาประดิษฐ์ที่กำลังพัฒนาอย่างต่อเนื่อง มีการทดลองที่น่าสนใจเกิดขึ้น: การใช้โมเดลภาษาขนาดใหญ่ (large language models) เล่นเกม Pokemon FireRed โดยอัตโนมัติ โครงการนี้มีชื่อว่า Fire Red Agent ได้จุดประกายการถกเถียงเกี่ยวกับวิธีการที่มีประสิทธิภาพมากที่สุดสำหรับ AI ที่เล่นเกม และผลกระทบในวงกว้างต่อวงการความบันเทิง
โครงการ Fire Red Agent
โครงการ Fire Red Agent เป็นความพยายามอันทะเยอทะยานในการให้โมเดลภาษาขนาดใหญ่เล่นเกม Pokemon FireRed โดยอัตโนมัติ นักพัฒนาได้ผสานรวม LLM เข้ากับโปรแกรมจำลองเกม พร้อมทั้งติดตั้งระบบสำหรับการอ่านหน่วยความจำ การนำทาง การหาเส้นทาง และการจัดการการต่อสู้ แม้จะประสบกับอุปสรรคทางเทคนิค โดยเฉพาะอย่างยิ่งเกี่ยวกับการควบคุมอินพุตแบบโปรแกรมกับโปรแกรมจำลอง RetroArch โครงการนี้แสดงให้เห็นถึงศักยภาพของ LLMs ในการเข้าใจและนำทางในสภาพแวดล้อมของเกมที่ซับซ้อนโดยไม่ต้องมีการฝึกฝนเฉพาะทางสำหรับจุดประสงค์นั้น
สิ่งที่ทำให้โครงการนี้น่าสนใจเป็นพิเศษคือวิสัยทัศน์ของนักพัฒนาที่มองว่านี่คืออนาคตของโทรทัศน์ - โดยวางตำแหน่งการเล่นเกมของ AI เป็นเนื้อหาความบันเทิงมากกว่าเป็นเพียงการสาธิตทางเทคนิค มุมมองนี้บ่งชี้ถึงรูปแบบใหม่ของสื่อแบบโต้ตอบที่ AI จะกลายเป็นผู้แสดงที่ผู้ชมสามารถรับชมและอาจมีอิทธิพลต่อการแสดงได้
องค์ประกอบหลักของ Fire Red Agent
- การรวมเข้ากับ Emulator
- การจัดการหน่วยความจำของเกม
- การนำทางและการค้นหาเส้นทาง
- การแยกวิเคราะห์ข้อความในเกม
- การผสานรวม LLM (โดยใช้ GPT-4o)
- การจัดการการต่อสู้
- การจัดการการโต้ตอบและการสนทนา
การเปรียบเทียบโครงการ AI Pokemon
โครงการ | เทคโนโลยี | ความคืบหน้า |
---|---|---|
Fire Red Agent | LLM (GPT-4o) | การพัฒนาหยุดชะงักเนื่องจากปัญหาการควบคุมอินพุต |
Claude Plays Pokemon | Claude 3.7 LLM | เอาชนะ Lt. Surge ได้, แก้ปริศนาในยิมสำเร็จ |
AI Plays Pokemon | CNNs และ Reinforcement Learning | ไปถึง Mt. Moon หลังจากพัฒนาหลายเดือน |
LLMs เปรียบเทียบกับวิธีการ AI แบบดั้งเดิม
การสนทนาในชุมชนเผยให้เห็นการถกเถียงที่สำคัญว่า LLMs เป็นเครื่องมือที่เหมาะสมที่สุดสำหรับงานนี้หรือไม่ ผู้แสดงความคิดเห็นบางคนชี้ให้เห็นว่าวิธีการ AI แบบดั้งเดิมที่ใช้ตัวค้นหาเส้นทาง (pathfinders) แผนภูมิพฤติกรรม (behavior trees) และการวางแผนการกระทำที่มุ่งเน้นเป้าหมาย (goal-oriented action planning - GOAP) สามารถเล่น Pokemon ได้อย่างมีประสิทธิภาพและประสิทธิผลมากกว่า LLM
ผมอยากระบุว่าถ้าคุณต้องการให้ AI เล่น Pokemon จริงๆ คุณสามารถทำได้ด้วย AI ที่ง่ายกว่าและถูกกว่า LLM มาก และมันจะเล่นเกมได้ดีกว่ามาก ทำให้สิ่งนี้เป็นเพียงการออกกำลังสมองในการทำให้สิ่งที่ง่ายกลายเป็นเรื่องซับซ้อนเกินไป
อย่างไรก็ตาม ผู้สนับสนุนแนวทาง LLM เน้นย้ำว่าคุณค่าไม่ได้อยู่ที่การปรับให้เหมาะสมที่สุด แต่อยู่ที่การสร้างให้เป็นแบบทั่วไป ความจริงที่ว่า Claude 3.7 สามารถเล่น Pokemon ได้อย่างมีประสิทธิภาพโดยไม่ได้ถูกออกแบบมาเฉพาะสำหรับมัน แสดงให้เห็นถึงตัว G ใน AGI (ปัญญาประดิษฐ์ทั่วไป - Artificial General Intelligence) ไม่เหมือนกับระบบเฉพาะทางที่เก่งในงานเดียวแต่ล้มเหลวในงานอื่นๆ LLMs แสดงให้เห็นถึงการปรับตัวในความท้าทายที่หลากหลาย ซึ่งเป็นลักษณะสำคัญของปัญญาทั่วไป
Claude เล่น Pokemon และการนำไปใช้ทางเทคนิค
การสนทนายังอ้างถึงโครงการอื่น คือ Claude Plays Pokemon ซึ่งดูเหมือนจะมีความคืบหน้าอย่างมีนัยสำคัญในเกม การคาดการณ์ของชุมชนมุ่งเน้นไปที่วิธีการที่การใช้งานนี้ประมวลผลข้อมูลเกม - ไม่ว่าจะเป็นการแยกวิเคราะห์หน่วยความจำโดยตรงหรือโดยการป้อนข้อมูล RAM ดิบให้กับ LLM โครงการ Claude รายงานว่าได้ก้าวหน้าเกินกว่า Mt. Moon และเอาชนะ Lt. Surge แสดงให้เห็นถึงความสามารถที่น่าประทับใจสำหรับวิธีการที่ใช้ LLM
ความสำเร็จนี้มีความโดดเด่นเป็นพิเศษเมื่อเทียบกับโครงการ AI Pokemon ก่อนหน้านี้ที่ใช้เครือข่ายประสาทเทียมแบบคอนโวลูชัน (convolutional neural networks) และการเรียนรู้แบบเสริมแรง (reinforcement learning) ซึ่งมีรายงานว่าใช้เวลาหลายเดือนในการทำซ้ำและทรัพยากรการคำนวณจำนวนมากเพื่อไปถึง Mt. Moon
ข้อเสนอคุณค่าด้านความบันเทิง
บางทีแง่มุมที่น่าสนใจที่สุดของโครงการเหล่านี้คือศักยภาพด้านความบันเทิง นักพัฒนา Fire Red Agent มองเห็นระบบที่ AI เล่นเกมโดยอัตโนมัติในขณะที่รวมคำแนะนำจากผู้ชม สร้างประสบการณ์ความบันเทิงแบบโต้ตอบ ผู้แสดงความคิดเห็นบางคนขยายวิสัยทัศน์นี้ให้รวมถึงหุ่นยนต์ AI ที่ต่อสู้แบบนักรบหรือการเล่นเกมแข่งขันระหว่างทีม AI ที่จัดการโดยโค้ชมนุษย์
มุมมองนี้ปรับเปลี่ยนการเล่นเกมของ AI จากความท้าทายทางเทคนิคล้วนๆ ไปสู่รูปแบบของการผลิตความบันเทิง ซึ่งอาจสร้างหมวดหมู่สื่อใหม่ที่ตัวแทน AI กลายเป็นผู้แสดงและมนุษย์กลายเป็นผู้กำกับหรือผู้มีอิทธิพลต่อพฤติกรรมของพวกเขา
เมื่อ LLMs ยังคงพัฒนาความสามารถอย่างต่อเนื่อง เราอาจเห็นการทดลองมากขึ้นที่เบลอเส้นแบ่งระหว่างการวิจัย AI เกม และความบันเทิง ไม่ว่าการดูบอทเล่น Pokemon จะกลายเป็นอนาคตของโทรทัศน์หรือไม่ก็ตาม โครงการเหล่านี้แน่นอนว่าชี้ให้เห็นถึงความเป็นไปได้ที่น่าสนใจสำหรับวิธีที่เราอาจมีปฏิสัมพันธ์กับและได้รับความบันเทิงจากปัญญาประดิษฐ์ในปีต่อๆ ไป
อ้างอิง: Fire Red Agent