LLMs ปะทะ AI แบบดั้งเดิม: การแข่งขันเพื่อความเป็นเลิศใน Pokemon ทวีความเข้มข้น

BigGo Editorial Team
LLMs ปะทะ AI แบบดั้งเดิม: การแข่งขันเพื่อความเป็นเลิศใน Pokemon ทวีความเข้มข้น

ในภูมิทัศน์ของปัญญาประดิษฐ์ที่กำลังพัฒนาอย่างต่อเนื่อง มีการทดลองที่น่าสนใจเกิดขึ้น: การใช้โมเดลภาษาขนาดใหญ่ (large language models) เล่นเกม Pokemon FireRed โดยอัตโนมัติ โครงการนี้มีชื่อว่า Fire Red Agent ได้จุดประกายการถกเถียงเกี่ยวกับวิธีการที่มีประสิทธิภาพมากที่สุดสำหรับ AI ที่เล่นเกม และผลกระทบในวงกว้างต่อวงการความบันเทิง

โครงการ Fire Red Agent

โครงการ Fire Red Agent เป็นความพยายามอันทะเยอทะยานในการให้โมเดลภาษาขนาดใหญ่เล่นเกม Pokemon FireRed โดยอัตโนมัติ นักพัฒนาได้ผสานรวม LLM เข้ากับโปรแกรมจำลองเกม พร้อมทั้งติดตั้งระบบสำหรับการอ่านหน่วยความจำ การนำทาง การหาเส้นทาง และการจัดการการต่อสู้ แม้จะประสบกับอุปสรรคทางเทคนิค โดยเฉพาะอย่างยิ่งเกี่ยวกับการควบคุมอินพุตแบบโปรแกรมกับโปรแกรมจำลอง RetroArch โครงการนี้แสดงให้เห็นถึงศักยภาพของ LLMs ในการเข้าใจและนำทางในสภาพแวดล้อมของเกมที่ซับซ้อนโดยไม่ต้องมีการฝึกฝนเฉพาะทางสำหรับจุดประสงค์นั้น

สิ่งที่ทำให้โครงการนี้น่าสนใจเป็นพิเศษคือวิสัยทัศน์ของนักพัฒนาที่มองว่านี่คืออนาคตของโทรทัศน์ - โดยวางตำแหน่งการเล่นเกมของ AI เป็นเนื้อหาความบันเทิงมากกว่าเป็นเพียงการสาธิตทางเทคนิค มุมมองนี้บ่งชี้ถึงรูปแบบใหม่ของสื่อแบบโต้ตอบที่ AI จะกลายเป็นผู้แสดงที่ผู้ชมสามารถรับชมและอาจมีอิทธิพลต่อการแสดงได้

องค์ประกอบหลักของ Fire Red Agent

  • การรวมเข้ากับ Emulator
  • การจัดการหน่วยความจำของเกม
  • การนำทางและการค้นหาเส้นทาง
  • การแยกวิเคราะห์ข้อความในเกม
  • การผสานรวม LLM (โดยใช้ GPT-4o)
  • การจัดการการต่อสู้
  • การจัดการการโต้ตอบและการสนทนา

การเปรียบเทียบโครงการ AI Pokemon

โครงการ เทคโนโลยี ความคืบหน้า
Fire Red Agent LLM (GPT-4o) การพัฒนาหยุดชะงักเนื่องจากปัญหาการควบคุมอินพุต
Claude Plays Pokemon Claude 3.7 LLM เอาชนะ Lt. Surge ได้, แก้ปริศนาในยิมสำเร็จ
AI Plays Pokemon CNNs และ Reinforcement Learning ไปถึง Mt. Moon หลังจากพัฒนาหลายเดือน

LLMs เปรียบเทียบกับวิธีการ AI แบบดั้งเดิม

การสนทนาในชุมชนเผยให้เห็นการถกเถียงที่สำคัญว่า LLMs เป็นเครื่องมือที่เหมาะสมที่สุดสำหรับงานนี้หรือไม่ ผู้แสดงความคิดเห็นบางคนชี้ให้เห็นว่าวิธีการ AI แบบดั้งเดิมที่ใช้ตัวค้นหาเส้นทาง (pathfinders) แผนภูมิพฤติกรรม (behavior trees) และการวางแผนการกระทำที่มุ่งเน้นเป้าหมาย (goal-oriented action planning - GOAP) สามารถเล่น Pokemon ได้อย่างมีประสิทธิภาพและประสิทธิผลมากกว่า LLM

ผมอยากระบุว่าถ้าคุณต้องการให้ AI เล่น Pokemon จริงๆ คุณสามารถทำได้ด้วย AI ที่ง่ายกว่าและถูกกว่า LLM มาก และมันจะเล่นเกมได้ดีกว่ามาก ทำให้สิ่งนี้เป็นเพียงการออกกำลังสมองในการทำให้สิ่งที่ง่ายกลายเป็นเรื่องซับซ้อนเกินไป

อย่างไรก็ตาม ผู้สนับสนุนแนวทาง LLM เน้นย้ำว่าคุณค่าไม่ได้อยู่ที่การปรับให้เหมาะสมที่สุด แต่อยู่ที่การสร้างให้เป็นแบบทั่วไป ความจริงที่ว่า Claude 3.7 สามารถเล่น Pokemon ได้อย่างมีประสิทธิภาพโดยไม่ได้ถูกออกแบบมาเฉพาะสำหรับมัน แสดงให้เห็นถึงตัว G ใน AGI (ปัญญาประดิษฐ์ทั่วไป - Artificial General Intelligence) ไม่เหมือนกับระบบเฉพาะทางที่เก่งในงานเดียวแต่ล้มเหลวในงานอื่นๆ LLMs แสดงให้เห็นถึงการปรับตัวในความท้าทายที่หลากหลาย ซึ่งเป็นลักษณะสำคัญของปัญญาทั่วไป

Claude เล่น Pokemon และการนำไปใช้ทางเทคนิค

การสนทนายังอ้างถึงโครงการอื่น คือ Claude Plays Pokemon ซึ่งดูเหมือนจะมีความคืบหน้าอย่างมีนัยสำคัญในเกม การคาดการณ์ของชุมชนมุ่งเน้นไปที่วิธีการที่การใช้งานนี้ประมวลผลข้อมูลเกม - ไม่ว่าจะเป็นการแยกวิเคราะห์หน่วยความจำโดยตรงหรือโดยการป้อนข้อมูล RAM ดิบให้กับ LLM โครงการ Claude รายงานว่าได้ก้าวหน้าเกินกว่า Mt. Moon และเอาชนะ Lt. Surge แสดงให้เห็นถึงความสามารถที่น่าประทับใจสำหรับวิธีการที่ใช้ LLM

ความสำเร็จนี้มีความโดดเด่นเป็นพิเศษเมื่อเทียบกับโครงการ AI Pokemon ก่อนหน้านี้ที่ใช้เครือข่ายประสาทเทียมแบบคอนโวลูชัน (convolutional neural networks) และการเรียนรู้แบบเสริมแรง (reinforcement learning) ซึ่งมีรายงานว่าใช้เวลาหลายเดือนในการทำซ้ำและทรัพยากรการคำนวณจำนวนมากเพื่อไปถึง Mt. Moon

ข้อเสนอคุณค่าด้านความบันเทิง

บางทีแง่มุมที่น่าสนใจที่สุดของโครงการเหล่านี้คือศักยภาพด้านความบันเทิง นักพัฒนา Fire Red Agent มองเห็นระบบที่ AI เล่นเกมโดยอัตโนมัติในขณะที่รวมคำแนะนำจากผู้ชม สร้างประสบการณ์ความบันเทิงแบบโต้ตอบ ผู้แสดงความคิดเห็นบางคนขยายวิสัยทัศน์นี้ให้รวมถึงหุ่นยนต์ AI ที่ต่อสู้แบบนักรบหรือการเล่นเกมแข่งขันระหว่างทีม AI ที่จัดการโดยโค้ชมนุษย์

มุมมองนี้ปรับเปลี่ยนการเล่นเกมของ AI จากความท้าทายทางเทคนิคล้วนๆ ไปสู่รูปแบบของการผลิตความบันเทิง ซึ่งอาจสร้างหมวดหมู่สื่อใหม่ที่ตัวแทน AI กลายเป็นผู้แสดงและมนุษย์กลายเป็นผู้กำกับหรือผู้มีอิทธิพลต่อพฤติกรรมของพวกเขา

เมื่อ LLMs ยังคงพัฒนาความสามารถอย่างต่อเนื่อง เราอาจเห็นการทดลองมากขึ้นที่เบลอเส้นแบ่งระหว่างการวิจัย AI เกม และความบันเทิง ไม่ว่าการดูบอทเล่น Pokemon จะกลายเป็นอนาคตของโทรทัศน์หรือไม่ก็ตาม โครงการเหล่านี้แน่นอนว่าชี้ให้เห็นถึงความเป็นไปได้ที่น่าสนใจสำหรับวิธีที่เราอาจมีปฏิสัมพันธ์กับและได้รับความบันเทิงจากปัญญาประดิษฐ์ในปีต่อๆ ไป

อ้างอิง: Fire Red Agent