โมเดล AI แข่งขันในการสร้างเกมต้อนแกะ: Claude 3.7 ขึ้นนำ

BigGo Editorial Team
โมเดล AI แข่งขันในการสร้างเกมต้อนแกะ: Claude 3.7 ขึ้นนำ

การพยายามสร้างพฤติกรรมการรวมฝูงที่สมจริงในเกมเป็นความท้าทายของนักพัฒนามาอย่างยาวนาน แต่ตอนนี้โมเดลภาษา AI กำลังแสดงความสามารถที่น่าประทับใจในการพัฒนาเกม การทดลองล่าสุดได้ท้าทายโมเดล AI หลายตัวให้สร้างเกมต้อนแกะชื่อ Shepherd's Dog ในความพยายามเดียว โดย Claude 3.7 ได้ก้าวขึ้นมาเป็นผู้ชนะอย่างชัดเจน

แนวคิดเบื้องหลัง Shepherd's Dog นั้นเรียบง่ายแต่น่าสนใจ: ผู้เล่นควบคุมสุนัขเพื่อต้อนแกะเข้าคอกก่อนพลบค่ำ สิ่งที่ทำให้เกมนี้น่าสนใจคือพฤติกรรมการรวมฝูงที่สมจริงของแกะ ซึ่งต้องแสดงพลวัตกลุ่มที่เป็นธรรมชาติในขณะที่ตอบสนองต่อการปรากฏตัวของสุนัขและการหลบหลีกสิ่งกีดขวาง

โมเดล AI แสดงความสำเร็จในระดับที่แตกต่างกัน

Claude 3.7 ครองการแข่งขันด้วยคะแนน 24/28 สร้างสิ่งที่ผู้ใช้หลายคนอธิบายว่าเป็นเกมที่สนุกอย่างแท้จริงพร้อมการเคลื่อนไหวของแกะที่เป็นธรรมชาติ เวอร์ชันของ Claude ยังสร้างภาพเคลื่อนไหวการเปลี่ยนผ่านสู่เวลากลางคืนโดยไม่ได้รับคำสั่งเฉพาะให้ทำเช่นนั้น ผู้เล่นคนหนึ่งสังเกตว่าเกมนี้ให้ความรู้สึกคล้ายกับเกมมือถือในยุคแรกของ iPhone ในความเรียบง่ายและความน่าดึงดูด

โมเดลอื่นๆ แสดงผลลัพธ์ที่หลากหลาย o3-mini ของ Anthropic ได้คะแนน 16/28 โดยใช้อัลกอริทึม boids แบบคลาสสิกสำหรับพฤติกรรมการรวมฝูง แม้จะน่าประทับใจทางเทคนิค แต่ผู้ใช้บางคนสังเกตว่าวิธีการนี้ไม่รู้สึกเป็นธรรมชาติสำหรับแกะเนื่องจากอัลกอริทึม boids รักษาการเคลื่อนไหวอย่างต่อเนื่อง ในขณะที่แกะจริงสามารถอยู่นิ่งได้

ที่ด้านล่างของตารางผู้นำ โมเดลอย่าง Deepseek ไม่สามารถสร้าง JavaScript ที่ใช้งานได้ ในขณะที่ GPT-4o และ Gemini Pro ได้คะแนนเพียง 4/28 คะแนนเท่านั้น โดยมีคุณสมบัติที่จำกัดและปัญหาด้านการทำงาน

ตารางจัดอันดับโมเดล AI สำหรับเกม Shepherd's Dog

โมเดล คะแนน หมายเหตุ
Claude 3.7 24/28 การสาธิตที่น่าประทับใจมาก ขาดเพียงพลวัตของอุปสรรคบางอย่าง
o3-mini 16/28 ขาดคุณสมบัติบางอย่าง แต่มีการรวมฝูงและเกมเพลย์ที่ดี
o1 Pro 12/28 คล้ายกับ o3-mini
Mistral 12/28 การต้อนฝูงไม่ได้ถูกพัฒนาอย่างเหมาะสม
GPT-4o 4/28 มีคุณสมบัติจำกัด โมเดลไม่สามารถทำงานต่อได้
Gemini Pro 4/28 ยากเพราะแกะไม่อยู่ในคอก
Deepseek 0/28 JavaScript ไม่ถูกต้อง
Cursor 0/28 น่าประทับใจแต่อาจไม่เข้าเกณฑ์ "one-shot"

อัลกอริทึมการรวมฝูง: หัวใจของความท้าทาย

ความท้าทายหลักในการสร้างเกมนี้อยู่ที่การสร้างพฤติกรรมการรวมฝูงที่สมจริง โมเดล AI หลายตัวเลือกใช้อัลกอริทึม boids ซึ่งเป็นวิธีที่รู้จักกันดีในการจำลองพฤติกรรมการรวมฝูงที่ได้รับการพัฒนาในช่วงทศวรรษ 1980 อย่างไรก็ตาม ผู้แสดงความคิดเห็นคนหนึ่งชี้ให้เห็นว่า boids อาจไม่เหมาะสำหรับการจำลองแกะ:

ดูเหมือนว่า o3-mini ใช้อัลกอริทึม 'boids' สำหรับการรวมฝูง (อาจเนื่องจากความแพร่หลายออนไลน์) แต่ผมพบว่าในกรณีนี้มันไม่เหมาะสมนัก จริงๆ แล้วใน boids แต่ละองค์ประกอบมีความเร็วคงที่ (หรือขั้นต่ำ) ทำให้แกะไม่เคยหยุด 'วิ่ง' ผมพบว่าพฤติกรรมการรวมฝูงของ Claude ดูเป็นธรรมชาติมากกว่าสำหรับแกะ

ข้อมูลเชิงลึกนี้ชี้ให้เห็นว่าการใช้งานของ Claude 3.7 สามารถสร้างพฤติกรรมของสัตว์เลี้ยงลูกด้วยนมที่สมจริงมากขึ้นโดยอนุญาตให้แกะมีความเร็วขั้นต่ำเป็นศูนย์—ความแตกต่างที่ละเอียดแต่สำคัญซึ่งทำให้การจำลองของมันรู้สึกเป็นธรรมชาติมากขึ้น

การมีส่วนร่วมของชุมชนและการปรับปรุง

การตอบสนองของชุมชนต่อเกมที่สร้างโดย AI เหล่านี้มีความกระตือรือร้น โดยผู้ใช้หลายคนแบ่งปันเวอร์ชันของตนเองหรือเสนอการปรับปรุง ผู้ใช้คนหนึ่งได้สร้างเวอร์ชันที่ปรับปรุงโดยใช้โมเดล AI หลายตัวร่วมกัน แสดงให้เห็นว่าการแนะนำของมนุษย์สามารถช่วยปรับปรุงโค้ดที่สร้างโดย AI ได้อย่างไร

ผู้ใช้บางคนสังเกตเห็นปัญหาการเล่นที่จะได้รับประโยชน์จากการปรับปรุงโดยมนุษย์ เช่น แผนที่ที่ใหญ่เกินไปบนเดสก์ท็อปหรือแกะติดอยู่ที่มุม ข้อสังเกตเหล่านี้ชี้ให้เห็นว่าแม้ AI จะสามารถสร้างเกมที่ใช้งานได้ในครั้งเดียว แต่การทดสอบการเล่นและการปรับปรุงโดยมนุษย์ยังคงจำเป็นสำหรับการขัดเกลาประสบการณ์

ที่น่าสนใจคือ ผู้แสดงความคิดเห็นหลายคนกล่าวว่าพวกเขาเคยพยายามสร้างเกมที่คล้ายกันด้วยตัวเองมาก่อน แสดงให้เห็นว่าแนวคิดการต้อนแกะมีความน่าดึงดูดอย่างกว้างขวางในหมู่นักพัฒนาเกม ความท้าทายในการทำให้พฤติกรรมการรวมฝูงถูกต้องดูเหมือนจะเป็นอุปสรรคทั่วไปที่หลายคนเคยเผชิญ

การทดลองแสดงให้เห็นถึงความก้าวหน้าอย่างรวดเร็วของความสามารถในการเขียนโค้ดของ AI ในขณะที่เปิดเผยข้อจำกัดในปัจจุบันด้วย ในฐานะการสร้างครั้งเดียวโดยไม่มีข้อเสนอแนะหรือการปรับปรุง เกมเหล่านี้แสดงถึงความสำเร็จทางเทคนิคที่น่าประทับใจ แต่ยังคงได้รับประโยชน์จากการปรับปรุงโดยมนุษย์เพื่อให้บรรลุศักยภาพสูงสุด

สำหรับผู้ที่สนใจลองเล่นเกมที่สร้างโดย AI เหล่านี้ สามารถเข้าถึงได้ผ่านตัวอย่าง HTML ของ GitHub แม้ว่าผู้ใช้บางคนรายงานคำเตือนความปลอดภัยจากเบราว์เซอร์บางตัว—อุปสรรคที่ไม่คาดคิดสำหรับสิ่งที่เป็นเพียงเกม HTML/JavaScript อย่างง่ายที่โฮสต์บน GitHub Pages

อ้างอิง: Shepherd's Dog Game Concept and AI Leaderboard