การพยายามสร้างพฤติกรรมการรวมฝูงที่สมจริงในเกมเป็นความท้าทายของนักพัฒนามาอย่างยาวนาน แต่ตอนนี้โมเดลภาษา AI กำลังแสดงความสามารถที่น่าประทับใจในการพัฒนาเกม การทดลองล่าสุดได้ท้าทายโมเดล AI หลายตัวให้สร้างเกมต้อนแกะชื่อ Shepherd's Dog ในความพยายามเดียว โดย Claude 3.7 ได้ก้าวขึ้นมาเป็นผู้ชนะอย่างชัดเจน
แนวคิดเบื้องหลัง Shepherd's Dog นั้นเรียบง่ายแต่น่าสนใจ: ผู้เล่นควบคุมสุนัขเพื่อต้อนแกะเข้าคอกก่อนพลบค่ำ สิ่งที่ทำให้เกมนี้น่าสนใจคือพฤติกรรมการรวมฝูงที่สมจริงของแกะ ซึ่งต้องแสดงพลวัตกลุ่มที่เป็นธรรมชาติในขณะที่ตอบสนองต่อการปรากฏตัวของสุนัขและการหลบหลีกสิ่งกีดขวาง
โมเดล AI แสดงความสำเร็จในระดับที่แตกต่างกัน
Claude 3.7 ครองการแข่งขันด้วยคะแนน 24/28 สร้างสิ่งที่ผู้ใช้หลายคนอธิบายว่าเป็นเกมที่สนุกอย่างแท้จริงพร้อมการเคลื่อนไหวของแกะที่เป็นธรรมชาติ เวอร์ชันของ Claude ยังสร้างภาพเคลื่อนไหวการเปลี่ยนผ่านสู่เวลากลางคืนโดยไม่ได้รับคำสั่งเฉพาะให้ทำเช่นนั้น ผู้เล่นคนหนึ่งสังเกตว่าเกมนี้ให้ความรู้สึกคล้ายกับเกมมือถือในยุคแรกของ iPhone ในความเรียบง่ายและความน่าดึงดูด
โมเดลอื่นๆ แสดงผลลัพธ์ที่หลากหลาย o3-mini ของ Anthropic ได้คะแนน 16/28 โดยใช้อัลกอริทึม boids แบบคลาสสิกสำหรับพฤติกรรมการรวมฝูง แม้จะน่าประทับใจทางเทคนิค แต่ผู้ใช้บางคนสังเกตว่าวิธีการนี้ไม่รู้สึกเป็นธรรมชาติสำหรับแกะเนื่องจากอัลกอริทึม boids รักษาการเคลื่อนไหวอย่างต่อเนื่อง ในขณะที่แกะจริงสามารถอยู่นิ่งได้
ที่ด้านล่างของตารางผู้นำ โมเดลอย่าง Deepseek ไม่สามารถสร้าง JavaScript ที่ใช้งานได้ ในขณะที่ GPT-4o และ Gemini Pro ได้คะแนนเพียง 4/28 คะแนนเท่านั้น โดยมีคุณสมบัติที่จำกัดและปัญหาด้านการทำงาน
ตารางจัดอันดับโมเดล AI สำหรับเกม Shepherd's Dog
โมเดล | คะแนน | หมายเหตุ |
---|---|---|
Claude 3.7 | 24/28 | การสาธิตที่น่าประทับใจมาก ขาดเพียงพลวัตของอุปสรรคบางอย่าง |
o3-mini | 16/28 | ขาดคุณสมบัติบางอย่าง แต่มีการรวมฝูงและเกมเพลย์ที่ดี |
o1 Pro | 12/28 | คล้ายกับ o3-mini |
Mistral | 12/28 | การต้อนฝูงไม่ได้ถูกพัฒนาอย่างเหมาะสม |
GPT-4o | 4/28 | มีคุณสมบัติจำกัด โมเดลไม่สามารถทำงานต่อได้ |
Gemini Pro | 4/28 | ยากเพราะแกะไม่อยู่ในคอก |
Deepseek | 0/28 | JavaScript ไม่ถูกต้อง |
Cursor | 0/28 | น่าประทับใจแต่อาจไม่เข้าเกณฑ์ "one-shot" |
อัลกอริทึมการรวมฝูง: หัวใจของความท้าทาย
ความท้าทายหลักในการสร้างเกมนี้อยู่ที่การสร้างพฤติกรรมการรวมฝูงที่สมจริง โมเดล AI หลายตัวเลือกใช้อัลกอริทึม boids ซึ่งเป็นวิธีที่รู้จักกันดีในการจำลองพฤติกรรมการรวมฝูงที่ได้รับการพัฒนาในช่วงทศวรรษ 1980 อย่างไรก็ตาม ผู้แสดงความคิดเห็นคนหนึ่งชี้ให้เห็นว่า boids อาจไม่เหมาะสำหรับการจำลองแกะ:
ดูเหมือนว่า o3-mini ใช้อัลกอริทึม 'boids' สำหรับการรวมฝูง (อาจเนื่องจากความแพร่หลายออนไลน์) แต่ผมพบว่าในกรณีนี้มันไม่เหมาะสมนัก จริงๆ แล้วใน boids แต่ละองค์ประกอบมีความเร็วคงที่ (หรือขั้นต่ำ) ทำให้แกะไม่เคยหยุด 'วิ่ง' ผมพบว่าพฤติกรรมการรวมฝูงของ Claude ดูเป็นธรรมชาติมากกว่าสำหรับแกะ
ข้อมูลเชิงลึกนี้ชี้ให้เห็นว่าการใช้งานของ Claude 3.7 สามารถสร้างพฤติกรรมของสัตว์เลี้ยงลูกด้วยนมที่สมจริงมากขึ้นโดยอนุญาตให้แกะมีความเร็วขั้นต่ำเป็นศูนย์—ความแตกต่างที่ละเอียดแต่สำคัญซึ่งทำให้การจำลองของมันรู้สึกเป็นธรรมชาติมากขึ้น
การมีส่วนร่วมของชุมชนและการปรับปรุง
การตอบสนองของชุมชนต่อเกมที่สร้างโดย AI เหล่านี้มีความกระตือรือร้น โดยผู้ใช้หลายคนแบ่งปันเวอร์ชันของตนเองหรือเสนอการปรับปรุง ผู้ใช้คนหนึ่งได้สร้างเวอร์ชันที่ปรับปรุงโดยใช้โมเดล AI หลายตัวร่วมกัน แสดงให้เห็นว่าการแนะนำของมนุษย์สามารถช่วยปรับปรุงโค้ดที่สร้างโดย AI ได้อย่างไร
ผู้ใช้บางคนสังเกตเห็นปัญหาการเล่นที่จะได้รับประโยชน์จากการปรับปรุงโดยมนุษย์ เช่น แผนที่ที่ใหญ่เกินไปบนเดสก์ท็อปหรือแกะติดอยู่ที่มุม ข้อสังเกตเหล่านี้ชี้ให้เห็นว่าแม้ AI จะสามารถสร้างเกมที่ใช้งานได้ในครั้งเดียว แต่การทดสอบการเล่นและการปรับปรุงโดยมนุษย์ยังคงจำเป็นสำหรับการขัดเกลาประสบการณ์
ที่น่าสนใจคือ ผู้แสดงความคิดเห็นหลายคนกล่าวว่าพวกเขาเคยพยายามสร้างเกมที่คล้ายกันด้วยตัวเองมาก่อน แสดงให้เห็นว่าแนวคิดการต้อนแกะมีความน่าดึงดูดอย่างกว้างขวางในหมู่นักพัฒนาเกม ความท้าทายในการทำให้พฤติกรรมการรวมฝูงถูกต้องดูเหมือนจะเป็นอุปสรรคทั่วไปที่หลายคนเคยเผชิญ
การทดลองแสดงให้เห็นถึงความก้าวหน้าอย่างรวดเร็วของความสามารถในการเขียนโค้ดของ AI ในขณะที่เปิดเผยข้อจำกัดในปัจจุบันด้วย ในฐานะการสร้างครั้งเดียวโดยไม่มีข้อเสนอแนะหรือการปรับปรุง เกมเหล่านี้แสดงถึงความสำเร็จทางเทคนิคที่น่าประทับใจ แต่ยังคงได้รับประโยชน์จากการปรับปรุงโดยมนุษย์เพื่อให้บรรลุศักยภาพสูงสุด
สำหรับผู้ที่สนใจลองเล่นเกมที่สร้างโดย AI เหล่านี้ สามารถเข้าถึงได้ผ่านตัวอย่าง HTML ของ GitHub แม้ว่าผู้ใช้บางคนรายงานคำเตือนความปลอดภัยจากเบราว์เซอร์บางตัว—อุปสรรคที่ไม่คาดคิดสำหรับสิ่งที่เป็นเพียงเกม HTML/JavaScript อย่างง่ายที่โฮสต์บน GitHub Pages