ชุมชนนักพัฒนาให้การตอบรับ Steiner: ทางเลือกโอเพนซอร์สทดแทน o1 ของ OpenAI พร้อมใช้งานแล้วบน Ollama

BigGo Editorial Team
ชุมชนนักพัฒนาให้การตอบรับ Steiner: ทางเลือกโอเพนซอร์สทดแทน o1 ของ OpenAI พร้อมใช้งานแล้วบน Ollama

การเปิดตัวล่าสุดของ Steiner ซึ่งเป็นความพยายามในการสร้างโมเดลโอเพนซอร์สเพื่อจำลองความสามารถของ o1 จาก OpenAI ได้สร้างความสนใจอย่างมากในชุมชนนักพัฒนา โดยเฉพาะในแง่ของการเข้าถึงและตัวเลือกในการนำไปใช้งาน แม้ว่าโมเดลจะแสดงผลลัพธ์ที่น่าสนใจด้วยการพัฒนาที่เพิ่มขึ้น +5.56 ในชุดข้อมูล GPQA-Diamond แต่ความสนใจของชุมชนส่วนใหญ่มุ่งเน้นไปที่แง่มุมการนำไปใช้งานจริงและวิธีการติดตั้ง

การเข้าถึงง่ายผ่าน Ollama

พัฒนาการสำคัญที่ถูกหยิบยกในการสนทนาของชุมชนคือการที่ Steiner สามารถใช้งานผ่าน Ollama ทำให้ผู้ใช้ทั่วไปเข้าถึงได้ง่ายขึ้น ผู้ใช้สามารถรันโมเดลได้ด้วยคำสั่งง่ายๆ:

ollama run hf.co/peakji/steiner-32b-preview-gguf:Q4_K_M

โมเดลนี้มีให้ใช้งานในรูปแบบ GGUF บน Hugging Face ทำให้สามารถใช้งานได้หลากหลายรูปแบบ การเข้าถึงที่ง่ายนี้ได้รับการตอบรับที่ดีจากชุมชน โดยเฉพาะสำหรับผู้ที่ต้องการทดลองใช้ความสามารถด้านการให้เหตุผลขั้นสูงโดยไม่ต้องเสียค่าใช้จ่ายและข้อจำกัดของ OpenAI

การอธิบายทางเทคนิค

ในการตอบคำถามของชุมชน นักพัฒนาได้ชี้แจงว่า Steiner ไม่ใช่เพียงแค่อัลกอริทึมที่ซ้อนทับบน LLM ที่มีอยู่ แต่เป็นโมเดลภาษาที่ผ่านการ fine-tune ด้วยชุดข้อมูลใหม่และการเรียนรู้แบบเสริมแรง แม้ว่าจะพัฒนาต่อยอดจาก Qwen2.5-32B แต่ได้รับการปรับแต่งเป็นพิเศษสำหรับงานด้านการให้เหตุผล อย่างไรก็ตามไม่แนะนำให้ใช้แทนที่โมเดลอเนกประสงค์อย่าง Llama

ประสิทธิภาพและข้อจำกัด

การสนทนาในชุมชนได้เผยให้เห็นทั้งความกระตือรือร้นและข้อกังวลเชิงปฏิบัติเกี่ยวกับความสามารถของ Steiner:

  • การทดสอบประสิทธิภาพ : โมเดลแสดงการพัฒนาที่ +5.56 ในชุดข้อมูล GPQA-Diamond ต่อยอดจากประสิทธิภาพพื้นฐานของ Qwen2.5-32B ที่ 49.49
  • ความสามารถด้านการให้เหตุผล : ตามที่นักพัฒนาระบุ โมเดลสามารถแก้ปัญหาที่ซับซ้อนซึ่งโมเดลขนาดเดียวกันอื่นๆ ทำได้ยาก แม้ว่าจะไม่ได้สะท้อนในการทดสอบมาตรฐานเสมอไป
  • ข้อจำกัดปัจจุบัน :
    • ไม่ได้ถูกปรับแต่งสำหรับการสนทนาหลายรอบ
    • ทำงานหลักๆ กับโทเค็นการให้เหตุผลภาษาอังกฤษ
    • ยังไม่สามารถจำลองความสามารถด้านการปรับขนาดการประมวลผลแบบ o1 ได้

ศักยภาพในอนาคต

ชุมชนได้แสดงความสนใจเป็นพิเศษในศักยภาพของ Steiner ในฐานะทางเลือกโอเพนซอร์สทดแทน o1 ของ OpenAI โดยเฉพาะในสภาพแวดล้อมปัจจุบันของบริการ AI เชิงพาณิชย์ แม้ว่าโมเดลยังไม่สามารถทำได้ทุกอย่างเหมือน o1 แต่การเป็นโอเพนซอร์สและการพัฒนาอย่างต่อเนื่องทำให้เป็นโครงการที่น่าสนใจสำหรับผู้ที่สนใจระบบการให้เหตุผลขั้นสูง

นักพัฒนายังคงทำงานเพื่อปรับปรุงความสามารถของโมเดล โดยเฉพาะการแก้ไขความท้าทายด้านการปรับขนาดการประมวลผลที่ยังไม่สามารถทำได้ในขณะนี้