OpenAI เปิดตัวโมเดลการให้เหตุผลขั้นสูง O3 และ O4-mini พร้อมความสามารถในการประมวลผลภาพ

BigGo Editorial Team
OpenAI เปิดตัวโมเดลการให้เหตุผลขั้นสูง O3 และ O4-mini พร้อมความสามารถในการประมวลผลภาพ

ปัญญาประดิษฐ์ยังคงพัฒนาอย่างรวดเร็วในขณะที่บริษัทเทคโนโลยีผลักดันขีดจำกัดของสิ่งที่เป็นไปได้ ในความก้าวหน้าที่สำคัญสำหรับความสามารถในการให้เหตุผลของ AI, OpenAI ได้แนะนำโมเดลใหม่สองตัวที่ออกแบบมาให้คิดอย่างละเอียดถี่ถ้วนก่อนตอบคำถามของผู้ใช้

โมเดลการให้เหตุผลใหม่ที่เปิดตัว

OpenAI ได้เปิดตัวโมเดล AI การให้เหตุผลใหม่สองตัวอย่างเป็นทางการ: o3 ซึ่งบริษัทอธิบายว่าเป็นโมเดลการให้เหตุผลที่ทรงพลังที่สุดจนถึงปัจจุบัน และ o4-mini ทางเลือกที่เล็กกว่าและเร็วกว่าที่มอบประสิทธิภาพที่น่าประทับใจเมื่อเทียบกับขนาดและต้นทุน โมเดลเหล่านี้ตามมาหลังจากการแนะนำโมเดลเรือธง GPT-4.1 ล่าสุดของ OpenAI และเป็นตัวแทนของวิวัฒนาการถัดไปในระบบ AI ที่เน้นการให้เหตุผลของบริษัท ต่างจากโมเดลมาตรฐาน โมเดลการให้เหตุผลเหล่านี้ได้รับการฝึกฝนเป็นพิเศษให้คิดก่อนพูด โดยใช้เวลาประมวลผลเพิ่มเติมเพื่อให้คำตอบที่มีคุณภาพสูงขึ้น

ภาพรวมโมเดลใหม่จาก OpenAI

โมเดล คำอธิบาย คุณสมบัติหลัก
o3 โมเดลที่มีความสามารถในการคิดวิเคราะห์สูงที่สุด การวิเคราะห์ภาพ, การรวมเครื่องมือ, ประสิทธิภาพที่เพิ่มขึ้น
o4-mini ขนาดเล็กกว่า, เร็วกว่า, คุ้มค่ากว่า การวิเคราะห์ภาพ, การรวมเครื่องมือ, ปรับให้เหมาะสมเพื่อความเร็ว
o4-mini-high รุ่นที่มีประสิทธิภาพสูงขึ้น ความสามารถที่เพิ่มขึ้นในขณะที่ยังคงรักษาประสิทธิภาพ

การรวมเครื่องมือ

  • การท่องเว็บ
  • การเขียนโค้ด Python
  • การทำความเข้าใจภาพ
  • การสร้างภาพ

การผสานการเข้าใจภาพ

ความก้าวหน้าที่สำคัญที่สุดในโมเดลใหม่เหล่านี้คือความสามารถในการคิดด้วยภาพ ทั้ง o3 และ o4-mini สามารถผสานข้อมูลภาพเข้ากับกระบวนการให้เหตุผลได้โดยตรง แทนที่จะเพียงอธิบายสิ่งที่เห็น ความสามารถนี้ช่วยให้โมเดลสามารถทำงานกับภาพร่าง กระดานไวท์บอร์ด และแม้แต่ภาพที่มีคุณภาพต่ำหรือเบลอ โมเดลสามารถจัดการกับภาพเป็นส่วนหนึ่งของการวิเคราะห์ รวมถึงการซูมเข้าไปยังองค์ประกอบเฉพาะหรือหมุนภาพเพื่อทำความเข้าใจเนื้อหาได้ดีขึ้น การให้เหตุผลด้วยภาพนี้เป็นก้าวสำคัญในความสามารถของ AI ในการประมวลผลและใช้ข้อมูลในรูปแบบที่แตกต่างกัน

การใช้เครื่องมือแบบเอเจนท์

ความก้าวหน้าที่สำคัญอีกประการหนึ่งคือความสามารถของโมเดลในการใช้เครื่องมือ ChatGPT ทั้งหมดได้อย่างอิสระระหว่างกระบวนการให้เหตุผล ซึ่งรวมถึงการท่องเว็บ การเขียนโค้ด Python การเข้าใจภาพ และความสามารถในการสร้างภาพ OpenAI อธิบายว่านี่เป็นก้าวไปสู่ ChatGPT ที่เป็นเอเจนท์มากขึ้นซึ่งสามารถดำเนินงานแทนคุณได้อย่างอิสระ ในทางปฏิบัติ นี่หมายความว่าโมเดลสามารถตัดสินใจได้อย่างอิสระว่าจะใช้เครื่องมือใดในการแก้ปัญหาที่ซับซ้อนและมีหลายขั้นตอน—คล้ายกับที่คนอาจหยิบเครื่องคิดเลขเมื่อจำเป็น ในระหว่างการสาธิต นักวิจัยได้แสดงให้เห็นว่า o3 สามารถวิเคราะห์โปสเตอร์งานวิจัยทางวิทยาศาสตร์ ท่องอินเทอร์เน็ตเพื่อหาข้อมูลเพิ่มเติม และซูมเข้าไปยังองค์ประกอบต่างๆ ของภาพเพื่อสร้างคำตอบที่ครอบคลุม

การปรับปรุงประสิทธิภาพ

ตามข้อมูลของ OpenAI ทั้ง o3 และ o4-mini มีประสิทธิภาพเหนือกว่ารุ่นก่อนหน้าในการทดสอบเกณฑ์มาตรฐานต่างๆ แม้จะไม่ได้ใช้ความสามารถในการเข้าถึงเครื่องมือใหม่ โมเดลแสดงให้เห็นถึงการปฏิบัติตามคำแนะนำที่ดีขึ้นและให้คำตอบที่มีประโยชน์และตรวจสอบได้มากขึ้น ในขณะที่ o3 เป็นผลิตภัณฑ์ระดับพรีเมียมที่มีความสามารถสูงสุด o4-mini ได้รับการปรับให้มีประสิทธิภาพที่แข็งแกร่งในต้นทุนที่ต่ำลงและความเร็วที่สูงขึ้น ทำให้การให้เหตุผลขั้นสูงเข้าถึงได้มากขึ้น

ความพร้อมใช้งานและการเข้าถึง

โมเดลใหม่พร้อมใช้งานทันทีสำหรับสมาชิก ChatGPT Plus, Pro และ Team โดยปรากฏในตัวเลือกโมเดลเป็น o3, o4-mini และ o4-mini-high ซึ่งจะแทนที่โมเดลการให้เหตุผลก่อนหน้านี้คือ o1, o3-mini และ o3-mini-high ผู้ใช้ Pro จะสามารถเข้าถึง o3-pro ได้ในอีกไม่กี่สัปดาห์ข้างหน้า แต่จนกว่าจะถึงเวลานั้นจะยังคงสามารถเข้าถึง o1-pro ได้ นักพัฒนายังสามารถเข้าถึงโมเดลเหล่านี้ผ่าน API ของ OpenAI ได้

การประกาศเพิ่มเติม

ควบคู่ไปกับโมเดลใหม่เหล่านี้ OpenAI ได้เปิดตัว Codex CLI เอเจนท์การเขียนโค้ดแบบโอเพนซอร์สที่ทำงานในเทอร์มินัลของผู้ใช้ เครื่องมือนี้ให้วิธีที่ตรงไปตรงมาในการเชื่อมต่อโมเดล AI รวมถึง o3 และ o4-mini กับโค้ดและงานของผู้ใช้เอง คาดว่าจะมีการสนับสนุนสำหรับ GPT-4.1 เร็วๆ นี้ บริษัทยังได้ประกาศโครงการมูลค่า 1 ล้านดอลลาร์เพื่อสนับสนุนโครงการในระยะแรกที่ใช้เทคโนโลยีเหล่านี้ โดยเสนอเงินช่วยเหลือในรูปแบบเครดิต API ครั้งละ 25,000 ดอลลาร์

ข้อพิจารณาด้านความปลอดภัย

OpenAI เน้นย้ำว่าโมเดลใหม่ทั้งสองผ่านการทดสอบด้านความปลอดภัยอย่างกว้างขวางก่อนเปิดตัว พวกมันได้รับการทดสอบภายใต้โปรแกรมความปลอดภัยของบริษัทและได้รับการประเมินตามกรอบการเตรียมความพร้อมที่ปรับปรุงใหม่ โดยมีผลลัพธ์โดยละเอียดในการ์ดระบบฉบับสมบูรณ์