Google Gemini 2.5 Pro เพิ่มฟีเจอร์วิเคราะห์วิดีโอและค้นหาประวัติการแชท

BigGo Editorial Team
Google Gemini 2.5 Pro เพิ่มฟีเจอร์วิเคราะห์วิดีโอและค้นหาประวัติการแชท

ผู้ช่วย AI อย่าง Gemini ของ Google ยังคงพัฒนาอย่างรวดเร็วด้วยความสามารถใหม่ๆ ที่สำคัญที่ถูกค้นพบและเปิดตัว การค้นพบล่าสุดเผยให้เห็นถึงความสามารถในการวิเคราะห์วิดีโอที่กำลังจะมาถึงและฟังก์ชันการค้นหาประวัติการแชท ในขณะที่โมเดล Gemini 2.5 Pro ล่าสุดได้สร้างความประทับใจให้กับผู้ใช้มากพอที่จะเข้าร่วมในกลุ่มของเครื่องมือ AI แบบเสียค่าใช้จ่ายที่คุ้มค่าแก่การสมัครสมาชิก

การวิเคราะห์วิดีโอกำลังมาสู่ Gemini

การแกะรหัส APK ของ Gemini สำหรับ Android (เวอร์ชัน 16.15.38.sa.arm64 beta) ได้เปิดเผยว่า Google กำลังเตรียมเพิ่มความสามารถในการวิเคราะห์วิดีโอให้กับผู้ช่วย AI ของตน นักพัฒนาสามารถเปิดใช้งานฟีเจอร์ที่ยังไม่ได้เปิดตัวนี้ ทำให้ผู้ใช้สามารถอัปโหลดวิดีโอและถามคำถาม Gemini เกี่ยวกับเนื้อหาของวิดีโอได้ การใช้งานดูเหมือนจะรองรับวิดีโอที่มีความยาวสูงสุด 5 นาที โดย AI สามารถวิเคราะห์องค์ประกอบภาพ ระบุสถานที่จากลักษณะทางสถาปัตยกรรม และให้ข้อมูลเชิงบริบทเกี่ยวกับภาพวิดีโอได้อย่างแม่นยำ

ฟังก์ชันนี้อาจมีประโยชน์สำหรับการสรุปการประชุมที่บันทึกไว้ การแก้ไขปัญหาทางเทคนิคผ่านการบันทึกหน้าจอ หรือการวิเคราะห์เนื้อหาภาพเพื่อวัตถุประสงค์ต่างๆ ฟีเจอร์นี้ดูเหมือนจะอยู่ในขั้นตอนการทดสอบขั้นสุดท้าย ซึ่งบ่งชี้ว่าอาจมีการประกาศอย่างเป็นทางการในเร็วๆ นี้ อาจจะในงาน Google I/O ที่กำลังจะมาถึง

คุณสมบัติที่กำลังจะมาถึงของ Gemini

  • การวิเคราะห์วิดีโอที่มีขีดจำกัดการอัปโหลด 5 นาที
  • ฟังก์ชันการค้นหาประวัติการแชท
  • ความสามารถในการวิเคราะห์เอกสารที่ได้รับการปรับปรุง

ฟังก์ชันการค้นหาสำหรับประวัติการแชท

การปรับปรุงที่โดดเด่นอีกอย่างที่พบในเวอร์ชัน beta เดียวกันนี้ คือการแก้ไขช่องว่างด้านการใช้งานที่สำคัญใน Gemini ในปัจจุบัน แม้ว่า AI จะเก็บประวัติการสนทนาในอดีตไว้อย่างครบถ้วน แต่ไม่มีวิธีที่มีประสิทธิภาพในการค้นหาข้อมูลเหล่านั้น การละเว้นนี้สร้างความหงุดหงิดให้กับผู้ใช้ที่ใช้งานหนักซึ่งพยายามค้นหาข้อมูลเฉพาะจากการโต้ตอบก่อนหน้านี้

การแกะรหัส APK เผยให้เห็นสตริงที่เกี่ยวข้องกับ SEARCH_CHAT_HISTORY ซึ่งบ่งชี้ว่า Google กำลังพัฒนาโซลูชันสำหรับปัญหานี้ แม้ว่าฟีเจอร์นี้จะอยู่ในขั้นตอนการพัฒนาเริ่มต้นโดยยังไม่มีการใช้งานที่สามารถมองเห็นได้ แต่ก็ถือเป็นการปรับปรุงคุณภาพชีวิตที่สำคัญซึ่งสอดคล้องกับความสามารถหลักของ Google ในเทคโนโลยีการค้นหา

Gemini 2.5 Pro สร้างความประทับใจให้ผู้ใช้

นอกเหนือจากฟีเจอร์ที่กำลังจะมาถึงเหล่านี้ การเปิดตัว Gemini 2.5 Pro ล่าสุดของ Google ได้สร้างความตื่นเต้นในหมู่ผู้ที่ชื่นชอบ AI โมเดลนี้แสดงถึงความก้าวหน้าที่สำคัญเมื่อเทียบกับเวอร์ชันก่อนหน้า ด้วยความสามารถที่รวมถึงการให้เหตุผลที่ซับซ้อน การเขียนโค้ด และการวิเคราะห์เอกสารขนาดใหญ่ context window ขนาดใหญ่ของมันที่รองรับได้ถึง 1 ล้าน token (และมีแผนที่จะขยายเป็น 2 ล้าน) ช่วยให้สามารถประมวลผลและเข้าใจข้อมูลได้มากกว่าเวอร์ชันก่อนหน้านี้มาก

นอกจาก Gemini 2.5 Pro แล้ว Google ยังได้แนะนำ Gemini 2.5 Flash ซึ่งได้รับการปรับให้เหมาะสมสำหรับความเร็วและประสิทธิภาพด้านต้นทุนในแอปพลิเคชันที่มีปริมาณสูง เช่น การบริการลูกค้า ทั้งสองโมเดลรองรับอินพุตแบบหลายโหมดทั้งข้อความ รูปภาพ เสียง และวิดีโอ พร้อมด้วยฟีเจอร์เช่น Manual Reasoning Control สำหรับปรับแต่งว่าโมเดลจะคิดวิเคราะห์ปัญหาอย่างละเอียดมากน้อยเพียงใด

การปรับปรุงมีความสำคัญมากพอที่แม้แต่ผู้ใช้ AI ที่มีความเลือกสรรซึ่งโดยปกติจะจำกัดการสมัครสมาชิกแบบเสียค่าใช้จ่าย ก็ยังเพิ่ม Gemini เข้าไปในชุดเครื่องมือของพวกเขา กุญแจสำคัญในการใช้ประโยชน์สูงสุดจากโมเดลขั้นสูงเหล่านี้ดูเหมือนจะอยู่ที่วิธีการที่ผู้ใช้เข้าหาพวกมัน—ด้วยการสื่อสารที่ชัดเจน คำสั่งที่เฉพาะเจาะจง และความคาดหวังที่สมจริงเกี่ยวกับความสามารถและข้อจำกัดของพวกมัน

คุณสมบัติของ Gemini 2.5 Pro

  • หน้าต่างบริบทสูงสุด 1 ล้านโทเค็น (เร็วๆ นี้จะเพิ่มเป็น 2 ล้าน)
  • รองรับข้อมูลหลายรูปแบบ (ข้อความ, รูปภาพ, เสียง, วิดีโอ)
  • Manual Reasoning Control สำหรับปรับการคิดวิเคราะห์ของโมเดล
  • Canvas: พื้นที่โต้ตอบสำหรับการแก้ไขเอกสารและโค้ด
  • Live API สำหรับการสตรีมแบบเรียลไทม์ในทุกรูปแบบสื่อ

ภูมิทัศน์ AI ที่กำลังพัฒนา

แม้ว่า Gemini 2.5 Pro จะเป็นก้าวสำคัญสำหรับบริการ AI ของ Google แต่ผู้ใช้สังเกตว่าการผสานรวมภายในระบบนิเวศของ Google ยังคงรู้สึกแยกส่วนอยู่บ้างเมื่อสลับระหว่างฟังก์ชันที่แตกต่างกัน โมเดลยังคงเผชิญกับความท้าทายในการเขียนที่มีความละเอียดอ่อน การคิดที่ลึกซึ้งขึ้น และการสร้างข้อมูลที่ไม่มีอยู่จริงในบางครั้ง—ปัญหาที่พบทั่วไปในโมเดลภาษาขนาดใหญ่

ขณะที่เครื่องมือ AI ยังคงพัฒนาขึ้น ความแตกต่างระหว่างพวกมันกลายเป็นเรื่องของประสิทธิภาพในการใช้งานสำหรับขั้นตอนการทำงานเฉพาะมากกว่าความสามารถพื้นฐาน ด้วยฟีเจอร์ที่กำลังจะมาถึงและการปรับปรุงล่าสุดเหล่านี้ Google กำลังวาง Gemini ให้เป็นคู่แข่งที่สำคัญในพื้นที่ผู้ช่วย AI ที่มีการแข่งขันสูงขึ้นเรื่อยๆ โดยเฉพาะสำหรับผู้ใช้ที่ให้คุณค่ากับความสามารถในการวิเคราะห์แบบหลายโหมดและการผสานรวมอย่างลึกซึ้งกับระบบนิเวศของ Google