ผู้ช่วย AI อย่าง Gemini ของ Google ยังคงพัฒนาอย่างรวดเร็วด้วยความสามารถใหม่ๆ ที่สำคัญที่ถูกค้นพบและเปิดตัว การค้นพบล่าสุดเผยให้เห็นถึงความสามารถในการวิเคราะห์วิดีโอที่กำลังจะมาถึงและฟังก์ชันการค้นหาประวัติการแชท ในขณะที่โมเดล Gemini 2.5 Pro ล่าสุดได้สร้างความประทับใจให้กับผู้ใช้มากพอที่จะเข้าร่วมในกลุ่มของเครื่องมือ AI แบบเสียค่าใช้จ่ายที่คุ้มค่าแก่การสมัครสมาชิก
การวิเคราะห์วิดีโอกำลังมาสู่ Gemini
การแกะรหัส APK ของ Gemini สำหรับ Android (เวอร์ชัน 16.15.38.sa.arm64 beta) ได้เปิดเผยว่า Google กำลังเตรียมเพิ่มความสามารถในการวิเคราะห์วิดีโอให้กับผู้ช่วย AI ของตน นักพัฒนาสามารถเปิดใช้งานฟีเจอร์ที่ยังไม่ได้เปิดตัวนี้ ทำให้ผู้ใช้สามารถอัปโหลดวิดีโอและถามคำถาม Gemini เกี่ยวกับเนื้อหาของวิดีโอได้ การใช้งานดูเหมือนจะรองรับวิดีโอที่มีความยาวสูงสุด 5 นาที โดย AI สามารถวิเคราะห์องค์ประกอบภาพ ระบุสถานที่จากลักษณะทางสถาปัตยกรรม และให้ข้อมูลเชิงบริบทเกี่ยวกับภาพวิดีโอได้อย่างแม่นยำ
ฟังก์ชันนี้อาจมีประโยชน์สำหรับการสรุปการประชุมที่บันทึกไว้ การแก้ไขปัญหาทางเทคนิคผ่านการบันทึกหน้าจอ หรือการวิเคราะห์เนื้อหาภาพเพื่อวัตถุประสงค์ต่างๆ ฟีเจอร์นี้ดูเหมือนจะอยู่ในขั้นตอนการทดสอบขั้นสุดท้าย ซึ่งบ่งชี้ว่าอาจมีการประกาศอย่างเป็นทางการในเร็วๆ นี้ อาจจะในงาน Google I/O ที่กำลังจะมาถึง
คุณสมบัติที่กำลังจะมาถึงของ Gemini
- การวิเคราะห์วิดีโอที่มีขีดจำกัดการอัปโหลด 5 นาที
- ฟังก์ชันการค้นหาประวัติการแชท
- ความสามารถในการวิเคราะห์เอกสารที่ได้รับการปรับปรุง
ฟังก์ชันการค้นหาสำหรับประวัติการแชท
การปรับปรุงที่โดดเด่นอีกอย่างที่พบในเวอร์ชัน beta เดียวกันนี้ คือการแก้ไขช่องว่างด้านการใช้งานที่สำคัญใน Gemini ในปัจจุบัน แม้ว่า AI จะเก็บประวัติการสนทนาในอดีตไว้อย่างครบถ้วน แต่ไม่มีวิธีที่มีประสิทธิภาพในการค้นหาข้อมูลเหล่านั้น การละเว้นนี้สร้างความหงุดหงิดให้กับผู้ใช้ที่ใช้งานหนักซึ่งพยายามค้นหาข้อมูลเฉพาะจากการโต้ตอบก่อนหน้านี้
การแกะรหัส APK เผยให้เห็นสตริงที่เกี่ยวข้องกับ SEARCH_CHAT_HISTORY ซึ่งบ่งชี้ว่า Google กำลังพัฒนาโซลูชันสำหรับปัญหานี้ แม้ว่าฟีเจอร์นี้จะอยู่ในขั้นตอนการพัฒนาเริ่มต้นโดยยังไม่มีการใช้งานที่สามารถมองเห็นได้ แต่ก็ถือเป็นการปรับปรุงคุณภาพชีวิตที่สำคัญซึ่งสอดคล้องกับความสามารถหลักของ Google ในเทคโนโลยีการค้นหา
Gemini 2.5 Pro สร้างความประทับใจให้ผู้ใช้
นอกเหนือจากฟีเจอร์ที่กำลังจะมาถึงเหล่านี้ การเปิดตัว Gemini 2.5 Pro ล่าสุดของ Google ได้สร้างความตื่นเต้นในหมู่ผู้ที่ชื่นชอบ AI โมเดลนี้แสดงถึงความก้าวหน้าที่สำคัญเมื่อเทียบกับเวอร์ชันก่อนหน้า ด้วยความสามารถที่รวมถึงการให้เหตุผลที่ซับซ้อน การเขียนโค้ด และการวิเคราะห์เอกสารขนาดใหญ่ context window ขนาดใหญ่ของมันที่รองรับได้ถึง 1 ล้าน token (และมีแผนที่จะขยายเป็น 2 ล้าน) ช่วยให้สามารถประมวลผลและเข้าใจข้อมูลได้มากกว่าเวอร์ชันก่อนหน้านี้มาก
นอกจาก Gemini 2.5 Pro แล้ว Google ยังได้แนะนำ Gemini 2.5 Flash ซึ่งได้รับการปรับให้เหมาะสมสำหรับความเร็วและประสิทธิภาพด้านต้นทุนในแอปพลิเคชันที่มีปริมาณสูง เช่น การบริการลูกค้า ทั้งสองโมเดลรองรับอินพุตแบบหลายโหมดทั้งข้อความ รูปภาพ เสียง และวิดีโอ พร้อมด้วยฟีเจอร์เช่น Manual Reasoning Control สำหรับปรับแต่งว่าโมเดลจะคิดวิเคราะห์ปัญหาอย่างละเอียดมากน้อยเพียงใด
การปรับปรุงมีความสำคัญมากพอที่แม้แต่ผู้ใช้ AI ที่มีความเลือกสรรซึ่งโดยปกติจะจำกัดการสมัครสมาชิกแบบเสียค่าใช้จ่าย ก็ยังเพิ่ม Gemini เข้าไปในชุดเครื่องมือของพวกเขา กุญแจสำคัญในการใช้ประโยชน์สูงสุดจากโมเดลขั้นสูงเหล่านี้ดูเหมือนจะอยู่ที่วิธีการที่ผู้ใช้เข้าหาพวกมัน—ด้วยการสื่อสารที่ชัดเจน คำสั่งที่เฉพาะเจาะจง และความคาดหวังที่สมจริงเกี่ยวกับความสามารถและข้อจำกัดของพวกมัน
คุณสมบัติของ Gemini 2.5 Pro
- หน้าต่างบริบทสูงสุด 1 ล้านโทเค็น (เร็วๆ นี้จะเพิ่มเป็น 2 ล้าน)
- รองรับข้อมูลหลายรูปแบบ (ข้อความ, รูปภาพ, เสียง, วิดีโอ)
- Manual Reasoning Control สำหรับปรับการคิดวิเคราะห์ของโมเดล
- Canvas: พื้นที่โต้ตอบสำหรับการแก้ไขเอกสารและโค้ด
- Live API สำหรับการสตรีมแบบเรียลไทม์ในทุกรูปแบบสื่อ
ภูมิทัศน์ AI ที่กำลังพัฒนา
แม้ว่า Gemini 2.5 Pro จะเป็นก้าวสำคัญสำหรับบริการ AI ของ Google แต่ผู้ใช้สังเกตว่าการผสานรวมภายในระบบนิเวศของ Google ยังคงรู้สึกแยกส่วนอยู่บ้างเมื่อสลับระหว่างฟังก์ชันที่แตกต่างกัน โมเดลยังคงเผชิญกับความท้าทายในการเขียนที่มีความละเอียดอ่อน การคิดที่ลึกซึ้งขึ้น และการสร้างข้อมูลที่ไม่มีอยู่จริงในบางครั้ง—ปัญหาที่พบทั่วไปในโมเดลภาษาขนาดใหญ่
ขณะที่เครื่องมือ AI ยังคงพัฒนาขึ้น ความแตกต่างระหว่างพวกมันกลายเป็นเรื่องของประสิทธิภาพในการใช้งานสำหรับขั้นตอนการทำงานเฉพาะมากกว่าความสามารถพื้นฐาน ด้วยฟีเจอร์ที่กำลังจะมาถึงและการปรับปรุงล่าสุดเหล่านี้ Google กำลังวาง Gemini ให้เป็นคู่แข่งที่สำคัญในพื้นที่ผู้ช่วย AI ที่มีการแข่งขันสูงขึ้นเรื่อยๆ โดยเฉพาะสำหรับผู้ใช้ที่ให้คุณค่ากับความสามารถในการวิเคราะห์แบบหลายโหมดและการผสานรวมอย่างลึกซึ้งกับระบบนิเวศของ Google