ในความเคลื่อนไหวครั้งสำคัญเพื่อยกระดับการผสานเทคโนโลยี AI ในสมาร์ทโฟน Google ได้เริ่มทยอยปล่อยเวอร์ชันขยายของ Gemini Live ที่ช่วยให้ผู้ใช้สามารถโต้ตอบกับเนื้อหาบนหน้าจออุปกรณ์ได้อย่างเป็นธรรมชาติมากขึ้น การพัฒนานี้ถือเป็นอีกก้าวหนึ่งในการแข่งขันด้าน AI ระหว่างผู้ผลิตสมาร์ทโฟนรายใหญ่ ที่นำความสามารถของ AI แบบสนทนามาสู่ผู้ใช้งานมากขึ้น
ความสามารถใหม่ในการวิเคราะห์หน้าจอ
การอัปเดตล่าสุดของ Gemini Live แนะนำวิธีการพูดคุยเกี่ยวกับเนื้อหาบนหน้าจอกับผู้ช่วย AI ได้อย่างราบรื่น ผู้ใช้สามารถสนทนากับ Gemini เกี่ยวกับทุกสิ่งที่แสดงบนหน้าจอ ไม่ว่าจะเป็นวิดีโอ YouTube รูปภาพ และเอกสารต่างๆ โดยไม่จำเป็นต้องถ่ายภาพหน้าจอและอัปโหลดด้วยตนเองเหมือนเดิม ฟีเจอร์นี้เปิดใช้งานผ่านปุ่ม Talk Live about... ที่ปรากฏในอินเตอร์เฟซของ Gemini Live
คุณสมบัติหลัก:
- การวิเคราะห์เนื้อหาบนหน้าจอ
- การสั่งงานด้วยเสียง
- ตัวเลือกการถ่ายภาพด่วน
- การเข้าถึงเอกสาร PDF แบบเต็มรูปแบบ
- การวิเคราะห์วิดีโอ YouTube แบบเรียลไทม์
- ความสามารถในการจดจำรูปภาพ
การปรับปรุงอินเตอร์เฟซผู้ใช้และฟังก์ชันการทำงาน
อินเตอร์เฟซใหม่ของ Gemini Live มาพร้อมชุดเครื่องมือสำหรับการโต้ตอบที่ครอบคลุม ผู้ใช้สามารถเข้าถึงบริการผ่านคำสั่งเสียง (Hey Google) พิมพ์คำถามในช่องข้อความ หรือใช้ตัวเลือกกล้องถ่ายภาพด่วนสำหรับการป้อนข้อมูลภาพ เมื่อวิเคราะห์ไฟล์ PDF Gemini สามารถเข้าถึงเอกสารทั้งหมดได้ ในขณะที่สำหรับรูปภาพและวิดีโอ จะประมวลผลเฉพาะเนื้อหาที่ปรากฏบนหน้าจอเท่านั้น
การรองรับอุปกรณ์และความพร้อมใช้งาน
หลังจากเปิดตัวครั้งแรกบนซีรีส์ Galaxy S24 ฟีเจอร์นี้กำลังขยายมาสู่อุปกรณ์ Pixel 9 การปล่อยอัปเดตดูเหมือนจะเป็นแบบทยอย โดยผู้ใช้บางส่วนสามารถเข้าถึงได้แล้ว ในขณะที่บางส่วนอาจต้องรอการอัปเดต รูปแบบนี้เป็นไปตามแนวทางปกติของ Google ในการขยายฟีเจอร์ใหม่ๆ ไปทั่วระบบนิเวศของตน เช่นเดียวกับการปล่อยฟีเจอร์ Circle to Search ก่อนหน้านี้
อุปกรณ์ที่รองรับในปัจจุบัน:
- ซีรีส์ Pixel 9
- ซีรีส์ Galaxy S24
- ซีรีส์ Galaxy S25
นัยสำคัญในอนาคต
การอัปเดตครั้งนี้ถือเป็นก้าวสำคัญในการทำให้การโต้ตอบกับ AI เป็นธรรมชาติและเข้าถึงได้ง่ายในการใช้งานสมาร์ทโฟนประจำวัน เมื่อฟีเจอร์นี้ทยอยปล่อยสู่อุปกรณ์ Android มากขึ้น คาดว่าจะกลายเป็นองค์ประกอบมาตรฐานของระบบนิเวศ Android ซึ่งอาจส่งผลต่อวิธีที่ผู้ใช้โต้ตอบกับอุปกรณ์และประมวลผลข้อมูลในอนาคต