Google กำลังพัฒนาความสามารถด้าน AI ด้วยฟีเจอร์การแก้ไขภาพแบบแม่นยำสำหรับ Gemini ซึ่งกำลังทดสอบในเวอร์ชันทดสอบล่าสุดบน Android การอัปเกรดนี้มีจุดมุ่งหมายเพื่อให้ผู้ใช้สามารถควบคุมภาพที่สร้างด้วย AI ได้มากขึ้น ซึ่งอาจเป็นคู่แข่งกับผลิตภัณฑ์อื่นๆ เช่น DALL-E ของ ChatGPT
เครื่องมือแก้ไขใหม่ในเวอร์ชันทดสอบ
แอป Google เวอร์ชันทดสอบล่าสุดสำหรับ Android (เวอร์ชัน 15.40.31.29) แนะนำวิธีการแก้ไขภาพที่สร้างด้วย AI ภายใน Gemini ที่ใช้งานง่ายขึ้น ผู้ใช้สามารถเลือกส่วนต่างๆ ของภาพเพื่อแก้ไขได้อย่างแม่นยำ ช่วยให้สามารถปรับเปลี่ยนเฉพาะส่วนของภาพได้ ฟีเจอร์นี้แก้ไขข้อจำกัดสำคัญในเวอร์ชันปัจจุบัน ที่ผู้ใช้ต้องพึ่งพาเพียงคำสั่งข้อความเพื่อปรับแต่งภาพ
วิธีการทำงาน
- สร้างภาพเริ่มต้นโดยใช้คำสั่งข้อความ
- เลือกส่วนเฉพาะของภาพเพื่อแก้ไข
- ให้คำสั่งเพิ่มเติมเพื่อการเปลี่ยนแปลงที่เฉพาะเจาะจงมากขึ้น
วิดีโอสาธิตแสดงให้เห็นถึงความสามารถในการสร้างภาพสุนัข จากนั้นทำการแก้ไขเฉพาะส่วน เช่น การเปลี่ยนประเภทของหมวกที่สุนัขสวมใส่
ข้อจำกัดในปัจจุบัน
แม้จะมีแนวโน้มที่ดี แต่ฟีเจอร์นี้ยังอยู่ในขั้นตอนการพัฒนา:
- การแก้ไขไม่ได้แม่นยำหรือเชื่อถือได้เสมอไป
- การเปลี่ยนแปลงง่ายๆ บางครั้งอาจส่งผลกระทบต่อส่วนอื่นๆ ของภาพที่ไม่ต้องการ
- การแก้ไขแต่ละครั้งใช้เวลาในการประมวลผล (บางกรณีมากกว่า 10 วินาที)
สภาพการแข่งขัน
การอัปเดตนี้ทำให้ Google Gemini สามารถแข่งขันโดยตรงกับเครื่องมือสร้างภาพด้วย AI อื่นๆ ได้มากขึ้น:
- DALL-E ของ ChatGPT
- Midjourney (ปัจจุบันถือว่าเป็นเครื่องมือสร้างภาพด้วย AI ชั้นนำ)
- Image Playground ของ Apple ที่กำลังจะเปิดตัว
มองไปข้างหน้า
ในขณะที่เครื่องมือสร้างภาพด้วย AI มีการพัฒนาอย่างรวดเร็ว การที่ Google มุ่งเน้นการแก้ไขภาพแบบแม่นยำอาจทำให้ Gemini ได้เปรียบ อย่างไรก็ตาม ผลกระทบที่แท้จริงของฟีเจอร์นี้จะเห็นได้ชัดเจนเมื่อมีการเปิดตัวอย่างเป็นทางการและได้รับการทดสอบอย่างละเอียดจากผู้ใช้
ในตอนนี้ ผู้ที่สนใจลองใช้ความสามารถใหม่เหล่านี้จะต้องรอให้ Google เปิดตัวฟีเจอร์นี้ให้ใช้งานได้อย่างกว้างขวางมากขึ้น ซึ่งคาดว่าจะเกิดขึ้นในอนาคตอันใกล้