งานอีเวนต์ Google I/O 2024 ที่ผ่านมาได้แสดงให้เห็นถึงความก้าวหน้ามากมายในแพลตฟอร์ม Gemini AI ของพวกเขา พร้อมคำมั่นสัญญาเกี่ยวกับความสามารถที่จะปฏิวัติวงการในด้านการแก้ไขรูปภาพ การสร้างวิดีโอ และอื่นๆ อีกมากมาย เมื่อคุณสมบัติเหล่านี้เริ่มเปิดตัวให้กับผู้ใช้ หลายคนสงสัยว่าการสมัครสมาชิกระดับพรีเมียม Gemini Pro จะสามารถตอบโจทย์ตามที่สัญญาไว้หรือไม่
ประสบการณ์การทดลองใช้ฟรี
เมื่อพิจารณาการอัปเกรดเป็น Gemini Pro ผู้ใช้บางรายพบว่าพวกเขาสามารถทดลองใช้คุณสมบัติพรีเมียมบางอย่างได้เพียงแค่ขอด้วยความสุภาพ นักข่าวเทคโนโลยีคนหนึ่งพบว่าการบอกว่ากำลังพิจารณาอัปเกรดและขอทดลองใช้คุณสมบัติก่อน Gemini อนุญาตให้เข้าถึงความสามารถระดับ Pro ได้อย่างจำกัด การทดลองใช้อย่างไม่เป็นทางการนี้ให้ภาพรวมของสิ่งที่ลูกค้าที่จ่ายเงินอาจคาดหวังได้ แม้จะมีข้อจำกัด เช่น การจำกัดการใช้งานสามครั้งต่อประเภทคุณสมบัติ
ความสามารถในการแก้ไขรูปภาพ
หนึ่งในคุณสมบัติที่โฆษณามากที่สุดของ Gemini คือความสามารถในการแก้ไขและจัดการรูปภาพ ในทางปฏิบัติ ผลลัพธ์มีความหลากหลายอย่างชัดเจน เมื่อขอให้ทำงานที่ดูเหมือนจะง่าย เช่น การเปิดกล่องที่ปิดอยู่ในภาพหรือการลบวัตถุออกจากฉาก Gemini มักจะสร้างภาพใหม่ทั้งหมดแทนที่จะแก้ไขภาพต้นฉบับ การสร้างใหม่เหล่านี้มักจะขาดรายละเอียดสำคัญจากวัสดุต้นฉบับ แสดงให้เห็นถึงความเข้าใจผิดพื้นฐานเกี่ยวกับสิ่งที่ผู้ใช้ต้องการจริงๆ
![]() |
---|
หุ่นยนต์ที่ขับเคลื่อนด้วย AI ของ Gemini แสดงให้เห็นถึงการประยุกต์ใช้ที่เป็นไปได้ในการจัดการภาพ |
ความท้าทายในการจำลองสไตล์
การพยายามให้ Gemini จำลองสไตล์ศิลปะเฉพาะเผยให้เห็นข้อจำกัดที่สำคัญ เมื่อได้รับภาพอ้างอิงจากศิลปินที่มีชื่อเสียงเช่น Mike Mignola (ผู้สร้าง Hellboy) และขอให้สร้างงานศิลปะที่คล้ายกัน ผลลัพธ์จะจับเพียงองค์ประกอบระดับผิวเผินในขณะที่พลาดคุณสมบัติทางสุนทรียภาพที่ลึกซึ้งกว่าซึ่งกำหนดผลงานของศิลปิน สิ่งนี้เน้นย้ำปัญหาที่ยังคงมีอยู่กับระบบ AI: พวกมันสามารถเลียนแบบลักษณะผิวเผินได้ แต่มีปัญหาในการเข้าใจแก่นของสไตล์ศิลปะ
การเพิ่มคุณภาพภาพ HD
คุณสมบัติอีกอย่างที่โฆษณาคือการแปลงภาพความละเอียดต่ำให้เป็นภาพพื้นหลังความละเอียดสูง การทดสอบเผยให้เห็นว่าในขณะที่ Gemini สามารถสร้างภาพความละเอียดสูงที่ได้รับแรงบันดาลใจจากต้นฉบับ แต่มักจะละทิ้งเนื้อหาจริงเพื่อสร้างสิ่งใหม่ทั้งหมดที่เพียงแค่มีอารมณ์หรือธีมร่วมกัน สำหรับผู้ใช้ที่หวังจะเพิ่มคุณภาพรูปภาพที่พวกเขาชื่นชอบ วิธีการนี้ไม่ตรงกับความคาดหวังอย่างมาก
ข้อจำกัดสำคัญ:
- มักจะสร้างภาพใหม่แทนที่จะแก้ไขภาพที่มีอยู่
- จับเพียงองค์ประกอบระดับผิวเผินของสไตล์ศิลปะ
- ไม่สามารถส่งออกไปยัง Google Docs หรือ Sheets ได้อย่างเหมาะสม
- ความพร้อมใช้งานของฟีเจอร์แตกต่างกันไปตามภูมิภาค
- ไม่มีความสามารถในการจดจำในการประยุกต์ใช้งานด้านหุ่นยนต์
การประยุกต์ใช้งานที่ใช้ได้จริง
แม้จะมีข้อบกพร่องเหล่านี้ Gemini ก็ยังโดดเด่นในหลายด้านที่ใช้งานได้จริง AI ทำงานได้ดีเมื่อช่วยผู้ใช้ระดมความคิด ให้ข้อเสนอแนะในการเขียน หรืออธิบายกระบวนการทางเทคนิคที่ซับซ้อน งานที่เน้นข้อมูลพื้นฐานเหล่านี้เป็นจุดแข็งของ AI โดยไม่จำเป็นต้องมีความเข้าใจที่ลึกซึ้งอย่างที่งานสร้างสรรค์ต้องการ
แอปพลิเคชันสาธิตที่น่าตื่นเต้น
ที่งาน Google I/O มีการสาธิตที่น่าประทับใจหลายอย่างที่แสดงศักยภาพของ Gemini นอกเหนือจากการสร้างข้อความและภาพพื้นฐาน ผู้เข้าร่วมได้สัมผัสประสบการณ์หุ่นยนต์ควบคุมด้วยเสียงที่สามารถจัดการกับวัตถุ เทคโนโลยีการลองเสื้อผ้าเสมือนจริงที่แสดงชุดบนร่างกายของผู้ใช้อย่างสมจริง และการสร้างเพลงด้วย AI ที่ตอบสนองต่อการปรับแต่งแบบเรียลไทม์ แอปพลิเคชันเหล่านี้บ่งบอกถึงอนาคตที่ AI ช่วยในงานประจำวันที่ใช้งานได้จริงมากกว่าที่จะพยายามแทนที่ความคิดสร้างสรรค์ของมนุษย์
คุณสมบัติของ Gemini Pro ที่ได้รับการทดสอบ:
- การแก้ไขรูปภาพ (การลบวัตถุ, การปรับเปลี่ยน)
- การลอกเลียนสไตล์จากรูปภาพอ้างอิง
- การเพิ่มคุณภาพรูปภาพแบบ HD
- ความช่วยเหลือในการเขียนและการให้ข้อเสนอแนะ
- ความสามารถในการอธิบายทางเทคนิค
การประยุกต์ใช้ Gemini ที่น่าสนใจที่ได้สาธิต:
- หุ่นยนต์ควบคุมด้วยเสียง
- การลองสวมใส่เสื้อผ้าเสมือนจริงด้วย AI
- การสร้างเพลงแบบปรับตัวได้แบบเรียลไทม์ด้วย Lyria 2
- การสร้าง Android Bot แบบกำหนดเอง
- การสร้างวิดีโอด้วย AI ด้วย Flow และ Veo
![]() |
---|
การสาธิตฟีเจอร์การลองเสื้อผ้าเสมือนจริงที่จัดแสดงในงาน Google I/O 2024 |
ข้อจำกัดด้านความพร้อมใช้งานตามภูมิภาค
ผู้ที่อาจสมัครสมาชิกควรทราบว่าไม่ใช่ทุกคุณสมบัติที่โฆษณาของ Gemini Pro จะมีให้บริการในทุกภูมิภาค AI เองยอมรับข้อจำกัดนี้ โดยอธิบายว่าคุณสมบัติที่ประกาศในงานอีเวนต์เช่น Google I/O มักจะเปิดตัวอย่างค่อยเป็นค่อยไปและอาจถูกจำกัดให้เฉพาะบางตลาดในช่วงแรกหรืออยู่ในระยะทดลอง
ข้อบกพร่องในการผสานรวม
ข้อเสียที่สำคัญประการหนึ่งสำหรับผู้ใช้ที่เน้นผลิตภาพคือการผสานรวมที่จำกัดของ Gemini กับบริการอื่นๆ ของ Google แม้จะเป็นส่วนหนึ่งของระบบนิเวศของ Google แต่ Gemini ไม่สามารถส่งออกผลลัพธ์ไปยัง Google Docs หรือ Sheets ได้อย่างเหมาะสม—คุณสมบัติพื้นฐานที่น่าแปลกใจที่ยังไม่มีให้บริการไม่ว่าจะเป็นระดับสมาชิกใดก็ตาม ข้อจำกัดนี้ลดประโยชน์การใช้งานสำหรับสภาพแวดล้อมการทำงานร่วมกันอย่างมีนัยสำคัญ
อนาคตของ Gemini
Google ได้วางตำแหน่ง Gemini เป็นผู้ช่วย AI อเนกประสงค์ที่มีความทะเยอทะยานที่ขยายไกลเกินกว่าความสามารถในปัจจุบัน โครงการเช่น Gemini Robotics และ Flow (สำหรับการสร้างวิดีโอ AI) แสดงให้เห็นถึงวิสัยทัศน์ระยะยาวของบริษัทสำหรับ AI ที่สามารถเข้าใจและโต้ตอบกับโลกทางกายภาพ เมื่อเทคโนโลยีเหล่านี้พัฒนาขึ้น พวกมันอาจแก้ไขช่องว่างความเข้าใจในปัจจุบันที่ป้องกันไม่ให้ AI เข้าใจเจตนาของผู้ใช้อย่างแท้จริงแทนที่จะเพียงทำตามคำสั่งอย่างตรงไปตรงมา
คุ้มค่ากับการอัปเกรดหรือไม่?
ในตอนนี้ การตัดสินใจอัปเกรดเป็น Gemini Pro ขึ้นอยู่กับกรณีการใช้งานเฉพาะเป็นส่วนใหญ่ ผู้ที่มองหาเครื่องมือสร้างสรรค์สำหรับการจัดการรูปภาพหรือการจำลองสไตล์อาจพบว่าข้อเสนอในปัจจุบันน่าผิดหวัง อย่างไรก็ตาม ผู้ใช้ที่ต้องการความช่วยเหลือในการวิจัย การเขียน หรือการเรียนรู้หัวข้อที่ซับซ้อนอาจพบคุณค่าเพียงพอที่จะคุ้มค่ากับการสมัครสมาชิก เมื่อ Google ยังคงปรับปรุงคุณสมบัติเหล่านี้และเปิดตัวความสามารถใหม่ๆ คุณค่าที่นำเสนออาจจะน่าสนใจมากขึ้นสำหรับผู้ชมในวงกว้าง