ทดสอบ Gemini Pro: คุณสมบัติ AI ที่น่าประทับใจ แต่ยังไม่ตรงเป้าหมาย

BigGo Editorial Team

ทดสอบ Gemini Pro: คุณสมบัติ AI ที่น่าประทับใจ แต่ยังไม่ตรงเป้าหมาย

งานอีเวนต์ Google I/O 2024 ที่ผ่านมาได้แสดงให้เห็นถึงความก้าวหน้ามากมายในแพลตฟอร์ม Gemini AI ของพวกเขา พร้อมคำมั่นสัญญาเกี่ยวกับความสามารถที่จะปฏิวัติวงการในด้านการแก้ไขรูปภาพ การสร้างวิดีโอ และอื่นๆ อีกมากมาย เมื่อคุณสมบัติเหล่านี้เริ่มเปิดตัวให้กับผู้ใช้ หลายคนสงสัยว่าการสมัครสมาชิกระดับพรีเมียม Gemini Pro จะสามารถตอบโจทย์ตามที่สัญญาไว้หรือไม่

ประสบการณ์การทดลองใช้ฟรี

เมื่อพิจารณาการอัปเกรดเป็น Gemini Pro ผู้ใช้บางรายพบว่าพวกเขาสามารถทดลองใช้คุณสมบัติพรีเมียมบางอย่างได้เพียงแค่ขอด้วยความสุภาพ นักข่าวเทคโนโลยีคนหนึ่งพบว่าการบอกว่ากำลังพิจารณาอัปเกรดและขอทดลองใช้คุณสมบัติก่อน Gemini อนุญาตให้เข้าถึงความสามารถระดับ Pro ได้อย่างจำกัด การทดลองใช้อย่างไม่เป็นทางการนี้ให้ภาพรวมของสิ่งที่ลูกค้าที่จ่ายเงินอาจคาดหวังได้ แม้จะมีข้อจำกัด เช่น การจำกัดการใช้งานสามครั้งต่อประเภทคุณสมบัติ

ความสามารถในการแก้ไขรูปภาพ

หนึ่งในคุณสมบัติที่โฆษณามากที่สุดของ Gemini คือความสามารถในการแก้ไขและจัดการรูปภาพ ในทางปฏิบัติ ผลลัพธ์มีความหลากหลายอย่างชัดเจน เมื่อขอให้ทำงานที่ดูเหมือนจะง่าย เช่น การเปิดกล่องที่ปิดอยู่ในภาพหรือการลบวัตถุออกจากฉาก Gemini มักจะสร้างภาพใหม่ทั้งหมดแทนที่จะแก้ไขภาพต้นฉบับ การสร้างใหม่เหล่านี้มักจะขาดรายละเอียดสำคัญจากวัสดุต้นฉบับ แสดงให้เห็นถึงความเข้าใจผิดพื้นฐานเกี่ยวกับสิ่งที่ผู้ใช้ต้องการจริงๆ


หุ่นยนต์ที่ขับเคลื่อนด้วย AI ของ Gemini แสดงให้เห็นถึงการประยุกต์ใช้ที่เป็นไปได้ในการจัดการภาพ

ความท้าทายในการจำลองสไตล์

การพยายามให้ Gemini จำลองสไตล์ศิลปะเฉพาะเผยให้เห็นข้อจำกัดที่สำคัญ เมื่อได้รับภาพอ้างอิงจากศิลปินที่มีชื่อเสียงเช่น Mike Mignola (ผู้สร้าง Hellboy) และขอให้สร้างงานศิลปะที่คล้ายกัน ผลลัพธ์จะจับเพียงองค์ประกอบระดับผิวเผินในขณะที่พลาดคุณสมบัติทางสุนทรียภาพที่ลึกซึ้งกว่าซึ่งกำหนดผลงานของศิลปิน สิ่งนี้เน้นย้ำปัญหาที่ยังคงมีอยู่กับระบบ AI: พวกมันสามารถเลียนแบบลักษณะผิวเผินได้ แต่มีปัญหาในการเข้าใจแก่นของสไตล์ศิลปะ

การเพิ่มคุณภาพภาพ HD

คุณสมบัติอีกอย่างที่โฆษณาคือการแปลงภาพความละเอียดต่ำให้เป็นภาพพื้นหลังความละเอียดสูง การทดสอบเผยให้เห็นว่าในขณะที่ Gemini สามารถสร้างภาพความละเอียดสูงที่ได้รับแรงบันดาลใจจากต้นฉบับ แต่มักจะละทิ้งเนื้อหาจริงเพื่อสร้างสิ่งใหม่ทั้งหมดที่เพียงแค่มีอารมณ์หรือธีมร่วมกัน สำหรับผู้ใช้ที่หวังจะเพิ่มคุณภาพรูปภาพที่พวกเขาชื่นชอบ วิธีการนี้ไม่ตรงกับความคาดหวังอย่างมาก

ข้อจำกัดสำคัญ:

มักจะสร้างภาพใหม่แทนที่จะแก้ไขภาพที่มีอยู่
จับเพียงองค์ประกอบระดับผิวเผินของสไตล์ศิลปะ
ไม่สามารถส่งออกไปยัง Google Docs หรือ Sheets ได้อย่างเหมาะสม
ความพร้อมใช้งานของฟีเจอร์แตกต่างกันไปตามภูมิภาค
ไม่มีความสามารถในการจดจำในการประยุกต์ใช้งานด้านหุ่นยนต์

การประยุกต์ใช้งานที่ใช้ได้จริง

แม้จะมีข้อบกพร่องเหล่านี้ Gemini ก็ยังโดดเด่นในหลายด้านที่ใช้งานได้จริง AI ทำงานได้ดีเมื่อช่วยผู้ใช้ระดมความคิด ให้ข้อเสนอแนะในการเขียน หรืออธิบายกระบวนการทางเทคนิคที่ซับซ้อน งานที่เน้นข้อมูลพื้นฐานเหล่านี้เป็นจุดแข็งของ AI โดยไม่จำเป็นต้องมีความเข้าใจที่ลึกซึ้งอย่างที่งานสร้างสรรค์ต้องการ

แอปพลิเคชันสาธิตที่น่าตื่นเต้น

ที่งาน Google I/O มีการสาธิตที่น่าประทับใจหลายอย่างที่แสดงศักยภาพของ Gemini นอกเหนือจากการสร้างข้อความและภาพพื้นฐาน ผู้เข้าร่วมได้สัมผัสประสบการณ์หุ่นยนต์ควบคุมด้วยเสียงที่สามารถจัดการกับวัตถุ เทคโนโลยีการลองเสื้อผ้าเสมือนจริงที่แสดงชุดบนร่างกายของผู้ใช้อย่างสมจริง และการสร้างเพลงด้วย AI ที่ตอบสนองต่อการปรับแต่งแบบเรียลไทม์ แอปพลิเคชันเหล่านี้บ่งบอกถึงอนาคตที่ AI ช่วยในงานประจำวันที่ใช้งานได้จริงมากกว่าที่จะพยายามแทนที่ความคิดสร้างสรรค์ของมนุษย์

คุณสมบัติของ Gemini Pro ที่ได้รับการทดสอบ:

การแก้ไขรูปภาพ (การลบวัตถุ, การปรับเปลี่ยน)
การลอกเลียนสไตล์จากรูปภาพอ้างอิง
การเพิ่มคุณภาพรูปภาพแบบ HD
ความช่วยเหลือในการเขียนและการให้ข้อเสนอแนะ
ความสามารถในการอธิบายทางเทคนิค

การประยุกต์ใช้ Gemini ที่น่าสนใจที่ได้สาธิต:

หุ่นยนต์ควบคุมด้วยเสียง
การลองสวมใส่เสื้อผ้าเสมือนจริงด้วย AI
การสร้างเพลงแบบปรับตัวได้แบบเรียลไทม์ด้วย Lyria 2
การสร้าง Android Bot แบบกำหนดเอง
การสร้างวิดีโอด้วย AI ด้วย Flow และ Veo


การสาธิตฟีเจอร์การลองเสื้อผ้าเสมือนจริงที่จัดแสดงในงาน Google I/O 2024

ข้อจำกัดด้านความพร้อมใช้งานตามภูมิภาค

ผู้ที่อาจสมัครสมาชิกควรทราบว่าไม่ใช่ทุกคุณสมบัติที่โฆษณาของ Gemini Pro จะมีให้บริการในทุกภูมิภาค AI เองยอมรับข้อจำกัดนี้ โดยอธิบายว่าคุณสมบัติที่ประกาศในงานอีเวนต์เช่น Google I/O มักจะเปิดตัวอย่างค่อยเป็นค่อยไปและอาจถูกจำกัดให้เฉพาะบางตลาดในช่วงแรกหรืออยู่ในระยะทดลอง

ข้อบกพร่องในการผสานรวม

ข้อเสียที่สำคัญประการหนึ่งสำหรับผู้ใช้ที่เน้นผลิตภาพคือการผสานรวมที่จำกัดของ Gemini กับบริการอื่นๆ ของ Google แม้จะเป็นส่วนหนึ่งของระบบนิเวศของ Google แต่ Gemini ไม่สามารถส่งออกผลลัพธ์ไปยัง Google Docs หรือ Sheets ได้อย่างเหมาะสม—คุณสมบัติพื้นฐานที่น่าแปลกใจที่ยังไม่มีให้บริการไม่ว่าจะเป็นระดับสมาชิกใดก็ตาม ข้อจำกัดนี้ลดประโยชน์การใช้งานสำหรับสภาพแวดล้อมการทำงานร่วมกันอย่างมีนัยสำคัญ

อนาคตของ Gemini

Google ได้วางตำแหน่ง Gemini เป็นผู้ช่วย AI อเนกประสงค์ที่มีความทะเยอทะยานที่ขยายไกลเกินกว่าความสามารถในปัจจุบัน โครงการเช่น Gemini Robotics และ Flow (สำหรับการสร้างวิดีโอ AI) แสดงให้เห็นถึงวิสัยทัศน์ระยะยาวของบริษัทสำหรับ AI ที่สามารถเข้าใจและโต้ตอบกับโลกทางกายภาพ เมื่อเทคโนโลยีเหล่านี้พัฒนาขึ้น พวกมันอาจแก้ไขช่องว่างความเข้าใจในปัจจุบันที่ป้องกันไม่ให้ AI เข้าใจเจตนาของผู้ใช้อย่างแท้จริงแทนที่จะเพียงทำตามคำสั่งอย่างตรงไปตรงมา

คุ้มค่ากับการอัปเกรดหรือไม่?

ในตอนนี้ การตัดสินใจอัปเกรดเป็น Gemini Pro ขึ้นอยู่กับกรณีการใช้งานเฉพาะเป็นส่วนใหญ่ ผู้ที่มองหาเครื่องมือสร้างสรรค์สำหรับการจัดการรูปภาพหรือการจำลองสไตล์อาจพบว่าข้อเสนอในปัจจุบันน่าผิดหวัง อย่างไรก็ตาม ผู้ใช้ที่ต้องการความช่วยเหลือในการวิจัย การเขียน หรือการเรียนรู้หัวข้อที่ซับซ้อนอาจพบคุณค่าเพียงพอที่จะคุ้มค่ากับการสมัครสมาชิก เมื่อ Google ยังคงปรับปรุงคุณสมบัติเหล่านี้และเปิดตัวความสามารถใหม่ๆ คุณค่าที่นำเสนออาจจะน่าสนใจมากขึ้นสำหรับผู้ชมในวงกว้าง

ข่าวที่เกี่ยวข้อง

‌

‌
‌

‌

‌
‌

‌