Google Gemini ขยายความสามารถด้าน AI ด้วยการแก้ไขรูปภาพและการวิเคราะห์ PDF

BigGo Editorial Team

Google Gemini ขยายความสามารถด้าน AI ด้วยการแก้ไขรูปภาพและการวิเคราะห์ PDF

Google กำลังเพิ่มขีดความสามารถของ Gemini AI ด้วยการอัปเดตที่สำคัญสองประการ ซึ่งสัญญาว่าจะยกระดับทั้งการสร้างเนื้อหาภาพและการวิเคราะห์เอกสาร


อินเทอร์เฟซนี้แสดงให้เห็นถึงคุณสมบัติที่เป็นนวัตกรรมของปัญญาประดิษฐ์ Gemini ของ Google ซึ่งช่วยเพิ่มประสิทธิภาพการโต้ตอบกับผู้ใช้ผ่านคำสั่งเสียง

อินเทอร์เฟซนี้แสดงให้เห็นถึงคุณสมบัติที่เป็นนวัตกรรมของปัญญาประดิษฐ์ Gemini ของ Google ซึ่งช่วยเพิ่มประสิทธิภาพการโต้ตอบกับผู้ใช้ผ่านคำสั่งเสียง

การแก้ไขรูปภาพด้วย AI กำลังมาสู่ Gemini

Google เตรียมแนะนำความสามารถในการปรับแต่งละเอียดให้กับเครื่องมือสร้างภาพ AI ของ Gemini ซึ่งจะช่วยให้ผู้ใช้สามารถแก้ไขรายละเอียดของภาพที่สร้างด้วย AI หลังจากสร้างเสร็จแล้ว ฟีเจอร์นี้มีจุดมุ่งหมายเพื่อแก้ไขปัญหาทั่วไปในภาพที่สร้างด้วย AI เช่น ข้อผิดพลาดทางกายวิภาคหรือการออกแบบสถาปัตยกรรมที่เป็นไปไม่ได้

การอัปเดตที่กำลังจะมาถึงจะนำเสนอวิธีการแก้ไขสองวิธี:

การปรับแต่งด้วยข้อความ: ผู้ใช้สามารถส่งคำสั่งเพื่อแก้ไขลักษณะเฉพาะของภาพที่สร้างด้วย AI ที่มีอยู่
การแก้ไขแบบโต้ตอบ: ผู้ใช้สามารถเลือกพื้นที่ของภาพและอธิบายการเปลี่ยนแปลงที่ต้องการ โดย Gemini จะใช้การแก้ไขเฉพาะในบริเวณที่เลือกเท่านั้น

เครื่องมือเหล่านี้อาจมีประโยชน์อย่างยิ่งสำหรับมืออาชีพในสาขาต่างๆ เช่น การออกแบบกราฟิก การตลาด และสื่อสังคมออนไลน์ ซึ่งความแม่นยำของภาพและเวลาในการทำงานที่รวดเร็วมีความสำคัญ

แม้ว่า Google จะไม่ใช่รายแรกที่นำฟีเจอร์เหล่านี้มาใช้ - ความสามารถที่คล้ายคลึงกันมีอยู่ในเครื่องมือเช่น DALL-E ของ OpenAI และ Adobe Firefly - การอัปเดตนี้แสดงถึงความก้าวหน้าทางเทคนิคที่สำคัญสำหรับ Gemini ในขณะที่ Google ยังคงแข่งขันในพื้นที่ AI แบบสร้างสรรค์


อินเทอร์เฟซนี้แสดงให้เห็นว่า Gemini สามารถเพิ่มประสิทธิภาพการทำงานได้อย่างไรผ่านความสามารถในการแก้ไขภาพขั้นสูงภายในระบบนิเวศของ Google

การผสาน Gemini เข้ากับตัวดู PDF ของ Google Drive

ในการพัฒนาอีกส่วนหนึ่ง Google กำลังนำฟังก์ชัน Gemini มาใช้โดยตรงในตัวดู PDF ของ Google Drive การผสานนี้นำพลังของ Gemini 1.5 Pro มาใช้ในการวิเคราะห์ PDF และงานสร้างเนื้อหา

ฟีเจอร์สำคัญของการผสาน Gemini กับ PDF ได้แก่:

การสรุป PDF ที่ยาวและซับซ้อน
ความสามารถในการตอบคำถามตามเนื้อหาของเอกสาร
เครื่องมือสร้างเนื้อหา (เช่น คู่มือการศึกษา, ร่างอีเมล) โดยใช้ข้อมูลจาก PDF
ความสามารถในการรวมข้อมูลจากไฟล์ Google Drive หลายไฟล์

ฟีเจอร์นี้รองรับ PDF หลายประเภท รวมถึงเอกสารที่สแกน ไฟล์ที่มีข้อความมาก และไฟล์ที่มีตารางซับซ้อน

การผสาน Gemini นี้กำลังเปิดตัวสำหรับสมาชิก Google One AI Premium และผู้ใช้ที่มีส่วนเสริม Gemini Business, Enterprise และ Education

การอัปเดตทั้งสองนี้เน้นย้ำถึงความมุ่งมั่นของ Google ในการขยายความสามารถของ Gemini ทั่วทั้งระบบนิเวศของบริษัท ทำให้เครื่องมือที่ขับเคลื่อนด้วย AI สามารถเข้าถึงได้ง่ายขึ้นและผสานเข้ากับขั้นตอนการทำงานเพื่อเพิ่มประสิทธิภาพในชีวิตประจำวัน

อัปเดต: วันพฤหัสบดีที่ 1 สิงหาคม เวลา 22:48

Google กำลังขยายความสามารถของ Gemini เพิ่มเติมด้วยส่วนขยายใหม่สำหรับบริการยอดนิยม การผสานที่กำลังจะมาถึงรวมถึง Google Keep สำหรับการจดบันทึก Google Tasks สำหรับการจัดการงาน และ Google Calendar สำหรับการจัดตารางกิจกรรม ส่วนขยายเหล่านี้จะช่วยให้ผู้ใช้สามารถโต้ตอบกับบริการเหล่านี้ผ่านคำสั่งเสียง เพิ่มประสิทธิภาพการทำงานภายในระบบนิเวศของ Google นอกจากนี้ ส่วนขยาย Spotify กำลังอยู่ในขั้นตอนการพัฒนา ซึ่งถือเป็นการผสานบริการภายนอกครั้งแรกของ Gemini สิ่งนี้จะช่วยให้ผู้ใช้สามารถควบคุมการเล่นเพลงและพอดแคสต์โดยไม่ต้องเปิดแอป Spotify ส่วนขยายอื่นๆ ที่อาจอยู่ในขั้นตอนการพัฒนารวมถึงการผสาน Google Home และฟีเจอร์แอปโทรศัพท์ ซึ่งแสดงให้เห็นถึงความตั้งใจของ Google ในการวาง Gemini เป็นศูนย์กลางสำหรับชีวิตดิจิทัลของผู้ใช้ในบริการและแพลตฟอร์มต่างๆ


การผสานรวม Gemini กับ Google Drive ช่วยเพิ่มประสิทธิภาพในการวิเคราะห์ PDF และการสร้างเนื้อหา ทำให้ขั้นตอนการทำงานของผู้ใช้ราบรื่นยิ่งขึ้น

ข่าวที่เกี่ยวข้อง

‌

‌
‌

‌

‌
‌

‌