Google เปิดตัว Gemini 2.0: ก้าวกระโดดครั้งสำคัญของ AI พร้อมความสามารถมัลติโมดัลและเทคโนโลยีเอเจนต์

BigGo Editorial Team

Google เปิดตัว Gemini 2.0: ก้าวกระโดดครั้งสำคัญของ AI พร้อมความสามารถมัลติโมดัลและเทคโนโลยีเอเจนต์

ในการพัฒนาที่สำคัญด้านปัญญาประดิษฐ์ Google ได้ประกาศเปิดตัว Gemini 2.0 ซึ่งถือเป็นการพัฒนาครั้งสำคัญในด้านความสามารถของ AI และเป็นการวางรากฐานสำหรับผู้ช่วย AI รุ่นต่อไป การเปิดตัวครั้งนี้แสดงให้เห็นถึงกลยุทธ์ของ Google ในการรักษาความได้เปรียบทางการแข่งขันในวงการ AI ที่กำลังพัฒนาอย่างรวดเร็ว โดยเฉพาะในขณะที่ OpenAI ยังคงสร้างความฮือฮาด้วยนวัตกรรมของตนเอง

ความสามารถมัลติโมดัลที่ปฏิวัติวงการ

Gemini 2.0 โดดเด่นในฐานะโมเดล AI ตัวแรกที่นำเสนอการประมวลผลข้อมูลแบบมัลติโมดัลโดยธรรมชาติ ระบบสามารถจัดการข้อความ รูปภาพ วิดีโอ และเสียงได้อย่างราบรื่น โดยแสดงให้เห็นถึงความเร็วในการประมวลผลที่เพิ่มขึ้นเป็นสองเท่าเมื่อเทียบกับรุ่นก่อน Gemini 1.5 Pro ความก้าวหน้านี้ช่วยให้สามารถประมวลผลข้อมูลที่ซับซ้อนแบบเรียลไทม์ในขณะที่ยังคงรักษาประสิทธิภาพด้านต้นทุนและการทำงาน

สามเอเจนต์หลัก: Astra, Mariner และ Jules

Google ได้แนะนำเอเจนต์ AI สามตัวที่พัฒนาขึ้นบนพื้นฐานของ Gemini 2.0 โดย Project Astra ทำหน้าที่เป็นผู้ช่วย AI อเนกประสงค์ที่มีความสามารถในการสนทนาที่ดีขึ้นและมีหน่วยความจำการสนทนานานถึง 10 นาที Project Mariner ปฏิวัติการโต้ตอบกับเบราว์เซอร์โดยสามารถเข้าใจและจัดการกับองค์ประกอบเว็บด้วยอัตราความสำเร็จที่น่าประทับใจถึง 83.5% ในงานจริง ส่วน Jules ผู้ช่วยด้านการเขียนโค้ด ผสานรวมโดยตรงกับเวิร์กโฟลว์ของ GitHub เพื่อปรับปรุงกระบวนการพัฒนาซอฟต์แวร์

ตัวชี้วัดประสิทธิภาพหลัก:

ความเร็วในการประมวลผล: เร็วกว่า Gemini 1.5 Pro 2 เท่า
ความยาวบริบท: 2 ล้านโทเค็น (เทียบเท่ากับวิดีโอหลายชั่วโมง)
อัตราความสำเร็จของ Project Mariner: 83.5% จากการทดสอบ WebVoyager
ความจุหน่วยความจำ: Project Astra สามารถจดจำการสนทนาได้นาน 10 นาที

การปรับปรุง TPU Trillium:

ประสิทธิภาพการเทรนนิ่ง: เพิ่มขึ้น 4 เท่า
ปริมาณการอนุมาน: เพิ่มขึ้น 3 เท่า
สมรรถนะการประมวลผลสูงสุด: เพิ่มขึ้น 4.7 เท่าต่อชิป
ประสิทธิภาพต้นทุน: ประสิทธิภาพการเทรนนิ่งต่อดอลลาร์เพิ่มขึ้น 2.5 เท่า
โครงสร้างพื้นฐาน: มี TPU 100,000 ตัวในเครือข่าย Jupiter

นวัตกรรมฮาร์ดแวร์ที่ขับเคลื่อนประสิทธิภาพ

พลังของ Gemini 2.0 มาจาก TPU รุ่นที่ 6 ของ Google ที่มีชื่อว่า Trillium ฮาร์ดแวร์ที่ออกแบบมาโดยเฉพาะนี้สร้างการพัฒนาที่น่าทึ่ง รวมถึงประสิทธิภาพการเทรนที่เพิ่มขึ้น 4 เท่า ประสิทธิภาพการอนุมานที่ดีขึ้น 3 เท่า และประสิทธิภาพที่เพิ่มขึ้น 67% โครงสร้างพื้นฐานประกอบด้วยเครือข่าย Jupiter ที่มี TPU 100,000 ตัว ให้ประสิทธิภาพการเทรนที่ดีขึ้น 2.5 เท่าต่อเงินที่ลงทุน

การเข้าถึงและการเปิดตัวในอนาคต

นักพัฒนาสามารถเข้าถึง Gemini 2.0 Flash ผ่าน Google AI Studio และ Vertex AI ได้ในปัจจุบัน แพลตฟอร์มจะขยายตัวในต้นปี 2025 พร้อมโมเดลขนาดเพิ่มเติมและเวอร์ชันมัลติโมดัล ความมุ่งมั่นของ Google ในด้าน AI ที่รับผิดชอบเห็นได้ชัดจากการนำเทคโนโลยีลายน้ำ SynthID มาใช้สำหรับเนื้อหาที่สร้างขึ้น

การเริ่มต้นยุคแห่งเอเจนต์

วิสัยทัศน์ของ Google ขยายไปไกลกว่าความสามารถของ AI แบบดั้งเดิม โดยวาง Gemini 2.0 เป็นรากฐานสำหรับยุคแห่ง AI Agent ที่คาดว่าจะเกิดขึ้นอย่างเต็มรูปแบบในปี 2025 ภายใต้การนำของ Sundar Pichai Google กำลังผสานความสามารถด้าน AI เข้ากับระบบนิเวศผลิตภัณฑ์ของตน โดย AI Overviews ให้บริการผู้ใช้งานมากกว่าหนึ่งพันล้านคนแล้ว โครงการเชิงกลยุทธ์นี้แสดงให้เห็นถึงความมุ่งมั่นของ Google ในการทำให้ AI ใช้งานได้จริงและเข้าถึงได้ง่ายขึ้น ในขณะที่ยังคงรักษาความปลอดภัยและการควบคุมของผู้ใช้

ข่าวที่เกี่ยวข้อง

‌

‌
‌

‌

‌
‌

‌