Grok AI ตามทันคู่แข่งด้วยฟีเจอร์การมองเห็นและรองรับเสียงหลายภาษา

BigGo Editorial Team
Grok AI ตามทันคู่แข่งด้วยฟีเจอร์การมองเห็นและรองรับเสียงหลายภาษา

การแข่งขันของแชทบอท AI ยังคงเดือดระอุเมื่อ xAI ของ Elon Musk แนะนำความสามารถใหม่ที่สำคัญให้กับแพลตฟอร์ม Grok ในการเคลื่อนไหวที่ทำให้เข้าใกล้คู่แข่งอย่าง ChatGPT ของ OpenAI และ Gemini ของ Google มากขึ้น Grok ตอนนี้มีความสามารถในการมองเห็นและฟีเจอร์เสียงที่เพิ่มขึ้น ซึ่งเป็นอีกก้าวหนึ่งสู่ผู้ช่วย AI ที่มีปฏิสัมพันธ์และตอบสนองมากขึ้น

Grok Vision ก้าวเข้าสู่สนาม AI ด้านการมองเห็น

Grok ได้เข้าร่วมกลุ่มระบบ AI ที่สามารถมองเห็นผ่านกล้องของอุปกรณ์ของคุณ Grok Vision ที่เพิ่งแนะนำใหม่ช่วยให้แชทบอทสามารถวิเคราะห์และตอบสนองต่อข้อมูลภาพที่จับภาพผ่านกล้องสมาร์ทโฟนได้แบบเรียลไทม์ ฟีเจอร์นี้ประกาศโดยนักพัฒนา xAI Ebby Amir เมื่อวันที่ 22 เมษายน 2025 ช่วยให้ผู้ใช้สามารถชี้กล้องไปที่วัตถุหรือฉากและถาม Grok คำถามเกี่ยวกับสิ่งที่มันเห็นได้ ความสามารถด้านการมองเห็นนี้คล้ายคลึงกับฟังก์ชันที่มีอยู่แล้วใน Gemini ของ Google และ ChatGPT ของ OpenAI ซึ่งบ่งชี้ว่าการมองเห็นแบบเรียลไทม์กำลังกลายเป็นฟีเจอร์มาตรฐานในแชทบอท AI ขั้นสูง

การรองรับเสียงหลายภาษาเพิ่มการเข้าถึง

นอกเหนือจากความสามารถด้านการมองเห็น การอัปเดตนี้ยังนำการรองรับเสียงที่ขยายมาสู่ Grok แชทบอทสามารถมีส่วนร่วมในการสนทนาด้วยเสียงในหลายภาษา รวมถึงภาษาสเปน ฝรั่งเศส ตุรกี ญี่ปุ่น และฮินดี ความสามารถหลายภาษานี้ขยายการเข้าถึง Grok สำหรับผู้ที่ไม่ได้พูดภาษาอังกฤษอย่างมีนัยสำคัญ และวางตำแหน่งให้เป็นผู้ช่วย AI ที่เกี่ยวข้องในระดับโลกมากขึ้น โหมดเสียงช่วยให้สามารถสนทนากับ AI ได้อย่างเป็นธรรมชาติ แม้ว่าเหมือนกับแชทบอทที่เปิดใช้งานด้วยเสียงอื่น ๆ ลักษณะสังเคราะห์ของเสียงยังคงเป็นที่สังเกตได้สำหรับผู้ใช้ส่วนใหญ่

ความพร้อมใช้งานของแพลตฟอร์มและฟีเจอร์พรีเมียม

ปัจจุบัน ฟีเจอร์ใหม่เหล่านี้มีให้เฉพาะผู้ใช้ iOS บนแผน Grok มาตรฐาน ตามรูปแบบของ xAI ในการเปิดตัวอัปเดตให้กับผู้ใช้ iPhone ก่อน ผู้ใช้ Android สามารถเข้าถึงความสามารถใหม่เหล่านี้ได้เฉพาะเมื่อสมัครสมาชิกแผน SuperGrok พรีเมียม ซึ่งมีค่าใช้จ่าย 30 ดอลลาร์สหรัฐต่อเดือน ระดับพรีเมียมยังรวมถึงฟีเจอร์เพิ่มเติม เช่น การค้นหาแบบเรียลไทม์ในโหมดเสียง ซึ่งให้สมาชิกที่จ่ายเงินมีฟังก์ชันการทำงานที่เพิ่มขึ้นนอกเหนือจากข้อเสนอมาตรฐาน

คุณสมบัติใหม่ของ Grok:

  • Grok Vision: การวิเคราะห์ภาพแบบเรียลไทม์ด้วยกล้อง
  • รองรับเสียงหลายภาษา: ภาษาสเปน ฝรั่งเศส ตุรกี ญี่ปุ่น ฮินดี
  • ค้นหาด้วยเสียงแบบเรียลไทม์ (สำหรับสมาชิก SuperGrok เท่านั้น)

ความพร้อมใช้งานบนแพลตฟอร์ม:

  • iOS: คุณสมบัติทั้งหมดพร้อมใช้งานในแผนมาตรฐาน
  • Android: คุณสมบัติต่างๆ ต้องสมัครสมาชิก SuperGrok ในราคา 30 ดอลลาร์สหรัฐต่อเดือน

อัปเดตล่าสุดของ xAI:

  • เครื่องมือสร้างเอกสารและแอปพลิเคชัน
  • คุณสมบัติความจำสำหรับเก็บบริบทการสนทนา

แนวโน้มที่กว้างขึ้นสู่ Agentic AI

การอัปเดตล่าสุดของ Grok สอดคล้องกับการเคลื่อนไหวของอุตสาหกรรมไปสู่สิ่งที่เรียกว่า agentic AI – ระบบที่สามารถรับรู้สภาพแวดล้อม กำหนดเป้าหมาย วางแผนการกระทำ และตัดสินใจโดยมีคำแนะนำจากมนุษย์น้อยที่สุด นี่เป็นวิวัฒนาการที่สำคัญจากโมเดล AI ก่อนหน้านี้ที่เพียงแค่ตอบสนองต่อคำสั่งเฉพาะหรือสร้างเนื้อหาตามข้อมูลการฝึกฝน Gemini 2.0 ของ Google และ ChatGPT ของ OpenAI พร้อมฟีเจอร์ Tasks เป็นตัวอย่างของแนวโน้มนี้ โดยนำเสนอความสามารถที่แปลงข้อมูลดิบให้เป็นข้อมูลเชิงลึกที่นำไปปฏิบัติได้ และช่วยให้ผู้ใช้สามารถตั้งการแจ้งเตือนและกำหนดงานที่เกิดขึ้นซ้ำได้

การพัฒนาฟีเจอร์อย่างรวดเร็วของ xAI

อัตราการพัฒนาที่ xAI มีความรวดเร็วอย่างเห็นได้ชัดในช่วงหลายเดือนที่ผ่านมา ก่อนหน้าการอัปเดตด้านการมองเห็นและเสียง Grok ได้รับเครื่องมือสำหรับการสร้างเอกสารและแอป รวมถึงฟีเจอร์ความจำที่ช่วยให้แชทบอทสามารถจดจำรายละเอียดจากการสนทนาก่อนหน้านี้ได้ ความสามารถด้านความจำนี้ช่วยให้มีการตอบสนองที่มีบริบทและเกี่ยวข้องมากขึ้นเมื่อเวลาผ่านไป เมื่อ AI สร้างประวัติการโต้ตอบกับผู้ใช้แต่ละคน

อนาคตของ AI สนทนา

เมื่อแชทบอท AI เช่น Grok, ChatGPT และ Gemini ยังคงได้รับความสามารถในการรับรู้และการเป็นตัวแทน พวกมันก็ใกล้เคียงกับวิสัยทัศน์ของผู้ช่วย AI ในนิยายวิทยาศาสตร์ที่แสดงในสื่อต่าง ๆ เช่น ภาพยนตร์เรื่อง Her ปี 2013 มากขึ้น ในขณะที่การใช้งานในปัจจุบันยังคงเปิดเผยลักษณะเทียมของพวกมันอย่างชัดเจน แนวโน้มบ่งชี้ถึงเพื่อน AI ที่เป็นธรรมชาติและมีประโยชน์มากขึ้น ซึ่งสามารถเข้าใจไม่เพียงแค่สิ่งที่เราพูด แต่ยังรวมถึงสิ่งที่เราเห็นและบริบทที่เราดำเนินการ สำหรับผู้ใช้ นี่หมายถึงความช่วยเหลือจาก AI ที่ใช้งานง่ายและมีประโยชน์มากขึ้น ซึ่งต้องการคำแนะนำที่ชัดเจนน้อยลงและให้การสนับสนุนที่เกี่ยวข้องมากขึ้น