การแข่งขันของแชทบอท AI ยังคงเดือดระอุเมื่อ xAI ของ Elon Musk แนะนำความสามารถใหม่ที่สำคัญให้กับแพลตฟอร์ม Grok ในการเคลื่อนไหวที่ทำให้เข้าใกล้คู่แข่งอย่าง ChatGPT ของ OpenAI และ Gemini ของ Google มากขึ้น Grok ตอนนี้มีความสามารถในการมองเห็นและฟีเจอร์เสียงที่เพิ่มขึ้น ซึ่งเป็นอีกก้าวหนึ่งสู่ผู้ช่วย AI ที่มีปฏิสัมพันธ์และตอบสนองมากขึ้น
Grok Vision ก้าวเข้าสู่สนาม AI ด้านการมองเห็น
Grok ได้เข้าร่วมกลุ่มระบบ AI ที่สามารถมองเห็นผ่านกล้องของอุปกรณ์ของคุณ Grok Vision ที่เพิ่งแนะนำใหม่ช่วยให้แชทบอทสามารถวิเคราะห์และตอบสนองต่อข้อมูลภาพที่จับภาพผ่านกล้องสมาร์ทโฟนได้แบบเรียลไทม์ ฟีเจอร์นี้ประกาศโดยนักพัฒนา xAI Ebby Amir เมื่อวันที่ 22 เมษายน 2025 ช่วยให้ผู้ใช้สามารถชี้กล้องไปที่วัตถุหรือฉากและถาม Grok คำถามเกี่ยวกับสิ่งที่มันเห็นได้ ความสามารถด้านการมองเห็นนี้คล้ายคลึงกับฟังก์ชันที่มีอยู่แล้วใน Gemini ของ Google และ ChatGPT ของ OpenAI ซึ่งบ่งชี้ว่าการมองเห็นแบบเรียลไทม์กำลังกลายเป็นฟีเจอร์มาตรฐานในแชทบอท AI ขั้นสูง
การรองรับเสียงหลายภาษาเพิ่มการเข้าถึง
นอกเหนือจากความสามารถด้านการมองเห็น การอัปเดตนี้ยังนำการรองรับเสียงที่ขยายมาสู่ Grok แชทบอทสามารถมีส่วนร่วมในการสนทนาด้วยเสียงในหลายภาษา รวมถึงภาษาสเปน ฝรั่งเศส ตุรกี ญี่ปุ่น และฮินดี ความสามารถหลายภาษานี้ขยายการเข้าถึง Grok สำหรับผู้ที่ไม่ได้พูดภาษาอังกฤษอย่างมีนัยสำคัญ และวางตำแหน่งให้เป็นผู้ช่วย AI ที่เกี่ยวข้องในระดับโลกมากขึ้น โหมดเสียงช่วยให้สามารถสนทนากับ AI ได้อย่างเป็นธรรมชาติ แม้ว่าเหมือนกับแชทบอทที่เปิดใช้งานด้วยเสียงอื่น ๆ ลักษณะสังเคราะห์ของเสียงยังคงเป็นที่สังเกตได้สำหรับผู้ใช้ส่วนใหญ่
ความพร้อมใช้งานของแพลตฟอร์มและฟีเจอร์พรีเมียม
ปัจจุบัน ฟีเจอร์ใหม่เหล่านี้มีให้เฉพาะผู้ใช้ iOS บนแผน Grok มาตรฐาน ตามรูปแบบของ xAI ในการเปิดตัวอัปเดตให้กับผู้ใช้ iPhone ก่อน ผู้ใช้ Android สามารถเข้าถึงความสามารถใหม่เหล่านี้ได้เฉพาะเมื่อสมัครสมาชิกแผน SuperGrok พรีเมียม ซึ่งมีค่าใช้จ่าย 30 ดอลลาร์สหรัฐต่อเดือน ระดับพรีเมียมยังรวมถึงฟีเจอร์เพิ่มเติม เช่น การค้นหาแบบเรียลไทม์ในโหมดเสียง ซึ่งให้สมาชิกที่จ่ายเงินมีฟังก์ชันการทำงานที่เพิ่มขึ้นนอกเหนือจากข้อเสนอมาตรฐาน
คุณสมบัติใหม่ของ Grok:
- Grok Vision: การวิเคราะห์ภาพแบบเรียลไทม์ด้วยกล้อง
- รองรับเสียงหลายภาษา: ภาษาสเปน ฝรั่งเศส ตุรกี ญี่ปุ่น ฮินดี
- ค้นหาด้วยเสียงแบบเรียลไทม์ (สำหรับสมาชิก SuperGrok เท่านั้น)
ความพร้อมใช้งานบนแพลตฟอร์ม:
- iOS: คุณสมบัติทั้งหมดพร้อมใช้งานในแผนมาตรฐาน
- Android: คุณสมบัติต่างๆ ต้องสมัครสมาชิก SuperGrok ในราคา 30 ดอลลาร์สหรัฐต่อเดือน
อัปเดตล่าสุดของ xAI:
- เครื่องมือสร้างเอกสารและแอปพลิเคชัน
- คุณสมบัติความจำสำหรับเก็บบริบทการสนทนา
แนวโน้มที่กว้างขึ้นสู่ Agentic AI
การอัปเดตล่าสุดของ Grok สอดคล้องกับการเคลื่อนไหวของอุตสาหกรรมไปสู่สิ่งที่เรียกว่า agentic AI – ระบบที่สามารถรับรู้สภาพแวดล้อม กำหนดเป้าหมาย วางแผนการกระทำ และตัดสินใจโดยมีคำแนะนำจากมนุษย์น้อยที่สุด นี่เป็นวิวัฒนาการที่สำคัญจากโมเดล AI ก่อนหน้านี้ที่เพียงแค่ตอบสนองต่อคำสั่งเฉพาะหรือสร้างเนื้อหาตามข้อมูลการฝึกฝน Gemini 2.0 ของ Google และ ChatGPT ของ OpenAI พร้อมฟีเจอร์ Tasks เป็นตัวอย่างของแนวโน้มนี้ โดยนำเสนอความสามารถที่แปลงข้อมูลดิบให้เป็นข้อมูลเชิงลึกที่นำไปปฏิบัติได้ และช่วยให้ผู้ใช้สามารถตั้งการแจ้งเตือนและกำหนดงานที่เกิดขึ้นซ้ำได้
การพัฒนาฟีเจอร์อย่างรวดเร็วของ xAI
อัตราการพัฒนาที่ xAI มีความรวดเร็วอย่างเห็นได้ชัดในช่วงหลายเดือนที่ผ่านมา ก่อนหน้าการอัปเดตด้านการมองเห็นและเสียง Grok ได้รับเครื่องมือสำหรับการสร้างเอกสารและแอป รวมถึงฟีเจอร์ความจำที่ช่วยให้แชทบอทสามารถจดจำรายละเอียดจากการสนทนาก่อนหน้านี้ได้ ความสามารถด้านความจำนี้ช่วยให้มีการตอบสนองที่มีบริบทและเกี่ยวข้องมากขึ้นเมื่อเวลาผ่านไป เมื่อ AI สร้างประวัติการโต้ตอบกับผู้ใช้แต่ละคน
อนาคตของ AI สนทนา
เมื่อแชทบอท AI เช่น Grok, ChatGPT และ Gemini ยังคงได้รับความสามารถในการรับรู้และการเป็นตัวแทน พวกมันก็ใกล้เคียงกับวิสัยทัศน์ของผู้ช่วย AI ในนิยายวิทยาศาสตร์ที่แสดงในสื่อต่าง ๆ เช่น ภาพยนตร์เรื่อง Her ปี 2013 มากขึ้น ในขณะที่การใช้งานในปัจจุบันยังคงเปิดเผยลักษณะเทียมของพวกมันอย่างชัดเจน แนวโน้มบ่งชี้ถึงเพื่อน AI ที่เป็นธรรมชาติและมีประโยชน์มากขึ้น ซึ่งสามารถเข้าใจไม่เพียงแค่สิ่งที่เราพูด แต่ยังรวมถึงสิ่งที่เราเห็นและบริบทที่เราดำเนินการ สำหรับผู้ใช้ นี่หมายถึงความช่วยเหลือจาก AI ที่ใช้งานง่ายและมีประโยชน์มากขึ้น ซึ่งต้องการคำแนะนำที่ชัดเจนน้อยลงและให้การสนับสนุนที่เกี่ยวข้องมากขึ้น