เครื่องเฝ้าดูเด็กด้วย AI ใช้การวิเคราะห์วิดีโอในเครื่องเพื่อแจ้งเตือนผู้ปกครองเมื่อมีการละเมิดกฎความปลอดภัย

BigGo Editorial Team
เครื่องเฝ้าดูเด็กด้วย AI ใช้การวิเคราะห์วิดีโอในเครื่องเพื่อแจ้งเตือนผู้ปกครองเมื่อมีการละเมิดกฎความปลอดภัย

ระบบเฝ้าดูเด็กด้วย AI แบบโอเพนซอร์สใหม่ได้เกิดขึ้น ซึ่งใช้การวิเคราะห์วิดีโอในเครื่องเพื่อเฝ้าดูเด็กและแจ้งเตือนผู้ปกครองเมื่อมีการละเมิดกฎความปลอดภัย ระบบนี้เรียกว่า AI Baby Monitor ทำงานทั้งหมดบนฮาร์ดแวร์ในเครื่องโดยไม่ส่งข้อมูลใดๆ ไปยังเซิร์ฟเวอร์ภายนอก ซึ่งช่วยแก้ไขปัญหาความกังวลเรื่องความเป็นส่วนตัวที่เกิดขึ้นกับเครื่องเฝ้าดูเด็กเชิงพาณิชย์หลายตัว

คุณสมบัติหลัก:

  • เน้นความเป็นส่วนตัวเป็นอันดับแรก: การประมวลผลทั้งหมดทำงานในเครื่องเท่านั้น ข้อมูลไม่ออกจากเครือข่าย
  • Video LLM: ใช้โมเดล Qwen2.5 VL เป็นค่าเริ่มต้นผ่าน vLLM
  • กฎที่ปรับแต่งได้: คำแนะนำด้านความปลอดภัยในรูปแบบภาษาธรรมชาติในรูปแบบ YAML
  • รองรับหลายห้อง: ฟีดกล้องหลายตัวและการกำหนดค่าหลายแบบ
  • แดชบอร์ดแบบสด: อินเทอร์เฟซ Streamlit แสดงฟีดแบบเรียลไทม์และการให้เหตุผลของ AI
  • การแจ้งเตือนน้อยที่สุด: ระบบแจ้งเตือนเสียงบี๊บเบาๆ เพียงครั้งเดียว

ความสนใจของชุมชนในเรื่องความเข้ากันได้ของฮาร์ดแวร์และฟีเจอร์เสียง

โครงการนี้ได้จุดประกายการอภิปรายในหมู่ผู้ปกครองและผู้ที่สนใจเทคโนโลยี โดยเฉพาะเรื่องข้อกำหนดของฮาร์ดแวร์และคำขอฟีเจอร์ต่างๆ ผู้ใช้สอบถามเกี่ยวกับความเข้ากันได้กับแล็ปท็อป MacBook Pro ของ Apple ซึ่งไม่มี GPU เฉพาะที่ระบบต้องการสำหรับการประมวลผลวิดีโอแบบเรียลไทม์ ซึ่งเป็นการเน้นย้ำถึงความท้าทายทั่วไปของแอปพลิเคชัน AI ที่ต้องการพลังการประมวลผลสูง

ฟีเจอร์ที่ได้รับการร้องขออีกอย่างคือความสามารถในการประมวลผลเสียง ผู้ปกครองที่ทำงานโดยใส่หูฟังแสดงความสนใจที่จะให้ระบบตรวจจับเสียงร้องไห้ ไม่ใช่แค่การละเมิดความปลอดภัยทางภาพเท่านั้น ปัจจุบันเครื่องเฝ้าดูจะวิเคราะห์เฉพาะฟีดวิดีโอและส่งเสียงบี๊บเบาๆ เพียงครั้งเดียวเมื่อตรวจพบการละเมิดกฎ

ความต้องการของระบบ:

  • Docker และ docker-compose
  • GPU หนึ่งตัวสำหรับการประมวลผลแบบเรียลไทม์
  • Python 3.12 พร้อม uv
  • พื้นที่จัดเก็บข้อมูลประมาณ 6GB สำหรับดาวน์โหลดโมเดล
  • ประสิทธิภาพ: ประมาณ 1 คำขอต่อวินาทีบน GPU สำหรับผู้บริโภค

การนำไปใช้ทางเทคนิคทำให้เกิดคำถาม

ระบบใช้ Qwen2.5 VL ซึ่งเป็นโมเดลภาษาขนาดใหญ่ที่สามารถประมวลผลวิดีโอได้ เพื่อวิเคราะห์ฟีดจากกล้องแบบเรียลไทม์ สมาชิกในชุมชนได้ตั้งคำถามเกี่ยวกับการเลือกใช้โมเดลนี้โดยเฉพาะ โดยแนะนำว่าอาจมีทางเลือกอื่นที่น่าพิจารณา สถาปัตยกรรมประมวลผลประมาณหนึ่งเฟรมต่อวินาทีบน GPU ของผู้บริโภค ซึ่งนักพัฒนาอธิบายว่าเป็นประสิทธิภาพแบบเรียลไทม์พอสมควร

การติดตั้งประกอบด้วยหลายส่วนประกอบที่ทำงานร่วมกัน: วิดีโอสตรีมเมอร์จับภาพเฟรม Redis จัดการคิวข้อมูล และเซิร์ฟเวอร์ AI ในเครื่องประมวลผลข้อมูลภาพตามกฎความปลอดภัยที่ผู้ใช้กำหนด ผู้ปกครองสามารถปรับแต่งกฎโดยใช้ภาษาง่ายๆ เช่น เด็กไม่ควรปีนออกจากเปล หรือ เด็กควรมีผู้ใหญ่อยู่ด้วยเสมอ

องค์ประกอบของสถาปัตยกรรม:

  1. stream_to_redis.py - จับภาพเฟรมจากวิดีโอและจัดคิวใน Redis
  2. run_watcher.py - ประมวลผลเฟรมตามกฎความปลอดภัยโดยใช้โมเดล AI ในเครื่อง
  3. แดชบอร์ด Streamlit - ให้บริการอินเทอร์เฟซสำหรับการตรวจสอบแบบเรียลไทม์
  4. เซิร์ฟเวอร์ vLLM - ให้บริการโมเดล AI สำหรับการวิเคราะห์วิดีโอในเครื่อง
  5. Redis - จัดการคิวเฟรมและการจัดการข้อมูล
หน้า repository ของ GitHub สำหรับโครงการ AI Baby Monitor ที่แสดงโค้ดและทรัพยากรที่ใช้ในการพัฒนา
หน้า repository ของ GitHub สำหรับโครงการ AI Baby Monitor ที่แสดงโค้ดและทรัพยากรที่ใช้ในการพัฒนา

การถกเถียงระหว่างความเป็นส่วนตัวกับข้อกังวลทางกฎหมาย

แม้ว่าแนวทางที่ให้ความสำคัญกับความเป็นส่วนตัวจะได้รับการต้อนรับโดยทั่วไป แต่สมาชิกในชุมชนบางคนได้แสดงความกังวลเกี่ยวกับผลกระทบทางกฎหมายที่อาจเกิดขึ้น มีความกังวลว่าระบบเฝ้าดูเช่นนี้อาจถูกใช้ในทางที่ผิดเป็นหลักฐานในคดีละเลยเด็ก แม้ว่าผู้ปกครองจะใช้อย่างรับผิดชอบเป็นเครื่องมือความปลอดภัยเสริม

สมบูรณ์แบบแล้ว ตอนนี้เราสามารถส่งผู้ปกครองที่มีเจตนาดีเข้าคุกข้อหาละเลยได้มากขึ้น สำหรับทุกความคิดที่ดี ความคิดที่ไม่ดีก็จะเกิดขึ้น

นักพัฒนาได้ใส่คำปฏิเสธความรับผิดชอบอย่างชัดเจน โดยเน้นย้ำว่าระบบนี้ไม่ใช่ตัวแทนการดูแลของผู้ใหญ่และไม่ควรใช้เพื่อทิ้งเด็กให้อยู่คนเดียว พวกเขาวางตำแหน่งระบบนี้เป็นเครื่องมือทดลองเพื่อช่วยผู้ปกครองสังเกตเห็นสถานการณ์อันตรายในช่วงเวลาสั้นๆ ที่ไขว้เขว

บทสรุป

AI Baby Monitor เป็นตัวแทนของจุดตัดที่น่าสนใจระหว่างความวิตกกังวลของผู้ปกครอง ความกังวลเรื่องความเป็นส่วนตัว และเทคโนโลยี AI ที่เข้าถึงได้ แม้ว่าชุมชนจะแสดงความสนใจอย่างแท้จริงในแนวคิดนี้ แต่คำถามเกี่ยวกับข้อกำหนดของฮาร์ดแวร์ ข้อจำกัดของฟีเจอร์ และการใช้ในทางที่ผิดที่อาจเกิดขึ้น สะท้อนถึงการพิจารณาที่ซับซ้อนที่ผู้ปกครองต้องเผชิญเมื่อนำเทคโนโลยีเฝ้าดูใหม่มาใช้ ลักษณะโอเพนซอร์สของโครงการและแนวทางการประมวลผลในเครื่องช่วยแก้ไขความกังวลเรื่องความเป็นส่วนตัวบางประการ แต่ความท้าทายในการนำไปใช้และผลกระทบต่อสังคมในวงกว้างยังคงเป็นหัวข้อที่มีการอภิปรายอย่างต่อเนื่อง

อ้างอิง: Al Baby Monitor (Local Video-LLM Nanny)