วิธีการฝึกฝน AI ของ Nvidia ถูกตรวจสอบอย่างละเอียด
Nvidia บริษัทยักษ์ใหญ่ด้าน GPU ที่รู้จักกันดีในการขับเคลื่อนเทคโนโลยี AI ล้ำสมัย กำลังถูกวิพากษ์วิจารณ์เกี่ยวกับวิธีการเก็บรวบรวมข้อมูล รายงานล่าสุดเปิดเผยว่าบริษัทได้ทำการดึงข้อมูลวิดีโอจำนวนมหาศาลจากแหล่งต่างๆ เพื่อฝึกฝนโมเดล AI ของตน ซึ่งสร้างความกังวลด้านกฎหมายและจริยธรรมอย่างมีนัยสำคัญ
ขอบเขตการเก็บรวบรวมข้อมูลของ Nvidia
ตามเอกสารลับที่ถูกเปิดเผยและตรวจสอบโดย 404 Media โครงการภายในของ Nvidia ที่มีชื่อรหัสว่า Cosmos ได้ดำเนินการดังนี้:
- ดาวน์โหลดวิดีโอนับล้านรายการต่อวัน เทียบเท่ากับเนื้อหาวิดีโอรวม 80 ปี
- สะสม URL มากกว่า 30 ล้านรายการในเวลาเพียงหนึ่งเดือน
- ใช้แหล่งข้อมูลจาก YouTube, Netflix และแพลตฟอร์มวิดีโออื่นๆ
- ใช้คอมพิวเตอร์เสมือนหลายสิบเครื่องบน Amazon Web Services เพื่อทำงานนี้
การใช้งานที่ตั้งเป้าหมาย
Nvidia รายงานว่าตั้งใจจะใช้ข้อมูลนี้เพื่อฝึกฝนโมเดล AI สำหรับ:
- การสร้างโลก 3 มิติใน Omniverse
- การพัฒนายานยนต์ไร้คนขับ
- การสร้างอวตารดิจิทัล
- โครงการ AI เชิงพาณิชย์อื่นๆ
ข้อกังวลด้านกฎหมายและจริยธรรม
การปฏิบัติของบริษัทได้จุดประเด็นถกเถียงในหลายประเด็น:
- การละเมิดลิขสิทธิ์: วิดีโอจำนวนมากที่ถูกดึงข้อมูลน่าจะได้รับการคุ้มครองลิขสิทธิ์
- การละเมิดข้อตกลงการใช้งาน: การดาวน์โหลดเนื้อหาจากแพลตฟอร์มอย่าง YouTube มักละเมิดนโยบายการใช้งานของพวกเขา
- การคุ้มครองข้อมูลส่วนบุคคล: เนื้อหาวิดีโออาจมีข้อมูลส่วนบุคคลที่อยู่ภายใต้กฎหมายคุ้มครองความเป็นส่วนตัว
- การใช้งานทางวิชาการ vs. เชิงพาณิชย์: ชุดข้อมูลบางส่วนมีไว้สำหรับวัตถุประสงค์ทางวิชาการเท่านั้น
การตอบสนองของ Nvidia
เมื่อถูกถามเกี่ยวกับการปฏิบัติเหล่านี้ Nvidia ระบุว่าพวกเขาปฏิบัติตามตัวอักษรและเจตนารมณ์ของกฎหมายลิขสิทธิ์อย่างเต็มที่ บริษัทโต้แย้งว่า:
- กฎหมายลิขสิทธิ์คุ้มครองการแสดงออก ไม่ใช่ข้อเท็จจริงหรือแนวคิด
- การฝึกฝน AI อยู่ภายใต้การใช้งานอย่างเป็นธรรมในฐานะวัตถุประสงค์ที่เปลี่ยนแปลงไป
อย่างไรก็ตาม การตีความนี้ถูกโต้แย้งโดยแพลตฟอร์มเนื้อหาอย่าง YouTube ซึ่ง Neal Mohan ซีอีโอของบริษัทได้ระบุอย่างชัดเจนว่าการดาวน์โหลดเนื้อหาวิดีโอเป็นการละเมิดข้อตกลงการใช้งานของพวกเขา
โลโก้ของ OpenAI แสดงให้เห็นถึงการอภิปรายที่กำลังดำเนินอยู่ในอุตสาหกรรมเกี่ยวกับแนวปฏิบัติด้านจริยธรรมของ AI และประเด็นลิขสิทธิ์ ซึ่งเกี่ยวข้องกับการตอบสนองของ Nvidia เกี่ยวกับการใช้ข้อมูล |
ผลกระทบต่ออุตสาหกรรมโดยรวม
Nvidia ไม่ใช่บริษัทเดียวที่เผชิญกับการตรวจสอบเกี่ยวกับแหล่งข้อมูลฝึกฝน AI บริษัทอย่าง OpenAI และ Runway ก็เคยเผชิญกับข้อกล่าวหาคล้ายกัน ความขัดแย้งนี้ชี้ให้เห็นถึงความจำเป็นเร่งด่วนสำหรับ:
- ความโปร่งใสมากขึ้นในการพัฒนา AI
- กฎระเบียบที่ชัดเจนขึ้นในการควบคุมการใช้งานเนื้อหาที่มีลิขสิทธิ์สำหรับการฝึกฝน AI
- การอภิปรายในวงกว้างเกี่ยวกับจริยธรรมของการดึงข้อมูลขนาดใหญ่เพื่อใช้ในแอปพลิเคชัน AI เชิงพาณิชย์
ในขณะที่ AI ยังคงก้าวหน้าต่อไป อุตสาหกรรมเทคโนโลยีจะต้องรับมือกับความท้าทายที่ซับซ้อนทั้งด้านกฎหมายและจริยธรรมเหล่านี้ เพื่อให้มั่นใจว่าจะเกิดนวัตกรรมอย่างมีความรับผิดชอบ
ประธาน Nvidia Jensen Huang นำเสนอซูเปอร์ชิป Grace Hopper ขั้นสูง ซึ่งเป็นสัญลักษณ์ของนวัตกรรมเทคโนโลยีขั้นสูงที่อยู่ในใจกลางของการถกเถียงทางจริยธรรมในปัจจุบันเกี่ยวกับการพัฒนา AI |