จุดตัดระหว่างหลักการโอเพนซอร์สและการพัฒนา AI กำลังสร้างการถกเถียงที่สำคัญในชุมชนเทคโนโลยี โดยเฉพาะอย่างยิ่งเมื่อมีการออกกฎระเบียบและนโยบายใหม่ๆ พัฒนาการสำคัญคือกฎหมาย AI ของสหภาพยุโรป ซึ่งยกเว้นระบบ AI แบบโอเพนซอร์สจากข้อกำหนดด้านกฎระเบียบบางประการ ยกเว้นระบบ AI ที่มีความเสี่ยงสูง
ข้อกำหนดด้านโอเพนซอร์สในกฎหมาย AI ของ EU
กฎหมาย AI ของ EU รวมถึงข้อยกเว้นที่สำคัญสำหรับระบบ AI แบบโอเพนซอร์ส โดยระบุว่าบุคคลที่สามที่เผยแพร่เครื่องมือและส่วนประกอบ AI ต่อสาธารณะภายใต้ใบอนุญาตฟรีและโอเพนซอร์ส ไม่จำเป็นต้องปฏิบัติตามความรับผิดชอบในห่วงโซ่คุณค่า อย่างไรก็ตาม ข้อยกเว้นนี้ไม่ใช้กับระบบ AI ที่มีความเสี่ยงสูงหรือระบบที่อยู่ภายใต้มาตราเฉพาะ
ความท้าทายเรื่องข้อมูลฝึกฝน
ประเด็นสำคัญที่ก่อให้เกิดการถกเถียงในชุมชน AI แบบโอเพนซอร์สเกี่ยวข้องกับความโปร่งใสของข้อมูลฝึกฝน ในขณะที่หลักการซอฟต์แวร์โอเพนซอร์สแบบดั้งเดิมเน้นการเข้าถึงซอร์สโค้ดอย่างสมบูรณ์ แต่ภูมิทัศน์ของ AI นำเสนอความท้าทายที่เป็นเอกลักษณ์:
- การเข้าถึงข้อมูล : โมเดล AI ส่วนใหญ่ในปัจจุบันถูกฝึกฝนด้วยข้อมูลที่รวบรวมจากเว็บ ทำให้เป็นไปไม่ได้ในทางปฏิบัติที่จะเผยแพร่ชุดข้อมูลฝึกฝนทั้งหมดภายใต้ใบอนุญาตโอเพนซอร์ส
- ข้อกังวลด้านการทำซ้ำ : สมาชิกบางคนในชุมชนโต้แย้งว่าการให้สคริปต์สำหรับรวบรวมข้อมูลหรือรายการลิงก์นั้นไม่เพียงพอสำหรับสถานะโอเพนซอร์สที่แท้จริง เนื่องจากไม่สามารถรับประกันการมีอยู่ของข้อมูลในอนาคตได้
- แนวทางทางเลือก : โครงการอย่าง RNNoise ได้แสดงให้เห็นถึงการเปลี่ยนผ่านที่ประสบความสำเร็จจากข้อมูลฝึกฝนแบบกรรมสิทธิ์ไปสู่แบบเสรีผ่านความพยายามในการระดมทุนจากชุมชน
มาตรฐานและนโยบายที่กำลังเกิดขึ้น
องค์กรต่างๆ กำลังพัฒนาแนวทางของตนเองเพื่อจัดการกับความท้าทายเหล่านี้:
- นโยบายของ Debian : โครงการ Debian ได้กำหนดแนวทางเฉพาะสำหรับ AI แบบเสรี รวมถึงแนวคิด ToxicCandy Model เพื่อจัดการกับข้อกังวลเฉพาะด้าน AI
- ทิศทางใหม่ของ OSI : Open Source Initiative กำลังทำงานเกี่ยวกับคำนิยามใหม่ของ AI แบบโอเพนซอร์ส (OSAID) ที่มองการเข้าถึงข้อมูลฝึกฝนเป็นประโยชน์มากกว่าข้อกำหนด
- การพิจารณาของ Codeberg : แพลตฟอร์มนี้กำลังประเมินเงื่อนไขการใช้งานเกี่ยวกับการอนุมัติใบอนุญาตของ OSI ในแง่ของพัฒนาการเหล่านี้
มุมมองของชุมชน
ชุมชนเทคโนโลยียังคงมีความเห็นแตกต่างกันเกี่ยวกับสิ่งที่ถือเป็น AI แบบโอเพนซอร์สอย่างแท้จริง บางคนสนับสนุนความโปร่งใสของข้อมูลฝึกฝนอย่างสมบูรณ์ ในขณะที่คนอื่นๆ สนับสนุนแนวทางที่ยืดหยุ่นมากขึ้นซึ่งยอมรับข้อจำกัดในทางปฏิบัติในขณะที่ยังคงรักษาจิตวิญญาณของหลักการโอเพนซอร์ส
การถกเถียงที่ดำเนินอยู่นี้ชี้ให้เห็นถึงความจำเป็นในการมีมาตรฐานที่ชัดเจนซึ่งสร้างสมดุลระหว่างความเป็นไปได้ในทางปฏิบัติกับหลักการพื้นฐานของการพัฒนาซอฟต์แวร์โอเพนซอร์ส โดยเฉพาะอย่างยิ่งเมื่อเทคโนโลยี AI ยังคงพัฒนาและผสานเข้ากับด้านต่างๆ ของการพัฒนาซอฟต์แวร์มากขึ้น