ในปี 2011 โครงการอันทะเยอทะยานของ Google ในการแปลงหนังสือ 25 ล้านเล่มให้เป็นดิจิทัลและเปิดให้สาธารณชนเข้าถึงได้ ต้องประสบกับอุปสรรคทางกฎหมาย ทำให้คลังข้อมูลดิจิทัลขนาดใหญ่ถูกปิดกั้นจากการเข้าถึงของสาธารณชน อย่างไรก็ตาม ชุมชนเทคโนโลยีได้ค้นพบทางเลือกอื่นในการเก็บรักษาและเข้าถึงหนังสือดิจิทัล โดยมีหลายสถาบันก้าวเข้ามาเติมเต็มช่องว่างนี้
HathiTrust ก้าวขึ้นมาเป็นทางเลือกสำคัญ
HathiTrust ก่อตั้งขึ้นโดยห้องสมุดมหาวิทยาลัยที่เคยมีส่วนร่วมในโครงการแปลงหนังสือเป็นดิจิทัลในช่วงแรก ได้กลายเป็นคลังเก็บที่สำคัญสำหรับหนังสือจำนวนมากที่ Google เคยสแกนไว้ จากการพูดคุยในชุมชน HathiTrust มีข้อได้เปรียบหลายประการ:
- การเข้าถึงเนื้อหาที่เป็นสาธารณสมบัติได้ดีกว่าระบบแสดงผลแบบตัวอย่างของ Google Books
- สิทธิพิเศษในการเข้าถึงสำหรับนักศึกษาและนักวิจัยจากสถาบันที่เป็นสมาชิก
- การจัดการประเด็นลิขสิทธิ์อย่างรอบคอบพร้อมรักษาการเข้าถึงในวงกว้าง
- การผสานรวมกับทรัพยากรการคำนวณทางวิชาการเพื่อการวิจัย
ความพยายามในการเก็บรักษาข้อมูลดิจิทัลของ Library of Congress
อดีตเจ้าหน้าที่ของ Library of Congress ได้แบ่งปันมุมมองเกี่ยวกับความซับซ้อนของโครงการเก็บรักษาข้อมูลดิจิทัล โครงการ Digital Preservation ของพวกเขาที่เริ่มตั้งแต่ปี 2001-2003 เผยให้เห็นความท้าทายหลายประการ:
- การเก็บรักษาสื่อหลากหลายรูปแบบ ตั้งแต่ภาพยนตร์ชุดแรกของ Edison ไปจนถึงเทปบันทึกเสียงในวัน D-Day
- ประเด็นการจัดการสิทธิ์ที่ซับซ้อน
- ความท้าทายทางเทคนิคในการดูแลรักษาและจัดทำเอกสารเกี่ยวกับฮาร์ดแวร์ที่ใช้ในการแปลงเป็นดิจิทัล
- ความสำคัญของการเก็บรักษาไม่เพียงแค่เนื้อหา แต่รวมถึงวัสดุที่เกี่ยวข้อง เช่น ปกอัลบั้มและคำอธิบายประกอบ
ข้อถกเถียงเกี่ยวกับ Internet Archive
การหารือล่าสุดชี้ให้เห็นความตึงเครียดที่ดำเนินอยู่ระหว่างการเก็บรักษาข้อมูลดิจิทัลและกฎหมายลิขสิทธิ์ แนวทางการให้ยืมหนังสือดิจิทัลของ Internet Archive ในช่วงการระบาดได้จุดประเด็นถกเถียงครั้งใหญ่ โดยหลายฝ่ายเห็นว่าท่าทีที่แข็งกร้าวของพวกเขาอาจ:
- สร้างการถดถอยระยะยาวให้กับโครงการห้องสมุดดิจิทัล
- อาจส่งผลเสียต่อโครงการเก็บรักษาข้อมูลดิจิทัลในอนาคต
- นำไปสู่การท้าทายทางกฎหมายที่อาจส่งผลกระทบต่อความพยายามด้านห้องสมุดดิจิทัลอื่นๆ
วิสัยทัศน์ดั้งเดิมของ Larry Page
น่าสนใจที่โครงการแปลงหนังสือเป็นดิจิทัลของ Google มีรากฐานมาจากจุดกำเนิดของบริษัท โครงการนักศึกษาของ Larry Page ในปี 1996 ซึ่งต่อมากลายเป็น Google นั้น แต่เดิมถูกคิดขึ้นเพื่อสร้างห้องสมุดดิจิทัลสากล โครงการนี้มีเป้าหมายที่จะ:
- ทำแผนผังการอ้างอิงระหว่างหนังสือ
- วิเคราะห์ว่าหนังสือเล่มใดได้รับการอ้างอิงบ่อยที่สุด
- ปรับปรุงผลการค้นหาห้องสมุดโดยใช้ข้อมูลนี้
- อาจใช้เป็นข้อมูลฝึกฝนสำหรับโมเดลภาษาในยุคแรก
สถานะปัจจุบันและแนวโน้มในอนาคต
แม้ว่าวิสัยทัศน์ดั้งเดิมของ Google จะยังไม่เป็นจริง แต่มีหลายโครงการที่ยังคงดำเนินการเพื่อการเก็บรักษาและการเข้าถึงหนังสือดิจิทัล:
- การเติบโตของคอลเลกชันและโครงการวิจัยของ HathiTrust
- ความร่วมมือในการแปลงข้อมูลเป็นดิจิทัลของสถาบันการศึกษา
- การอภิปรายเกี่ยวกับการปฏิรูปลิขสิทธิ์ รวมถึงข้อเสนอเรื่องระยะเวลาที่สั้นลงและข้อกำหนด ใช้หรือสูญเสีย
- เทคโนโลยีใหม่อย่าง LLMs ที่สร้างความเป็นไปได้ใหม่ๆ ในการวิเคราะห์หนังสือดิจิทัล
ชุมชนยังคงถกเถียงเกี่ยวกับความสมดุลระหว่างการเก็บรักษา การเข้าถึง และการจัดการสิทธิ์ ในขณะที่มองหาวิธีป้องกันการสูญหายของมรดกทางวัฒนธรรมในรูปแบบดิจิทัล