ห้องสมุดที่สูญหายของ Google: HathiTrust และองค์กรอื่นๆ ที่เข้ามาเติมเต็มช่องว่างของหนังสือดิจิทัล

BigGo Editorial Team
ห้องสมุดที่สูญหายของ Google: HathiTrust และองค์กรอื่นๆ ที่เข้ามาเติมเต็มช่องว่างของหนังสือดิจิทัล

ในปี 2011 โครงการอันทะเยอทะยานของ Google ในการแปลงหนังสือ 25 ล้านเล่มให้เป็นดิจิทัลและเปิดให้สาธารณชนเข้าถึงได้ ต้องประสบกับอุปสรรคทางกฎหมาย ทำให้คลังข้อมูลดิจิทัลขนาดใหญ่ถูกปิดกั้นจากการเข้าถึงของสาธารณชน อย่างไรก็ตาม ชุมชนเทคโนโลยีได้ค้นพบทางเลือกอื่นในการเก็บรักษาและเข้าถึงหนังสือดิจิทัล โดยมีหลายสถาบันก้าวเข้ามาเติมเต็มช่องว่างนี้

HathiTrust ก้าวขึ้นมาเป็นทางเลือกสำคัญ

HathiTrust ก่อตั้งขึ้นโดยห้องสมุดมหาวิทยาลัยที่เคยมีส่วนร่วมในโครงการแปลงหนังสือเป็นดิจิทัลในช่วงแรก ได้กลายเป็นคลังเก็บที่สำคัญสำหรับหนังสือจำนวนมากที่ Google เคยสแกนไว้ จากการพูดคุยในชุมชน HathiTrust มีข้อได้เปรียบหลายประการ:

  • การเข้าถึงเนื้อหาที่เป็นสาธารณสมบัติได้ดีกว่าระบบแสดงผลแบบตัวอย่างของ Google Books
  • สิทธิพิเศษในการเข้าถึงสำหรับนักศึกษาและนักวิจัยจากสถาบันที่เป็นสมาชิก
  • การจัดการประเด็นลิขสิทธิ์อย่างรอบคอบพร้อมรักษาการเข้าถึงในวงกว้าง
  • การผสานรวมกับทรัพยากรการคำนวณทางวิชาการเพื่อการวิจัย

ความพยายามในการเก็บรักษาข้อมูลดิจิทัลของ Library of Congress

อดีตเจ้าหน้าที่ของ Library of Congress ได้แบ่งปันมุมมองเกี่ยวกับความซับซ้อนของโครงการเก็บรักษาข้อมูลดิจิทัล โครงการ Digital Preservation ของพวกเขาที่เริ่มตั้งแต่ปี 2001-2003 เผยให้เห็นความท้าทายหลายประการ:

  • การเก็บรักษาสื่อหลากหลายรูปแบบ ตั้งแต่ภาพยนตร์ชุดแรกของ Edison ไปจนถึงเทปบันทึกเสียงในวัน D-Day
  • ประเด็นการจัดการสิทธิ์ที่ซับซ้อน
  • ความท้าทายทางเทคนิคในการดูแลรักษาและจัดทำเอกสารเกี่ยวกับฮาร์ดแวร์ที่ใช้ในการแปลงเป็นดิจิทัล
  • ความสำคัญของการเก็บรักษาไม่เพียงแค่เนื้อหา แต่รวมถึงวัสดุที่เกี่ยวข้อง เช่น ปกอัลบั้มและคำอธิบายประกอบ

ข้อถกเถียงเกี่ยวกับ Internet Archive

การหารือล่าสุดชี้ให้เห็นความตึงเครียดที่ดำเนินอยู่ระหว่างการเก็บรักษาข้อมูลดิจิทัลและกฎหมายลิขสิทธิ์ แนวทางการให้ยืมหนังสือดิจิทัลของ Internet Archive ในช่วงการระบาดได้จุดประเด็นถกเถียงครั้งใหญ่ โดยหลายฝ่ายเห็นว่าท่าทีที่แข็งกร้าวของพวกเขาอาจ:

  • สร้างการถดถอยระยะยาวให้กับโครงการห้องสมุดดิจิทัล
  • อาจส่งผลเสียต่อโครงการเก็บรักษาข้อมูลดิจิทัลในอนาคต
  • นำไปสู่การท้าทายทางกฎหมายที่อาจส่งผลกระทบต่อความพยายามด้านห้องสมุดดิจิทัลอื่นๆ

วิสัยทัศน์ดั้งเดิมของ Larry Page

น่าสนใจที่โครงการแปลงหนังสือเป็นดิจิทัลของ Google มีรากฐานมาจากจุดกำเนิดของบริษัท โครงการนักศึกษาของ Larry Page ในปี 1996 ซึ่งต่อมากลายเป็น Google นั้น แต่เดิมถูกคิดขึ้นเพื่อสร้างห้องสมุดดิจิทัลสากล โครงการนี้มีเป้าหมายที่จะ:

  • ทำแผนผังการอ้างอิงระหว่างหนังสือ
  • วิเคราะห์ว่าหนังสือเล่มใดได้รับการอ้างอิงบ่อยที่สุด
  • ปรับปรุงผลการค้นหาห้องสมุดโดยใช้ข้อมูลนี้
  • อาจใช้เป็นข้อมูลฝึกฝนสำหรับโมเดลภาษาในยุคแรก

สถานะปัจจุบันและแนวโน้มในอนาคต

แม้ว่าวิสัยทัศน์ดั้งเดิมของ Google จะยังไม่เป็นจริง แต่มีหลายโครงการที่ยังคงดำเนินการเพื่อการเก็บรักษาและการเข้าถึงหนังสือดิจิทัล:

  • การเติบโตของคอลเลกชันและโครงการวิจัยของ HathiTrust
  • ความร่วมมือในการแปลงข้อมูลเป็นดิจิทัลของสถาบันการศึกษา
  • การอภิปรายเกี่ยวกับการปฏิรูปลิขสิทธิ์ รวมถึงข้อเสนอเรื่องระยะเวลาที่สั้นลงและข้อกำหนด ใช้หรือสูญเสีย
  • เทคโนโลยีใหม่อย่าง LLMs ที่สร้างความเป็นไปได้ใหม่ๆ ในการวิเคราะห์หนังสือดิจิทัล

ชุมชนยังคงถกเถียงเกี่ยวกับความสมดุลระหว่างการเก็บรักษา การเข้าถึง และการจัดการสิทธิ์ ในขณะที่มองหาวิธีป้องกันการสูญหายของมรดกทางวัฒนธรรมในรูปแบบดิจิทัล