Meilisearch กับการค้นหาแบบไฮบริดได้รับความนิยมในหมู่นักพัฒนา แต่ยังมีคำถามเรื่องประสิทธิภาพ

BigGo Editorial Team
Meilisearch กับการค้นหาแบบไฮบริดได้รับความนิยมในหมู่นักพัฒนา แต่ยังมีคำถามเรื่องประสิทธิภาพ

Meilisearch เป็นเครื่องมือค้นหาที่มีความเร็วสูงและออกแบบมาเพื่อผสานเข้ากับแอปพลิเคชันและเว็บไซต์ได้อย่างราบรื่น เมื่อเร็วๆ นี้ได้รับความสนใจจากความสามารถในการค้นหาแบบไฮบริด ในขณะที่ตลาดเครื่องมือค้นหายังคงพัฒนาด้วยคุณสมบัติที่ขับเคลื่อนด้วย AI นักพัฒนากำลังแบ่งปันประสบการณ์การใช้งาน Meilisearch ในสภาพแวดล้อมการผลิตและเปรียบเทียบกับตัวเลือกอื่นๆ เช่น Typesense, Elasticsearch และโซลูชั่นใหม่ๆ อย่าง Orama

ความพร้อมสำหรับการใช้งานจริงและประสิทธิภาพ

Meilisearch พร้อมสำหรับการใช้งานจริงตั้งแต่เวอร์ชัน 1.0 โดยมีนักพัฒนาหลายรายรายงานการใช้งานที่ประสบความสำเร็จในการจัดการเอกสารหลายล้านฉบับ ผู้ใช้รายหนึ่งกล่าวถึงการนำไปใช้กับคลังบทความ 7 ล้านรายการโดยได้ผลลัพธ์ที่ดี ในขณะที่อีกรายหนึ่งระบุว่าการตั้งค่าบนเซิร์ฟเวอร์ Hetzner ราคา 8 ดอลลาร์ต่อเดือนสามารถรองรับข้อมูลหนึ่งล้านรายการได้อย่างง่ายดาย อย่างไรก็ตาม ยังคงมีคำถามเกี่ยวกับตัวเลือกความพร้อมใช้งานสูง โดยผู้ใช้บางรายสังเกตว่าการรันหลายอินสแตนซ์ที่ซิงโครไนซ์กันดูเหมือนจะเป็นทางออกเดียวสำหรับความซ้ำซ้อน

การใช้หน่วยความจำของเครื่องมือค้นหานี้ได้จุดประกายการสนทนา โดยผู้ใช้บางรายสังเกตเห็นการใช้หน่วยความจำสูง (มากกว่า 3GB) แม้แต่สำหรับอินสแตนซ์ขนาดเล็ก สมาชิกทีม Meilisearch ได้อธิบายพฤติกรรมนี้:

ที่จริงแล้ว Meilisearch ใช้ RAM ที่มีอยู่โดยการออกแบบเนื่องจากใช้ LMDB (ซึ่งถูกแมปไว้ในหน่วยความจำ) เป็นพื้นฐานสำหรับการจัดเก็บคีย์-ค่า นี่เป็นฟีเจอร์ ไม่ใช่บั๊ก สิ่งที่ดีเกี่ยวกับเรื่องนี้คือระบบปฏิบัติการจะเป็นผู้เลือกว่าจะจัดสรรหน่วยความจำให้กับกระบวนการใด

การออกแบบนี้หมายความว่า Meilisearch ใช้หน่วยความจำระบบที่มีอยู่เพื่อประสิทธิภาพ แต่ขึ้นอยู่กับระบบปฏิบัติการในการจัดการการจัดสรรหน่วยความจำระหว่างกระบวนการต่างๆ

การใช้งานการค้นหาแบบไฮบริด

หัวข้อสำคัญของการสนทนาเกี่ยวกับวิธีการของ Meilisearch ในการค้นหาแบบไฮบริด ซึ่งรวมการค้นหาแบบข้อความเต็มรูปแบบแบบดั้งเดิมกับการค้นหาเชิงความหมาย (แบบเวกเตอร์) การใช้งานนี้แตกต่างจากคู่แข่งอย่าง Typesense ซึ่งใช้ Reciprocal Rank Fusion (RRF) เพื่อรวมผลลัพธ์

การสนทนาเผยให้เห็นความตึงเครียดระหว่างวิธีการต่างๆ ในการค้นหาแบบไฮบริด โดยผู้แสดงความคิดเห็นรายหนึ่ง (ซึ่งภายหลังถูกระบุว่าเป็นสมาชิกทีม Meilisearch) วิจารณ์วิธีการค้นหาแบบฟิวชันของ Typesense ว่า แทบจะไร้ประโยชน์เพราะคุณจะมีกลยุทธ์การค้นหาแบบใดแบบหนึ่งที่ให้ผลลัพธ์แย่มาก สิ่งนี้จุดประกายการตอบสนองจากตัวแทนของ Typesense ที่ปกป้องวิธีการของพวกเขาว่าได้รับการวิจัยอย่างดีและมีการบันทึกไว้ในงานวิชาการ

สำหรับนักพัฒนาที่กำลังพิจารณาการใช้งานการค้นหาแบบไฮบริด ผู้แสดงความคิดเห็นรายหนึ่งแนะนำว่า: สิ่งหนึ่งที่ควรศึกษาเสมอคือวิธีที่โซลูชันการค้นหาแบบไฮบริดของคุณกรองดัชนีการค้นหาแบบเวกเตอร์ สิ่งนี้ไม่ได้เป็นมาตรฐานเลย มักถูกมองข้าม แต่เมื่อคุณต้องการ 'X อันดับแรกที่คล้ายกับคำค้นหามากที่สุดโดยใช้การฝังตัว แต่ยังอยู่ในหมวดหมู่ Y/ตรงกับคำค้นหา Z' มันคือสิ่งหลักที่การค้นหาแบบไฮบริดของคุณกำลังทำ

คุณสมบัติหลักของ Meilisearch:

  • การค้นหาแบบไฮบริดที่ผสมผสานการค้นหาเชิงความหมายและการค้นหาแบบเต็มข้อความ
  • การค้นหาขณะที่พิมพ์ (ให้ผลลัพธ์ภายใน <50 มิลลิวินาที)
  • รองรับการพิมพ์ผิด
  • การกรองและการค้นหาแบบหลายหน้า
  • ความสามารถในการเรียงลำดับ
  • รองรับคำพ้องความหมาย
  • ฟังก์ชันการค้นหาตามพิกัดภูมิศาสตร์
  • รองรับหลายภาษา
  • การจัดการความปลอดภัยด้วย API keys
  • รองรับการใช้งานแบบ Multi-tenancy
  • RESTful API พร้อมปลั๊กอินและ SDK
  • พร้อมใช้งานกับ AI ด้วยการรวมกับ langchain

ความเร็วในการสร้างดัชนีและการอัปเดตเอกสาร

ผู้ใช้หลายรายเน้นถึงความท้าทายกับ Meilisearch เมื่อต้องจัดการกับเอกสารที่เปลี่ยนแปลงบ่อย ผู้ใช้รายหนึ่งระบุว่าเมื่อเอกสารเปลี่ยนแปลงบ่อยและผลการค้นหาต้องสะท้อนการเปลี่ยนแปลงเหล่านั้นอย่างรวดเร็ว มันจะจบลงด้วยงานที่รอดำเนินการเป็นเวลาหลายชั่วโมง อย่างไรก็ตาม สำหรับเนื้อหาที่คงที่หรือเปลี่ยนแปลงน้อย Meilisearch ได้รับคำชมเชยสำหรับประสิทธิภาพและความง่ายในการตั้งค่า

ทีม Meilisearch ชี้ให้เห็นถึงการปรับปรุงในรุ่นล่าสุด (v1.12) ซึ่งรวมถึงเวอร์ชันของตัวสร้างดัชนีใหม่ที่เร็วกว่ามาก ใช้ประโยชน์จากการประมวลผลแบบขนานอย่างมาก และลดการเขียนลงดิสก์ พวกเขายังเน้นย้ำถึงวิธีการแบบดิสก์เป็นหลัก ซึ่งเนื้อหาถูกเขียนลงดิสก์แทนที่จะเก็บไว้ในหน่วยความจำเป็นหลัก ทำให้สามารถรีบูตได้ทันทีและอัปเกรดได้ง่ายขึ้นโดยไม่ต้องสร้างดัชนีใหม่

ทางเลือกอื่นของ Meilisearch ที่ถูกกล่าวถึง:

  • Typesense - โดดเด่นด้วยตัวเลือกความพร้อมใช้งานสูง
  • Elasticsearch - โซลูชันแบบดั้งเดิมสำหรับองค์กร
  • Quickwit - พัฒนาบน Tantivy (ถูกซื้อโดย Datadog)
  • ParadeDB - การค้นหาแบบบูรณาการกับ Postgres
  • Orama - โซลูชันขนาดกะทัดรัด (น้อยกว่า 2KB) สำหรับเบราว์เซอร์/เซิร์ฟเวอร์/edge
  • Vespa - ถูกกล่าวถึงในด้านความสามารถการค้นหาแบบไฮบริด

โซลูชันทางเลือก

การสนทนาเผยให้เห็นทางเลือกหลายอย่างสำหรับ Meilisearch ที่นักพัฒนากำลังพิจารณา Typesense ถูกกล่าวถึงบ่อยครั้ง โดยเฉพาะสำหรับสถานการณ์ที่ต้องการความพร้อมใช้งานสูง คนอื่นๆ ชี้ไปที่โซลูชันที่ใช้ Tantivy เช่น Quickwit และ ParadeDB แม้ว่าจะมีความกังวลเกี่ยวกับอนาคตของ Quickwit หลังจากถูกซื้อโดย Datadog ผู้เข้าร่วมใหม่อย่าง Orama ได้รับการเน้นย้ำถึงขนาดที่กะทัดรัด (น้อยกว่า 2KB) และการสนับสนุนการค้นหาแบบข้อความเต็มรูปแบบ เวกเตอร์ และไฮบริดที่สามารถทำงานในเบราว์เซอร์ เซิร์ฟเวอร์ หรือเครือข่ายขอบ

สำหรับผู้ที่ต้องการรวมการค้นหาแบบข้อความเต็มรูปแบบกับการฝังตัวแบบเวกเตอร์ มีข้อเสนอแนะรวมถึง Elasticsearch, Vespa และ Typesense แม้ว่าความคิดเห็นจะแตกต่างกันในเรื่องคุณภาพการใช้งานและความง่ายในการใช้

ในขณะที่เทคโนโลยีการค้นหายังคงพัฒนาด้วยความสามารถของ AI วิธีการของ Meilisearch ในการรักษาความเข้ากันได้กับรุ่นก่อนหน้าในขณะที่ปรับปรุงประสิทธิภาพทำให้เป็นผู้แข่งขันในพื้นที่นี้ อย่างไรก็ตาม นักพัฒนาควรพิจารณาความต้องการเฉพาะของตนเกี่ยวกับความถี่ในการอัปเดตเอกสาร การใช้หน่วยความจำ และความพร้อมใช้งานสูงอย่างรอบคอบเมื่อเลือกโซลูชันการค้นหา

อ้างอิง: Meilisearch: AI-powered search in GA

อินเทอร์เฟซแอปพลิเคชันค้นหาภาพยนตร์ที่ทันสมัย แสดงให้เห็นถึงวิธีที่เทคโนโลยีการค้นหาต่างๆ เช่น Meilisearch ช่วยให้ผู้ใช้เข้าถึงเนื้อหาที่เกี่ยวข้องได้อย่างมีประสิทธิภาพ
อินเทอร์เฟซแอปพลิเคชันค้นหาภาพยนตร์ที่ทันสมัย แสดงให้เห็นถึงวิธีที่เทคโนโลยีการค้นหาต่างๆ เช่น Meilisearch ช่วยให้ผู้ใช้เข้าถึงเนื้อหาที่เกี่ยวข้องได้อย่างมีประสิทธิภาพ