Morphik ได้ปรากฏตัวขึ้นเป็นทางเลือกที่น่าสนใจสำหรับระบบ Retrieval-Augmented Generation (RAG) แบบดั้งเดิม โดยออกแบบมาเฉพาะสำหรับเอกสารทางเทคนิคและเอกสารที่มีองค์ประกอบภาพ แพลตฟอร์มนี้ได้สร้างการถกเถียงอย่างมากในชุมชนนักพัฒนา โดยเฉพาะอย่างยิ่งเกี่ยวกับลักษณะโอเพนซอร์สและความสามารถในการติดตั้งใช้งานเอง
การชี้แจงเรื่องฟีเจอร์โอเพนซอร์สและฟีเจอร์แบบเสียเงิน
รูปแบบการให้ลิขสิทธิ์ของ Morphik กลายเป็นประเด็นสำคัญในการสนทนาของชุมชน แม้จะทำการตลาดว่าเป็นโอเพนซอร์สภายใต้ลิขสิทธิ์ MIT Expat แต่ผู้ใช้ได้ชี้ให้เห็นถึงความแตกต่างบางประการในโครงสร้างการให้ลิขสิทธิ์ ฟังก์ชันการทำงานหลัก รวมถึง API, SDK และตรรกะแบ็กเอนด์ ได้รับลิขสิทธิ์ MIT จริง แต่ฟีเจอร์บางอย่างเช่น Morphik Console UI เป็นส่วนหนึ่งของเนมสเปซองค์กร (ee) ซึ่งมีเงื่อนไขการให้ลิขสิทธิ์ที่แตกต่างกัน
สมาชิกชุมชนคนหนึ่งได้สังเกตเห็นความแตกต่างนี้ ทำให้ตัวแทนของ Morphik ต้องชี้แจงว่า:
เราควรอธิบายให้ชัดเจนกว่านี้ ส่วนที่อยู่ใน ee คือ UI ของเรา ซึ่งสามารถใช้ทดสอบหรือในสภาพแวดล้อมการพัฒนาได้ โค้ดหลัก รวมถึง API, SDK และตรรกะแบ็กเอนด์ทั้งหมดเป็นลิขสิทธิ์ MIT expat
ความแตกต่างนี้มีความสำคัญสำหรับนักพัฒนาที่กำลังพิจารณานำไปใช้ เนื่องจากส่งผลต่อองค์ประกอบใดที่สามารถใช้และแก้ไขได้อย่างเสรี เทียบกับองค์ประกอบที่อาจต้องใช้ลิขสิทธิ์เชิงพาณิชย์
คุณสมบัติหลักของ Morphik
- การค้นหาแบบหลายรูปแบบ: ใช้เทคนิคเช่น ColPali เพื่อทำความเข้าใจเนื้อหาภาพในเอกสาร
- กราฟความรู้: สร้างกราฟความรู้เฉพาะโดเมนพร้อมคำสั่งระบบที่ปรับแต่งได้
- การดึงข้อมูลเมตาดาตา: ดึงข้อมูลเมตาดาตารวมถึงกรอบขอบเขต ป้ายกำกับ และการจัดหมวดหมู่
- การผสานรวม: ทำงานร่วมกับ Google Suite, Slack, Confluence และเครื่องมืออื่นๆ
- Cache-Augmented-Generation: สร้าง KV-caches ถาวรเพื่อเพิ่มความเร็วในการสร้าง
โครงสร้างการอนุญาตใช้งาน
- ใบอนุญาต MIT Expat: ฟังก์ชันการทำงานหลัก API, SDK, ตรรกะแบ็กเอนด์
- ใบอนุญาตสำหรับองค์กร: ส่วนประกอบ UI (Morphik Console) และคุณสมบัติในเนมสเปซ "ee"
ตัวเลือกการติดตั้ง
- บริการคลาวด์: ระดับฟรีพร้อม 200 หน้าและ 100 คำค้นหา จากนั้นจ่ายตามการใช้งาน
- การติดตั้งด้วยตนเอง: สามารถติดตั้งโดยตรงหรือผ่าน Docker มีการสนับสนุนแบบจำกัด
- การประมวลผลแบบโลคอล: เข้ากันได้กับ Ollama แนะนำให้ใช้โมเดล Llama 3.2 8B หรือใหญ่กว่า
ความสามารถในการติดตั้งใช้งานเองและข้อกำหนด
การสนทนาส่วนใหญ่ในชุมชนเน้นที่ตัวเลือกการติดตั้งใช้งานเอง นักพัฒนาหลายคนแสดงความสนใจในการรัน Morphik ในเครื่องแทนการใช้เวอร์ชันคลาวด์ โดยเฉพาะอย่างยิ่งสำหรับการจัดการเอกสารที่มีความอ่อนไหว แพลตฟอร์มนี้สามารถรันในเครื่องได้อย่างสมบูรณ์โดยใช้ Ollama สำหรับการอนุมาน แม้ว่าประสิทธิภาพจะขึ้นอยู่กับฮาร์ดแวร์และโมเดลที่ใช้
สำหรับผลลัพธ์ที่ดีที่สุดกับเอกสารทางเทคนิค ข้อเสนอแนะจากชุมชนแนะนำให้ใช้โมเดลขนาดใหญ่กว่าเช่น Llama 3.2 8B โดยมีความเห็นทั่วไปว่ายิ่งใหญ่ยิ่งดีสำหรับการประมวลผลเอกสารที่ซับซ้อน อย่างไรก็ตาม ความต้องการด้านการประมวลผลและข้อจำกัดในการปรับขนาดสำหรับการติดตั้ง Morphik เองยังคงเป็นคำถามสำหรับผู้ใช้ที่มีศักยภาพหลายคน
ผู้ใช้คนหนึ่งกล่าวโดยเฉพาะว่าต้องการวิธีที่จะนำเอกสารส่วนตัวทั้งหมดของฉันใส่ลงในฐานข้อมูลและใช้การค้นหา/RAG กับเอกสารเหล่านั้นในเครื่อง โดยเฉพาะอย่างยิ่งในรูปแบบที่ไม่ขึ้นกับแบ็กเอนด์ของ LLM ซึ่งเน้นย้ำความต้องการทั่วไปสำหรับโซลูชันในเครื่องที่รักษาความเป็นส่วนตัว
ความสามารถทางเทคนิคและกรณีการใช้งาน
สถาปัตยกรรมของ Morphik ได้รับความสนใจจากวิธีการประมวลผลเอกสาร แพลตฟอร์มนี้ปรับเอนทิตีและความสัมพันธ์ให้เป็นกราฟความรู้สำหรับ RAG ซึ่งสมาชิกชุมชนเห็นว่ามีแนวโน้มดี เส้นทางการนำเข้าข้อมูลสองรูปแบบ—OCR ปกติกับการฝังข้อความและ Colpali—ให้ความยืดหยุ่นสำหรับเอกสารประเภทต่างๆ
การจัดการตาราง ซึ่งเป็นจุดที่มักสร้างปัญหาในระบบประมวลผลเอกสาร ดูเหมือนจะได้รับการแก้ไขอย่างดีโดย Morphik ตามข้อเสนอแนะของนักพัฒนา เส้นทาง Colpali ทำงานได้ดีกว่ามากกับตารางเนื่องจากสามารถเข้ารหัสตำแหน่งและเค้าโครงได้ด้วย ทำให้เหมาะสำหรับรูปแบบเอกสารที่ซับซ้อน
ผู้ใช้ยังสำรวจกรณีการใช้งานเฉพาะทาง เช่น การประมวลผลสไลด์การนำเสนอในการประชุมเทียบกับบทความวิชาการ และการแยกกรอบขอบเขตจาก PDF ความสามารถในการปรับแต่งการแยกเอนทิตีและการทำแผนผังความสัมพันธ์สำหรับโดเมนเฉพาะ (เช่น เภสัชกรรม) ได้รับการเน้นย้ำว่าเป็นฟีเจอร์ที่มีคุณค่า
สำหรับประเภทเอกสารที่ง่ายกว่า สมาชิกชุมชนระบุว่าโซลูชัน RAG แบบดั้งเดิมที่สร้างบนฐานข้อมูลเวกเตอร์อาจเพียงพอ ซึ่งบ่งชี้ว่า Morphik ให้คุณค่ามากที่สุดสำหรับเอกสารที่ซับซ้อน หลากหลายรูปแบบ ที่มีตาราง รูปภาพ และเค้าโครงที่ซับซ้อน
ในขณะที่เทคโนโลยีการประมวลผลเอกสารและ RAG ยังคงพัฒนาอย่างต่อเนื่อง วิธีการของ Morphik ในการจัดการเนื้อหาที่เป็นภาพและเทคนิคถือเป็นการพัฒนาที่น่าสนใจในการทำให้เอกสารที่ซับซ้อนเข้าถึงได้มากขึ้นสำหรับระบบ AI ความสมดุลระหว่างการเข้าถึงแบบโอเพนซอร์สและฟีเจอร์เชิงพาณิชย์จะยังคงเป็นข้อพิจารณาสำคัญสำหรับผู้ที่อาจนำไปใช้ในการประเมินแพลตฟอร์มตามความต้องการเฉพาะของตน
อ้างอิง: morphik
![]() |
---|
ภาพหน้าจอของพื้นที่เก็บข้อมูล GitHub สำหรับ Morphik แสดงให้เห็นถึงความร่วมมือในการพัฒนาความสามารถทางเทคนิค |