ห้องสมุด Merlion ของ Salesforce สำหรับการวิเคราะห์อนุกรมเวลาได้จุดประกายการถกเถียงในหมู่นักวิทยาศาสตร์ข้อมูลและนักพัฒนา โดยหลายคนชี้ให้เห็นถึงช่องว่างสำคัญในการวิเคราะห์เปรียบเทียบกับโซลูชันคู่แข่ง ห้องสมุดการเรียนรู้ของเครื่องซึ่งรองรับงานต่างๆ เช่น การพยากรณ์ การตรวจจับความผิดปกติ และการตรวจจับจุดเปลี่ยนแปลง มีเป้าหมายที่จะเป็นโซลูชันที่ครอบคลุมสำหรับการวิเคราะห์อนุกรมเวลา แต่อาจมองข้ามคู่แข่งสำคัญหลายรายในการเปรียบเทียบเกณฑ์มาตรฐาน
![]() |
---|
Merlion: เฟรมเวิร์กการเรียนรู้ของเครื่องสำหรับความฉลาดในอนุกรมเวลาบน GitHub |
การวิเคราะห์ภูมิทัศน์การแข่งขันที่ไม่สมบูรณ์
ชุมชนได้ระบุการละเว้นที่น่าสังเกตหลายประการในส่วนการเปรียบเทียบกับห้องสมุดที่เกี่ยวข้องของ Merlion ผู้ใช้ระบุเฉพาะเจาะจงถึงการขาดหายไปของ aeon, sktime, tsai และ Orbit ของ Uber จากตารางเปรียบเทียบ ห้องสมุดเหล่านี้ก็มีเป้าหมายที่จะให้ความสามารถในการวิเคราะห์อนุกรมเวลาแบบองค์รวมคล้ายกับ Merlion ทำให้การละเว้นดังกล่าวเป็นที่น่าสังเกตเป็นพิเศษสำหรับผู้ปฏิบัติงานที่พยายามตัดสินใจอย่างมีข้อมูลว่าเครื่องมือใดเหมาะกับความต้องการของพวกเขามากที่สุด
ผมไม่เห็น
tsai
อยู่ในนั้นด้วย
นอกเหนือจากการละเว้นง่ายๆ ผู้ใช้ยังตั้งคำถามถึงคุณภาพของการเปรียบเทียบเอง โดยสังเกตว่าขาดรายละเอียดเกี่ยวกับโมเดลเฉพาะที่แต่ละห้องสมุดรองรับ—ซึ่งเป็นปัจจัยสำคัญเมื่อเลือกเครื่องมือการพยากรณ์ ผู้แสดงความคิดเห็นรายหนึ่งกล่าวถึงความสับสนเกี่ยวกับผลิตภัณฑ์ของ Nixtla ที่อ้างถึงในการเปรียบเทียบ โดยชี้ให้เห็นว่า TimeGPT (หนึ่งในผลิตภัณฑ์ของ Nixtla) รองรับตัวแปรภายนอก ซึ่งขัดแย้งกับสิ่งที่การเปรียบเทียบระบุไว้
ไลบรารีที่สำคัญที่หายไปจากตารางเปรียบเทียบของ Merlion
- aeon: ไลบรารีการเรียนรู้ของเครื่องสำหรับอนุกรมเวลา
- sktime: กรอบการทำงานแบบรวมสำหรับการเรียนรู้ของเครื่องกับอนุกรมเวลา
- tsai: ไลบรารีการเรียนรู้เชิงลึกสำหรับการวิเคราะห์อนุกรมเวลา
- Uber's Orbit: การสร้างแบบจำลองอนุกรมเวลาแบบเบย์เซียน
- AutoGluon's Time Series AutoML: การเรียนรู้ของเครื่องอัตโนมัติสำหรับอนุกรมเวลา
ข้อกังวลของชุมชนเกี่ยวกับตารางเปรียบเทียบของ Merlion
- ขาดการระบุรายการโมเดลที่เฉพาะเจาะจงสำหรับแต่ละไลบรารี
- ความสับสนเกี่ยวกับผลิตภัณฑ์ของ Nixtla ที่อ้างถึง
- ข้อมูลการรองรับคุณสมบัติที่ไม่ถูกต้อง (เช่น TimeGPT ที่รองรับตัวแปรภายนอก)
- ข้อมูลที่จำกัดเกี่ยวกับความสามารถในการผสานรวมกับเครื่องมือติดตาม
ความต้องการด้านการผสานรวมที่ผู้ใช้เน้นย้ำ
- การผสานรวมที่ดีขึ้นกับ Prometheus
- การผสานรวมที่ดีขึ้นกับ Graphite
- ความสนใจใน Grafana's Augurs ในฐานะทางออกที่เป็นไปได้
ความท้าทายในการบูรณาการกับเครื่องมือติดตาม
อีกประเด็นสำคัญในการอภิปรายคือความสามารถในการบูรณาการ ผู้ใช้แสดงความต้องการการบูรณาการที่ดีขึ้นระหว่างห้องสมุดการวิเคราะห์อนุกรมเวลาเช่น Merlion และเครื่องมือติดตามยอดนิยมเช่น Prometheus และ Graphite ทั้งสองแพลตฟอร์มการติดตามนี้มีความสามารถในการพยากรณ์พื้นฐาน แต่ผู้ใช้พบว่าตัวเลือกการกำหนดพารามิเตอร์มีจำกัด และกำลังมองหาโซลูชันที่ซับซ้อนมากขึ้นซึ่งสามารถเชื่อมต่อกับระบบติดตามที่ใช้กันอย่างแพร่หลายเหล่านี้ได้อย่างราบรื่น
ช่องว่างในการบูรณาการนี้แสดงถึงโอกาสในพื้นที่โอเพนซอร์สที่นักพัฒนาบางคนรู้สึกว่าถูกละเลยในปัจจุบัน ผู้แสดงความคิดเห็นรายหนึ่งกล่าวถึง Augurs ของ Grafana ว่าเป็นโซลูชันที่เป็นไปได้ในด้านนี้ ซึ่งแสดงให้เห็นว่าชุมชนกำลังมองหาเครื่องมือที่ดีกว่าเพื่อเชื่อมช่องว่างระหว่างการวิเคราะห์อนุกรมเวลาที่ซับซ้อนและการประยุกต์ใช้การติดตามในทางปฏิบัติ
การวางตำแหน่งท่ามกลางโมเดล AI ที่เกิดขึ้นใหม่
ชุมชนยังตั้งคำถามเกี่ยวกับวิธีที่ Merlion เปรียบเทียบกับโมเดลอนุกรมเวลาใหม่และเฉพาะทางมากขึ้น เช่น TimeFM ของ Google คำอธิบายที่เป็นประโยชน์จากผู้แสดงความคิดเห็นรายหนึ่งอธิบายว่า TimeFM เป็นโมเดลแบบ decoder-only ที่ผ่านการฝึกฝนมาแล้วเฉพาะสำหรับการพยากรณ์อนุกรมเวลา ในขณะที่ Merlion นำเสนอชุดของโมเดล—ทั้งแบบนิวรอลและแบบดั้งเดิม—สำหรับงานอนุกรมเวลาต่างๆ
ความแตกต่างนี้เน้นย้ำถึงภูมิทัศน์ที่กำลังเปลี่ยนแปลงอย่างรวดเร็วของเครื่องมือวิเคราะห์อนุกรมเวลา โดยบางเครื่องมือมุ่งเน้นไปที่โมเดลที่ผ่านการฝึกฝนมาแล้วเฉพาะทาง ในขณะที่เครื่องมืออื่นๆ เช่น Merlion ใช้แนวทางชุดเครื่องมือที่ครอบคลุมมากกว่า ผู้ใช้อีกรายกล่าวถึงโครงการ Moirai ของ Salesforce ในบริบทนี้ ซึ่งแนะนำว่าบริษัทกำลังพัฒนาผลิตภัณฑ์หลายรายการในพื้นที่อนุกรมเวลา
การอภิปรายเผยให้เห็นถึงระบบนิเวศที่มีชีวิตชีวาของเครื่องมือวิเคราะห์อนุกรมเวลาที่มีแนวทางและจุดแข็งที่แตกต่างกัน สำหรับนักวิทยาศาสตร์ข้อมูลและวิศวกรที่ทำงานกับข้อมูลอนุกรมเวลา การเลือกระหว่างโมเดลเฉพาะทางเช่น TimeFM ห้องสมุดที่ครอบคลุมเช่น Merlion หรือตัวเลือกที่ใช้งานง่ายเช่น Darts (ซึ่งผู้แสดงความคิดเห็นรายหนึ่งชื่นชมเป็นพิเศษสำหรับความเข้าถึงง่ายและทีมพัฒนาที่ตอบสนองรวดเร็ว) ยังคงซับซ้อนและขึ้นอยู่กับกรณีการใช้งานเฉพาะอย่างมาก
ในขณะที่การวิเคราะห์อนุกรมเวลายังคงพัฒนาต่อไป ชุมชนให้คุณค่ากับความโปร่งใสในการเปรียบเทียบ ความสามารถในการบูรณาการในทางปฏิบัติ และการแบ่งแยกที่ชัดเจนระหว่างเครื่องมือเฉพาะทางและเครื่องมือทั่วไปที่มีจำนวนเพิ่มขึ้นในพื้นที่นี้
อ้างอิง: Merlion: A Machine Learning Library for Time Series