Microsoft Lumos nyní umožňuje open-source monitorování metrik webových aplikací a rychlou detekci anomálií eliminací falešných pozitivů

Microsoft / Microsoft Lumos nyní umožňuje open-source monitorování metrik webových aplikací a rychlou detekci anomálií eliminací falešných pozitivů 3 minuty čtení

Microsoft



Microsoft otevřel přístup k „Lumos“, výkonné knihovně Pythonu pro automatickou detekci a diagnostiku metrických regresí v aplikacích „webového rozsahu“. Knihovna byla údajně velmi aktivní v Microsoft Teams a Skype. V zásadě je nyní vysoce výkonný a inteligentní „detektor anomálií“ otevřený a pro vývojáře webových stránek k dispozici k odhalení a řešení regresí v klíčových metrikách výkonu, přičemž téměř eliminuje většinu falešných poplachů.

Microsoft Lumos je nyní open source. Byl aktivně používán ve vybraných produktech společnosti Microsoft a nyní bude k dispozici pro obecnou komunitu pro vývoj webů a aplikací. Knihovna údajně umožnila technikům detekovat stovky změn v metrikách a odmítnout tisíce falešných poplachů vynořených detektory anomálií.



Společnost Lumos snižuje míru falešně pozitivních výstrah o více než 90 procent, tvrdí Microsoft:

Lumos je nová metodika, která zahrnuje stávající detektory anomálií specifické pro doménu. Společnost Microsoft však zajišťuje, že knihovna Pythonu může snížit míru falešně pozitivních výstrah o více než 90 procent. Jinými slovy, vývojáři nyní mohou s jistotou jít po přetrvávajících problémech namísto občasných problémů, které neměly dlouhodobý škodlivý účinek.



Zdraví online služeb je obvykle sledováno sledováním metrik Key Performance Indicator (KPI) v průběhu času. Inženýři provádějící „regresní analýzu“ vyžadují spoustu času a zdrojů k odstranění problémů, které mohou svědčit o hlavních problémech. Tyto problémy mohou vést ke zvýšení provozních nákladů a dokonce ke ztrátě uživatelů, pokud nebudou vyřešeny.



Není třeba dodávat, že sledování hlavní příčiny každé regrese KPI je časově náročné. Týmy navíc často tráví spoustu času analýzou problémů, aby zjistily, že jsou pouhou anomálií. To je místo, kde se Microsoft Lumos hodí. Knihovna Pythonu eliminuje proces zjišťování, zda je změna způsobena posunem populace nebo aktualizací produktu, a to poskytnutím seznamu prioritních nejdůležitějších proměnných při vysvětlování změn v metrické hodnotě.



Microsoft Lumos také slouží širšímu účelu pochopení rozdílu v metrice mezi libovolnými dvěma datovými sadami. Zajímavé je, že platforma zahrnuje „zkreslení“ a porovnáním souboru dat kontroly a léčby při zachování agnostiky se složkou časové řady může Lumos vyšetřit anomálie.

Jak Microsoft Lumos funguje?

Microsoft Lumos pracuje s principy A / B testování na porovnání párů datových sad. Knihovna Pythonu začíná ověřením, zda je regrese v metrice mezi soubory dat statisticky významná. Poté následuje kontrola předpětí populace a normalizace předpětí, aby se zohlednily případné změny populace mezi těmito dvěma datovými sadami. Lumos rozhodne, že problém nemá cenu sledovat, pokud v metrice není statisticky významná regrese. Pokud je však delta v metrice statisticky významná, Lumos funkce označí a zařadí je podle jejich příspěvku k deltě v cílové metrice.

Knihovna Lumos Python slouží jako primární nástroj pro monitorování scénářů stovek metrik. Vývojáři a týmy provádějící analýzu výkonu by mohli sledovat a pracovat na spolehlivosti volání, schůzek a služeb veřejné telefonní sítě (PSTN) ve společnosti Microsoft. Knihovna funguje na Azure Databricks, analytické službě velkých dat založené na Apache od společnosti Apache. Bylo nakonfigurováno pro spuštění s více úlohami, které jsou uspořádány podle typu priority, složitosti a metriky. Úlohy se dokončují asynchronně. To znamená, že pokud systém detekuje anomálii, spustí se pracovní postup Lumos a knihovna poté inteligentně analyzuje a zkontroluje, zda anomálie stojí za to ji sledovat a řešit.

Společnost Microsoft poznamenala, že není zaručeno, že společnost Lumos zachytí všechny regrese ve službách. Služba navíc bude vyžadovat velké množství datových sad, aby nabídla spolehlivé informace. Společnost plánuje zahrnout průběžnou analýzu metrik, provést lepší hodnocení funkcí a zavést také seskupování funkcí. Tyto kroky by měly řešit primární výzvu multicollinearity v hodnocení funkcí.

Značky Microsoft