एआई विसंगतियों का पता कैसे लगाता है?

विसंगति का पता लगाना डेटा संचालन का एक शांत नायक है - यह उस धुएं के अलार्म की तरह है जो आग लगने से पहले ही चेतावनी देता है।

सरल शब्दों में: एआई सीखता है कि "सामान्य" कैसा दिखता है, नई घटनाओं को एक विसंगति स्कोर , और फिर एक सीमा । असली चुनौती तब आती है जब आपका डेटा मौसमी, अव्यवस्थित, परिवर्तनशील और कभी-कभी गलत जानकारी देने वाला होता है, और आप "सामान्य" को कैसे परिभाषित करते हैं। [1]

इस लेख के बाद आप ये लेख भी पढ़ सकते हैं:

🔗 समाज के लिए एआई क्यों हानिकारक हो सकता है?
यह लेख एआई को व्यापक रूप से अपनाने के नैतिक, आर्थिक और सामाजिक जोखिमों की पड़ताल करता है।

🔗 एआई सिस्टम वास्तव में कितना पानी इस्तेमाल करते हैं?
डेटा सेंटर कूलिंग, प्रशिक्षण संबंधी आवश्यकताओं और पर्यावरण पर पानी के प्रभाव के बारे में जानकारी देता है।

🔗 एआई डेटासेट क्या है और यह क्यों महत्वपूर्ण है?
यह डेटासेट, लेबलिंग, स्रोतों और मॉडल प्रदर्शन में उनकी भूमिका को परिभाषित करता है।

🔗 एआई जटिल डेटा से रुझानों की भविष्यवाणी कैसे करता है?
इसमें पैटर्न पहचान, मशीन लर्निंग मॉडल और वास्तविक दुनिया में पूर्वानुमान के उपयोग शामिल हैं।

“एआई विसंगतियों का पता कैसे लगाता है?”

एक अच्छे उत्तर में केवल एल्गोरिदम की सूची देना ही पर्याप्त नहीं होना चाहिए। इसमें उनकी कार्यप्रणाली और वास्तविक, अपूर्ण डेटा पर उन्हें लागू करने पर वे कैसे दिखते हैं, यह भी समझाया जाना चाहिए। सर्वोत्तम स्पष्टीकरण इस प्रकार हैं:

बुनियादी घटक दिखाएँ: विशेषताएँ , आधार रेखाएँ , स्कोर और सीमाएँ । [1]
व्यावहारिक परिवारों की तुलना करें: दूरी, घनत्व, एक-वर्ग, अलगाव, संभाव्य, पुनर्निर्माण। [1]
समय-श्रृंखला की विचित्रताओं को संभालें: "सामान्य" दिन के समय, सप्ताह के दिन, रिलीज़ और छुट्टियों पर निर्भर करता है। [1]
मूल्यांकन को एक वास्तविक बाधा की तरह मानें: झूठे अलार्म न केवल परेशान करने वाले होते हैं - वे विश्वास को जलाते हैं। [4]
व्याख्यात्मकता + मानव-इन-द-लूप को शामिल करें, क्योंकि "यह अजीब है" मूल कारण नहीं है। [5]

मुख्य कार्यप्रणाली: आधार रेखाएँ, स्कोर, सीमाएँ 🧠

अधिकांश विसंगति प्रणालियाँ - चाहे वे उन्नत हों या नहीं - अंततः तीन गतिशील भागों पर आधारित होती हैं:

1) प्रतिनिधित्व (उर्फ: मॉडल जो देखता है )

कच्चे संकेत शायद ही कभी पर्याप्त होते हैं। आप या तो सुविधाओं (रोलिंग आँकड़े, अनुपात, अंतराल, मौसमी डेल्टा) को इंजीनियर करते हैं या प्रतिनिधित्व (एम्बेडिंग, सबस्पेस, पुनर्निर्माण) सीखते हैं। [1]

2) स्कोरिंग (यानी: यह कितना "अजीब" है?)

स्कोरिंग के सामान्य तरीकों में शामिल हैं:

दूरी आधारित : पड़ोसियों से दूर = संदिग्ध। [1]
घनत्व-आधारित : कम स्थानीय घनत्व = संदिग्ध (एलओएफ इसका सर्वोत्कृष्ट उदाहरण है)। [1]
एक-वर्ग सीमाएँ : "सामान्य" सीखें, जो इसके बाहर आता है उसे चिह्नित करें। [1]
संभाव्यता : एक फिटेड मॉडल के तहत कम संभावना = संदिग्ध। [1]
पुनर्निर्माण त्रुटि : यदि सामान्य पर प्रशिक्षित मॉडल इसे पुनर्निर्माण नहीं कर सकता है, तो यह संभवतः गलत है। [1]

3) सीमा निर्धारण (उर्फ: कब घंटी बजानी है)

थ्रेशोल्ड निश्चित, क्वांटाइल-आधारित, प्रति-खंड या लागत-संवेदनशील हो सकते हैं - लेकिन उन्हें कैलिब्रेट किया , न कि वाइब्स के आधार पर। [4]

एक बहुत ही व्यावहारिक विवरण: scikit-learn के आउटलायर/नवीनता डिटेक्टर कच्चे स्कोर को और फिर स्कोर को इनलायर/आउटलायर निर्णयों में बदलने के लिए एक थ्रेशोल्ड (अक्सर संदूषण-शैली धारणा के माध्यम से नियंत्रित) लागू करते हैं। [2]

कुछ त्वरित परिभाषाएँ जो बाद में होने वाली परेशानी से बचाती हैं 🧯

दो ऐसे अंतर जो आपको सूक्ष्म गलतियों से बचाते हैं:

आउटलायर डिटेक्शन : आपके प्रशिक्षण डेटा में पहले से ही आउटलायर शामिल हो सकते हैं; एल्गोरिदम फिर भी "घने सामान्य क्षेत्र" को मॉडल करने का प्रयास करता है।
नवीनता का पता लगाना : प्रशिक्षण डेटा को स्वच्छ माना जाता है; आप यह तय कर रहे हैं कि नए अवलोकन सीखे गए सामान्य पैटर्न में फिट होते हैं या नहीं। [2]

इसके अलावा: नवीनता का पता लगाना अक्सर एक-श्रेणी वर्गीकरण - सामान्य को मॉडल करना क्योंकि असामान्य उदाहरण दुर्लभ या अपरिभाषित हैं। [1]

बिना निगरानी वाले ऐसे दमदार उपकरण जिनका आप वास्तव में उपयोग करेंगे 🧰

जब लेबल कम होते हैं (जो कि लगभग हमेशा ही होता है), तो वास्तविक प्रक्रियाओं में ये उपकरण दिखाई देते हैं:

आइसोलेशन फ़ॉरेस्ट : कई सारणीबद्ध मामलों में एक मजबूत डिफ़ॉल्ट, व्यवहार में व्यापक रूप से उपयोग किया जाता है और scikit-learn में लागू किया जाता है। [2]
वन-क्लास एसवीएम : प्रभावी हो सकता है लेकिन ट्यूनिंग और मान्यताओं के प्रति संवेदनशील है; scikit-learn स्पष्ट रूप से सावधानीपूर्वक हाइपरपैरामीटर ट्यूनिंग की आवश्यकता पर जोर देता है। [2]
स्थानीय आउटलायर फैक्टर (एलओएफ) : क्लासिक घनत्व-आधारित स्कोरिंग; बढ़िया जब "सामान्य" एक साफ-सुथरा धब्बा नहीं होता है। [1]

एक व्यावहारिक समस्या जिसे टीमें साप्ताहिक रूप से फिर से खोजती हैं: LOF अलग तरह से व्यवहार करता है, इस बात पर निर्भर करता है कि आप प्रशिक्षण सेट पर आउटलायर डिटेक्शन कर रहे हैं या नए डेटा पर नवीनता डिटेक्शन - scikit-learn को novelty=True की । [2]

एक मजबूत आधार रेखा जो डेटा के अस्थिर होने पर भी काम करती है 🪓

यदि आप इस सोच में हैं कि "हमें बस कुछ ऐसा चाहिए जो हमें बार-बार पेज करके भुला न दे", तो मजबूत आंकड़ों को कम करके आंका जाता है।

संशोधित z-स्कोर माध्यिका और MAD (माध्यिका निरपेक्ष विचलन) का उपयोग करता है 3.5 से ऊपर के निरपेक्ष मान पर आमतौर पर इस्तेमाल किए जाने वाले "संभावित आउटलायर" नियम को नोट करती है। [3]

यह हर विसंगति समस्या का समाधान नहीं करेगा - लेकिन यह अक्सर बचाव की एक मजबूत पहली पंक्ति होती है, खासकर शोर वाले मैट्रिक्स और प्रारंभिक चरण की निगरानी के लिए। [3]

समय श्रृंखला की वास्तविकता: "सामान्य" कब पर निर्भर करता है ⏱️📈

समय श्रृंखला विसंगतियाँ पेचीदा होती हैं क्योंकि संदर्भ ही सब कुछ होता है: दोपहर में अचानक वृद्धि अपेक्षित हो सकती है; वही वृद्धि सुबह 3 बजे किसी चीज़ के जलने का संकेत दे सकती है। इसलिए कई व्यावहारिक प्रणालियाँ समय-जागरूक विशेषताओं (अंतराल, मौसमी अंतर, रोलिंग विंडो) का उपयोग करके सामान्यता का मॉडल बनाती हैं और अपेक्षित पैटर्न के सापेक्ष विचलन को मापती हैं। [1]

अगर आपको सिर्फ एक नियम याद रहे: अपनी बेसलाइन (घंटे/दिन/क्षेत्र/सेवा स्तर) को विभाजित करें। [1]

मूल्यांकन: दुर्लभ घटना का जाल 🧪

विसंगति का पता लगाना अक्सर "भूसे के ढेर में सुई ढूंढने" जैसा होता है, जो मूल्यांकन को विचित्र बना देता है:

सकारात्मक परिणाम दुर्लभ होने पर ROC वक्र देखने में काफी सटीक लग सकते हैं।
असंतुलित स्थितियों के लिए परिशुद्धता-पुनः स्मरण दृष्टिकोण अक्सर अधिक जानकारीपूर्ण होते हैं क्योंकि वे सकारात्मक वर्ग पर प्रदर्शन पर ध्यान केंद्रित करते हैं। [4]
परिचालन की दृष्टि से, आपको एक अलर्ट बजट की : मनुष्य वास्तव में प्रति घंटे कितने अलर्ट को बिना क्रोध में छोड़े छांट सकते हैं? [4]

रोलिंग विंडो में बैकटेस्टिंग आपको क्लासिक विफलता मोड को पकड़ने में मदद करती है: "यह पिछले महीने के वितरण पर खूबसूरती से काम करता है..." [1]

व्याख्यात्मकता और मूल कारण: अपना काम दिखाएँ 🪄

बिना किसी स्पष्टीकरण के अलर्ट मिलना किसी रहस्यमयी पोस्टकार्ड मिलने जैसा है। कुछ हद तक उपयोगी, लेकिन निराशाजनक।

व्याख्यात्मक उपकरण यह इंगित करके मदद कर सकते हैं कि किन विशेषताओं ने विसंगति स्कोर में सबसे अधिक योगदान दिया, या "इसे सामान्य दिखने के लिए क्या बदलने की आवश्यकता होगी?" शैली के स्पष्टीकरण देकर। इंटरप्रिटेबल मशीन लर्निंग पुस्तक सामान्य विधियों (SHAP-शैली के एट्रिब्यूशन सहित) और उनकी सीमाओं के लिए एक ठोस, आलोचनात्मक मार्गदर्शिका है। [5]

इसका लक्ष्य केवल हितधारकों की संतुष्टि नहीं है - बल्कि तेजी से प्राथमिक उपचार करना और घटनाओं की पुनरावृत्ति को कम करना है।

तैनाती, विचलन और प्रतिक्रिया लूप 🚀

मॉडल स्लाइड में नहीं रहते। वे पाइपलाइन में रहते हैं।

उत्पादन के पहले महीने की एक आम कहानी: डिटेक्टर मुख्य रूप से डिप्लॉयमेंट, बैच जॉब और गुम डेटा को चिह्नित करता है... जो अभी भी उपयोगी क्योंकि यह आपको "डेटा गुणवत्ता संबंधी घटनाओं" को "व्यावसायिक विसंगतियों" से अलग करने के लिए मजबूर करता है।

व्यवहार में:

विचलन की निगरानी करें और पुनः प्रशिक्षण/पुनः अंशांकन करें। [1]
लॉग स्कोर इनपुट + मॉडल संस्करण ताकि आप यह पता लगा सकें कि कोई चीज़ पेज क्यों हुई। [5]
मानवीय प्रतिक्रिया (उपयोगी बनाम शोरगुल वाली चेतावनी) को कैप्चर करें। [4]

सुरक्षा पहलू: आईडीएस और व्यवहार विश्लेषण 🛡️

सुरक्षा टीमें अक्सर विसंगति संबंधी विचारों को नियम-आधारित पहचान के साथ जोड़ती हैं: "सामान्य होस्ट व्यवहार" के लिए आधार रेखाएँ, साथ ही ज्ञात खराब पैटर्न के लिए हस्ताक्षर और नीतियाँ। NIST का SP 800-94 (अंतिम) घुसपैठ का पता लगाने और रोकथाम प्रणाली संबंधी विचारों के लिए व्यापक रूप से उद्धृत ढांचा बना हुआ है; इसमें यह भी उल्लेख है कि 2012 का मसौदा "संशोधन 1" कभी अंतिम नहीं हुआ और बाद में इसे हटा दिया गया। [3]

अनुवाद: जहां मदद मिले वहां मशीन लर्निंग का उपयोग करें, लेकिन उबाऊ नियमों को न छोड़ें - वे उबाऊ इसलिए हैं क्योंकि वे काम करते हैं।

तुलनात्मक तालिका: लोकप्रिय विधियों का संक्षिप्त विवरण 📊

उपकरण / विधि	के लिए सर्वश्रेष्ठ	यह (व्यवहार में) कैसे काम करता है?
मजबूत / संशोधित जेड-स्कोर	सरल मापदंड, त्वरित आधारभूत मान	जब आपको "पर्याप्त अच्छा" और कम झूठे अलार्म की आवश्यकता हो तो मजबूत पहला प्रयास। [3]
अलगाव वन	सारणीबद्ध, मिश्रित विशेषताएँ	ठोस डिफ़ॉल्ट कार्यान्वयन और व्यवहार में व्यापक रूप से उपयोग किया जाता है। [2]
वन-क्लास एसवीएम	सघन “सामान्य” क्षेत्र	सीमा-आधारित नवीनता का पता लगाना; ट्यूनिंग बहुत मायने रखती है। [2]
स्थानीय आउटलायर कारक	कई गुना सामान्य	घनत्व अंतर बनाम पड़ोसी स्थानीय विचित्रता को पकड़ लेता है। [1]
पुनर्निर्माण त्रुटि (उदाहरण के लिए, ऑटोएनकोडर-शैली)	उच्च-आयामी पैटर्न	सामान्य पर प्रशिक्षण; बड़े पुनर्निर्माण त्रुटियां विचलन को इंगित कर सकती हैं। [1]

शॉर्टकट: मजबूत आधारभूत संरचनाओं और एक नीरस गैर-पर्यवेक्षित विधि से शुरुआत करें, फिर जटिलता को केवल वहीं जोड़ें जहां यह फायदेमंद हो।

एक संक्षिप्त मार्गदर्शिका: शून्य से लेकर अलर्ट तक 🧭

परिचालन की दृष्टि से "अजीब" को परिभाषित करें (विलंबता, धोखाधड़ी का जोखिम, सीपीयू थ्रैश, इन्वेंट्री का जोखिम)।
एक आधार रेखा (मजबूत आँकड़े या खंडित सीमाएँ) से शुरू करें। [3]
पहले चरण के रूप में एक अनसुपरवाइज्ड मॉडल चुनें
अलर्ट बजट के साथ सीमाएँ निर्धारित करें , और यदि सकारात्मक परिणाम दुर्लभ हैं तो जनसंपर्क शैली की सोच के साथ मूल्यांकन करें। [4]
स्पष्टीकरण और लॉगिंग जोड़ें ताकि प्रत्येक अलर्ट पुनरुत्पादित और डिबग करने योग्य हो। [5]
बैकटेस्ट, शिप, लर्न, रिकैलिब्रेट - ड्रिफ्ट सामान्य है। [1]

आप इसे एक हफ्ते में बिल्कुल कर सकते हैं... बशर्ते कि आपकी समयसीमाएं टेप और उम्मीद के सहारे न जुड़ी हों। 😅

अंतिम टिप्पणी - बहुत लंबा है, मैंने इसे पढ़ा नहीं🧾

एआई "सामान्य" की व्यावहारिक तस्वीर सीखकर, विचलन को स्कोर करके और सीमा पार करने वाली चीज़ों को चिह्नित करके विसंगतियों का पता लगाता है। सबसे अच्छे सिस्टम दिखावटी होने से नहीं, बल्कि कैलिब्रेटेड : खंडित बेसलाइन, अलर्ट बजट, व्याख्या योग्य आउटपुट और एक फीडबैक लूप जो शोरगुल वाले अलार्म को एक विश्वसनीय संकेत में बदल देता है। [1]

संदर्भ

पिमेंटेल एट अल. (2014) - नवीनता पहचान की समीक्षा (पीडीएफ, ऑक्सफोर्ड विश्वविद्यालय) और पढ़ें
scikit-learn प्रलेखन - नवीनता और आउटलायर पहचान के बारे में और पढ़ें
NIST/SEMATECH ई-हैंडबुक - आउटलायर्स का पता लगाना (अधिक पढ़ें) और NIST CSRC - SP 800-94 (अंतिम): घुसपैठ का पता लगाने और रोकथाम प्रणालियों (IDPS) के लिए मार्गदर्शिका ( अधिक पढ़ें
सैतो और रेहमस्मेयर (2015) - असंतुलित डेटासेट पर बाइनरी क्लासिफायर का मूल्यांकन करते समय प्रेसिजन-रिकॉल प्लॉट, ROC प्लॉट की तुलना में अधिक जानकारीपूर्ण होता है (PLOS ONE) और पढ़ें
मोलनार - व्याख्या योग्य मशीन लर्निंग (वेब बुक) और पढ़ें

आधिकारिक एआई असिस्टेंट स्टोर पर नवीनतम एआई खोजें

हमारे बारे में

ब्लॉग पर वापस जाएँ

देश/क्षेत्र