आर्टिफिशियल इंटेलिजेंस एक जादुई ट्रिक जैसा लग सकता है जिसे देखकर हर कोई चुपचाप सोचता है... रुको, ये असल में काम करता है? खुशखबरी। हम इसे बिना किसी फिजूलखर्ची के समझाएँगे, व्यावहारिक रहेंगे, और कुछ अपूर्ण उपमाएँ भी देंगे जो इसे फिर भी कारगर बनाती हैं। अगर आपको सिर्फ़ सार जानना है, तो नीचे दिए गए एक मिनट के उत्तर पर जाएँ; लेकिन सच कहूँ तो, विवरण ही वह जगह है जहाँ से बल्ब जलता है 💡।
इसके बाद आप जो लेख पढ़ना चाहेंगे वे इस प्रकार हैं:
🔗 GPT का क्या अर्थ है?
जीपीटी संक्षिप्त नाम और उसके अर्थ की त्वरित व्याख्या।
🔗 AI को अपनी जानकारी कहाँ से मिलती है?
एआई सीखने, प्रशिक्षण देने और प्रश्नों के उत्तर देने के लिए स्रोतों का उपयोग करता है।
🔗 अपने व्यवसाय में AI को कैसे शामिल करें
एआई को प्रभावी ढंग से एकीकृत करने के लिए व्यावहारिक कदम, उपकरण और कार्यप्रवाह।
🔗 एआई कंपनी कैसे शुरू करें
विचार से लेकर लॉन्च तक: सत्यापन, वित्तपोषण, टीम और कार्यान्वयन।
AI कैसे काम करता है? एक मिनट में जवाब ⏱️
एआई डेटा से पैटर्न सीखकर भविष्यवाणियाँ करता है या सामग्री तैयार करता है—बिना किसी हस्तलिखित नियम की आवश्यकता के। सिस्टम उदाहरणों को ग्रहण करता है, लॉस फंक्शन के ज़रिए मापता है कि वह कितना गलत है, और अपने आंतरिक नॉब्स— पैरामीटर्स —को हर बार थोड़ा कम गलत करने के लिए प्रेरित करता है। धोएँ, दोहराएँ, सुधारें। पर्याप्त चक्रों के साथ, यह उपयोगी हो जाता है। चाहे आप ईमेल वर्गीकृत कर रहे हों, ट्यूमर पहचान रहे हों, बोर्ड गेम खेल रहे हों, या हाइकू लिख रहे हों, कहानी वही है। "मशीन लर्निंग" में सरल भाषा में जानकारी के लिए, आईबीएम का अवलोकन ठोस है [1]।
ज़्यादातर आधुनिक AI मशीन लर्निंग है। इसका सरल रूप: डेटा फीड करें, इनपुट से आउटपुट तक मैपिंग सीखें, फिर नई चीज़ों का सामान्यीकरण करें। जादू-मज़ाक नहीं - गणित, गणना, और, सच कहें तो, थोड़ी सी कला।
“AI कैसे काम करता है?” ✅
जब लोग गूगल पर सर्च करते हैं कि AI कैसे काम करता है?, तो वे आमतौर पर यह जानना चाहते हैं:
-
एक पुन: प्रयोज्य मानसिक मॉडल जिस पर वे भरोसा कर सकें
-
मुख्य शिक्षण प्रकारों का एक मानचित्र ताकि शब्दावली डरावनी न लगे
-
बिना भटके तंत्रिका नेटवर्क के अंदर झांकना
-
अब दुनिया को ट्रांसफॉर्मर क्यों चला रहे हैं?
-
डेटा से परिनियोजन तक व्यावहारिक पाइपलाइन
-
एक त्वरित तुलना तालिका जिसका आप स्क्रीनशॉट लेकर रख सकते हैं
-
नैतिकता, पूर्वाग्रह और विश्वसनीयता पर ऐसी सुरक्षा-रेखाएँ जो हाथ से लहराने वाली न हों
यहाँ आपको यही मिलेगा। अगर मैं भटकता हूँ, तो जानबूझकर - जैसे कोई खूबसूरत रास्ता चुनकर अगली बार किसी तरह गलियों को बेहतर ढंग से याद रख सकूँ। 🗺️
अधिकांश AI प्रणालियों के मुख्य तत्व 🧪
AI सिस्टम को एक रसोईघर की तरह समझें। इसमें चार तत्व बार-बार दिखाई देते हैं:
-
डेटा - लेबल के साथ या बिना लेबल के उदाहरण.
-
मॉडल - समायोज्य मापदंडों वाला एक गणितीय फ़ंक्शन।
-
उद्देश्य - एक हानि फलन जो यह मापता है कि अनुमान कितने बुरे हैं।
-
अनुकूलन - एक एल्गोरिथ्म जो हानि को कम करने के लिए मापदंडों को परिवर्तित करता है।
गहन शिक्षण में, वह धक्का आमतौर पर बैकप्रोपेगेशन के साथ ग्रेडिएंट डिसेंट होता - यह पता लगाने का एक कुशल तरीका है कि एक विशाल साउंडबोर्ड पर कौन सा नॉब चीख़ रहा है, फिर इसे थोड़ा नीचे कर दें [2]।
छोटा-सा मामला: हमने एक नाज़ुक नियम-आधारित स्पैम फ़िल्टर को एक छोटे से पर्यवेक्षित मॉडल से बदल दिया। लेबल → माप → अपडेट लूप के एक हफ़्ते बाद, झूठे सकारात्मक परिणाम कम हो गए और समर्थन टिकटों में कमी आई। कुछ खास नहीं - बस साफ़ उद्देश्य (“हैम” ईमेल पर सटीकता) और बेहतर अनुकूलन।
सीखने के प्रतिमान एक नज़र में 🎓
-
पर्यवेक्षित शिक्षण:
आप इनपुट-आउटपुट जोड़े (लेबल वाली तस्वीरें, स्पैम/स्पैम नहीं चिह्नित ईमेल) प्रदान करते हैं। मॉडल इनपुट → आउटपुट सीखता है। कई व्यावहारिक प्रणालियों की रीढ़ [1]। -
अप्रशिक्षित शिक्षण
। संरचना-समूह, संपीड़न, अव्यक्त कारक खोजें। अन्वेषण या पूर्व-प्रशिक्षण के लिए उत्तम। -
स्व-पर्यवेक्षित शिक्षण:
यह मॉडल अपने स्वयं के लेबल बनाता है (अगले शब्द, लुप्त छवि क्षेत्र की भविष्यवाणी करता है)। कच्चे डेटा को बड़े पैमाने पर प्रशिक्षण संकेत में परिवर्तित करता है; आधुनिक भाषा और दृष्टि मॉडल का आधार बनता है। -
सुदृढीकरण अधिगम (रीइन्फोर्समेंट लर्निंग):
एक एजेंट कार्य करता है, पुरस्कार , और एक ऐसी नीति सीखता है जो संचयी पुरस्कार को अधिकतम करती है। यदि "मूल्य कार्य", "नीतियाँ" और "कालिक-अंतर अधिगम" आपको याद दिलाते हैं, तो यह उनका घर है [5]।
हाँ, व्यवहार में श्रेणियाँ धुंधली हो जाती हैं। मिश्रित विधियाँ सामान्य हैं। वास्तविक जीवन अव्यवस्थित है; अच्छी इंजीनियरिंग इसे वहीं पर पूरा करती है जहाँ यह है।
बिना सिरदर्द के एक तंत्रिका नेटवर्क के अंदर 🧠
एक न्यूरल नेटवर्क छोटी गणितीय इकाइयों (न्यूरॉन्स) की परतों को एक साथ जोड़ता है। प्रत्येक परत भार, पूर्वाग्रहों और ReLU या GELU जैसी एक नरम अरैखिकता के साथ इनपुट को रूपांतरित करती है। प्रारंभिक परतें सरल विशेषताएँ सीखती हैं; गहरी परतें अमूर्तताओं को एनकोड करती हैं। "जादू" - अगर हम इसे जादू कह सकते हैं - संयोजन : छोटे-छोटे कार्यों को श्रृंखलाबद्ध करें और आप बेहद जटिल घटनाओं का मॉडल बना सकते हैं।
प्रशिक्षण लूप, केवल वाइब्स:
-
अनुमान → माप त्रुटि → बैकप्रॉप के माध्यम से विशेषता दोष → वजन को धक्का → दोहराएँ।
ऐसा अलग-अलग बैचों में करें और, एक अनाड़ी नर्तक की तरह, जो हर गाने में सुधार करता है, मॉडल आपके पैरों पर पैर रखना बंद कर देगा। एक दोस्ताना, कठोर बैकप्रॉप अध्याय के लिए, [2] देखें।
ट्रांसफॉर्मर्स का बोलबाला क्यों है और "ध्यान" का असल में क्या मतलब है 🧲
ट्रांसफ़ॉर्मर आत्म-ध्यान का करके यह तौलते हैं कि इनपुट के कौन से हिस्से एक-दूसरे के लिए महत्वपूर्ण हैं, एक साथ। पुराने मॉडलों की तरह वाक्य को बाएँ से दाएँ पढ़ने के बजाय, ट्रांसफ़ॉर्मर हर जगह देख सकता है और गतिशील रूप से संबंधों का आकलन कर सकता है—जैसे किसी भीड़ भरे कमरे को स्कैन करके यह देखना कि कौन किससे बात कर रहा है।
इस डिज़ाइन ने अनुक्रम मॉडलिंग के लिए पुनरावृत्ति और संवलन को हटा दिया, जिससे व्यापक समानांतरता और उत्कृष्ट स्केलिंग संभव हुई। जिस पेपर ने इसे शुरू किया - "अटेंशन इज़ ऑल यू नीड" - वह आर्किटेक्चर और परिणामों को प्रस्तुत करता है [3]।
एक पंक्ति में आत्म-ध्यान: क्वेरी , कुंजी और मान सदिश बनाएँ; ध्यान भार प्राप्त करने के लिए समानताओं की गणना करें; तदनुसार मानों को मिलाएँ। विवरण में नखरेबाज़, भावना में सुरुचिपूर्ण।
ध्यान दें: ट्रांसफ़ॉर्मर्स का प्रभुत्व है, एकाधिकार नहीं। CNN, RNN और ट्री एन्सेम्बल अभी भी कुछ डेटा प्रकारों और विलंबता/लागत बाधाओं पर जीतते हैं। काम के लिए आर्किटेक्चर चुनें, प्रचार के लिए नहीं।
AI कैसे काम करता है? वह व्यावहारिक पाइपलाइन जिसका आप वास्तव में उपयोग करेंगे 🛠️
-
समस्या का निर्धारण
आप क्या भविष्यवाणी कर रहे हैं या क्या उत्पन्न कर रहे हैं, और सफलता कैसे मापी जाएगी? -
डेटा
एकत्र करें, ज़रूरत पड़ने पर लेबल करें, साफ़ करें और विभाजित करें। अनुपलब्ध मानों और सीमांत मामलों की अपेक्षा करें। -
मॉडलिंग
सरलता से शुरू करें। बेसलाइन (लॉजिस्टिक रिग्रेशन, ग्रेडिएंट बूस्टिंग, या एक छोटा ट्रांसफॉर्मर) अक्सर वीर जटिलता को मात दे देते हैं। -
प्रशिक्षण:
एक उद्देश्य चुनें, एक अनुकूलक चुनें, हाइपरपैरामीटर सेट करें। पुनरावृति करें। -
मूल्यांकन:
अपने वास्तविक लक्ष्य (सटीकता, F1, AUROC, BLEU, पेरप्लेक्सिटी, विलंबता) से जुड़े होल्ड-आउट, क्रॉस-वैलिडेशन और मेट्रिक्स का उपयोग करें। -
परिनियोजन:
किसी API के पीछे सेवा प्रदान करें या किसी ऐप में एम्बेड करें। विलंबता, लागत, थ्रूपुट को ट्रैक करें। -
निगरानी और प्रशासन:
बहाव, निष्पक्षता, मज़बूती और सुरक्षा पर नज़र रखें। एनआईएसटी एआई जोखिम प्रबंधन ढाँचा (गवर्न, मैप, माप, प्रबंधन) विश्वसनीय प्रणालियों के लिए एक व्यावहारिक जाँच सूची है [4]।
छोटा-सा मामला: एक विज़न मॉडल ने प्रयोगशाला में तो अच्छा प्रदर्शन किया, लेकिन प्रकाश बदलने पर मैदान में असफल रहा। इनपुट हिस्टोग्राम में चिह्नित विचलन की निगरानी; एक त्वरित वृद्धि और फ़ाइन-ट्यून बम्प ने प्रदर्शन को बहाल कर दिया। उबाऊ? हाँ। प्रभावी? हाँ।
तुलना तालिका - दृष्टिकोण, वे किसके लिए हैं, अनुमानित लागत, वे क्यों काम करते हैं 📊
जानबूझकर अपूर्ण: थोड़ा असमान वाक्यांश इसे मानवीय महसूस कराने में मदद करता है।
| दृष्टिकोण | आदर्श दर्शक | कीमत के हिसाब से ठीक-ठाक | यह क्यों काम करता है / नोट्स |
|---|---|---|---|
| पर्यवेक्षित अध्ययन | विश्लेषक, उत्पाद टीमें | न्यून मध्यम | प्रत्यक्ष मैपिंग इनपुट→लेबल। लेबल मौजूद होने पर बहुत बढ़िया; कई परिनियोजित प्रणालियों की रीढ़ बनता है [1]। |
| के चलते किसी | डेटा एक्सप्लोरर, अनुसंधान एवं विकास | कम | क्लस्टर/संपीडन/अव्यक्त कारक ढूंढता है - खोज और पूर्व प्रशिक्षण के लिए अच्छा। |
| स्व-पर्यवेक्षित | प्लेटफ़ॉर्म टीमें | मध्यम | कंप्यूट और डेटा के साथ कच्चे डेटा-पैमाने से अपने स्वयं के लेबल बनाता है। |
| सुदृढीकरण सीखना | रोबोटिक्स, ऑपरेशन अनुसंधान | मध्यम ऊँचाई | इनाम संकेतों से नीतियां सीखें; कैनन के लिए सटन और बार्टो पढ़ें [5]. |
| ट्रान्सफ़ॉर्मर | एनएलपी, विजन, मल्टीमॉडल | मध्यम ऊँचाई | आत्म-ध्यान लंबी दूरी की डिप्स को पकड़ता है और अच्छी तरह से समानांतर करता है; मूल पेपर देखें [3]। |
| क्लासिक एमएल (पेड़) | सारणीबद्ध बिज़नेस ऐप्स | कम | संरचित डेटा पर सस्ता, तेज, अक्सर आश्चर्यजनक रूप से मजबूत आधार रेखाएं। |
| नियम-आधारित/प्रतीकात्मक | अनुपालन, नियतात्मक | बहुत कम | पारदर्शी तर्क; हाइब्रिड में उपयोगी जब आपको ऑडिटेबिलिटी की आवश्यकता होती है। |
| मूल्यांकन और जोखिम | सब लोग | भिन्न | इसे सुरक्षित और उपयोगी बनाए रखने के लिए NIST के GOVERN-MAP-MEASURE-MANAGE का उपयोग करें [4]. |
मूल्य-संबंधी = डेटा लेबलिंग + कंप्यूट + लोग + सेवा।
गहन विश्लेषण 1 - हानि फलन, प्रवणताएँ, और वे छोटे कदम जो सब कुछ बदल देते हैं 📉
कल्पना कीजिए कि आकार से घर की कीमत का अनुमान लगाने के लिए एक रेखा को फिट किया जा रहा है। आप पैरामीटर (w) और (b) चुनते हैं, (\hat{y} = wx + b) की भविष्यवाणी करते हैं, और माध्य वर्ग हानि के साथ त्रुटि को मापते हैं। ढाल आपको बताती है कि हानि को सबसे तेज़ी से कम करने के लिए किस दिशा में (w) और (b) बढ़ना है - जैसे ज़मीन की ढलान को महसूस करके कोहरे में नीचे की ओर चलना। प्रत्येक बैच के बाद अपडेट करें और आपकी रेखा वास्तविकता के और करीब पहुँच जाएगी।
डीप नेट में, यह वही गाना होता है जिसमें एक बड़ा बैंड होता है। बैकप्रॉप प्रत्येक परत के मापदंडों द्वारा अंतिम त्रुटि को कैसे प्रभावित किया जाता है, इसकी कुशलतापूर्वक गणना करता है - ताकि आप लाखों (या अरबों) नॉब्स को सही दिशा में घुमा सकें [2]।
प्रमुख अंतर्ज्ञान:
-
हानि परिदृश्य को आकार देती है।
-
ग्रेडिएंट्स आपके कम्पास हैं।
-
सीखने की दर एक कदम के आकार की है - बहुत बड़ा तो आप लड़खड़ा जाते हैं, बहुत छोटा तो आप सो जाते हैं।
-
नियमितीकरण आपको प्रशिक्षण सेट को तोते की तरह याद करने से रोकता है, जिसे याद तो बहुत अच्छा होता है, लेकिन समझ नहीं होती।
गहन विश्लेषण 2 - एम्बेडिंग, प्रॉम्प्टिंग और पुनर्प्राप्ति 🧭
एम्बेडिंग शब्दों, छवियों या वस्तुओं को वेक्टर स्पेस में मैप करता है जहाँ समान चीज़ें एक-दूसरे के पास आती हैं। इससे आप:
-
अर्थगत रूप से समान अंश खोजें
-
शक्ति खोज जो अर्थ समझती है
-
पुनर्प्राप्ति-संवर्धित पीढ़ी (RAG) को प्लग इन करें ताकि एक भाषा मॉडल लिखने से पहले तथ्यों को देख सके
प्रॉम्प्टिंग से आप जनरेटिव मॉडल्स को दिशा देते हैं—कार्य का वर्णन करें, उदाहरण दें, सीमाएँ निर्धारित करें। इसे ऐसे समझें जैसे आप एक बहुत तेज़ इंटर्न के लिए एक बहुत विस्तृत विवरण लिख रहे हों: उत्सुक, कभी-कभी अति-आत्मविश्वासी।
व्यावहारिक सुझाव: यदि आपका मॉडल मतिभ्रम करता है, तो पुनर्प्राप्ति जोड़ें, संकेत को कड़ा करें, या "वाइब्स" के बजाय ग्राउंडेड मेट्रिक्स के साथ मूल्यांकन करें।
गहन विश्लेषण 3 - भ्रम रहित मूल्यांकन 🧪
अच्छा मूल्यांकन उबाऊ लगता है - और यही बात सही भी है।
-
लॉक किए गए परीक्षण सेट का उपयोग करें.
-
ऐसा मीट्रिक चुनें जो उपयोगकर्ता की परेशानी को प्रतिबिंबित करता हो।
-
एब्लेशन करवाएं ताकि आपको पता चल सके कि वास्तव में किससे मदद मिली।
-
वास्तविक, गड़बड़ उदाहरणों के साथ विफलताओं को दर्ज करें।
उत्पादन में, निगरानी एक ऐसा मूल्यांकन है जो कभी नहीं रुकता। बदलाव होता रहता है। नई शब्दावली सामने आती है, सेंसरों का पुनर्निर्धारण होता है, और पुराने मॉडल में थोड़ी गिरावट आती है। एनआईएसटी ढाँचा मौजूदा जोखिम प्रबंधन और शासन के लिए एक व्यावहारिक संदर्भ है - न कि कोई नीतिगत दस्तावेज़ जिसे ठंडे बस्ते में डाल दिया जाए [4]।
नैतिकता, पूर्वाग्रह और विश्वसनीयता पर एक नोट ⚖️
एआई प्रणालियाँ अपने डेटा और परिनियोजन संदर्भ को प्रतिबिंबित करती हैं। इससे जोखिम उत्पन्न होते हैं: पूर्वाग्रह, समूहों में असमान त्रुटियाँ, वितरण परिवर्तन के तहत भंगुरता। नैतिक उपयोग वैकल्पिक नहीं है - यह टेबल स्टेक्स है। एनआईएसटी ठोस प्रथाओं की ओर इशारा करता है: जोखिमों और प्रभावों का दस्तावेजीकरण करें, हानिकारक पूर्वाग्रहों को मापें, कमियाँ बनाएँ, और जब जोखिम अधिक हों तो लोगों को सूचित रखें [4]।
ठोस कदम जो मददगार हैं:
-
विविध, प्रतिनिधि डेटा एकत्र करें
-
उप-जनसंख्या में प्रदर्शन को मापें
-
दस्तावेज़ मॉडल कार्ड और डेटा शीट
-
जहाँ जोखिम अधिक हो, वहाँ मानवीय निगरानी को शामिल करें
-
जब सिस्टम अनिश्चित हो तो फेल-सेफ डिज़ाइन करें
AI कैसे काम करता है? एक मानसिक मॉडल के रूप में आप इसका दोबारा इस्तेमाल कर सकते हैं 🧩
एक संक्षिप्त चेकलिस्ट जिसे आप लगभग किसी भी AI सिस्टम पर लागू कर सकते हैं:
-
उद्देश्य क्या है? भविष्यवाणी, रैंकिंग, उत्पादन, नियंत्रण?
-
सीखने का संकेत कहाँ से आता है? लेबल, स्व-पर्यवेक्षित कार्य, पुरस्कार?
-
किस आर्किटेक्चर का इस्तेमाल किया जाता है? रैखिक मॉडल, ट्री एन्सेम्बल, CNN, RNN, ट्रांसफ़ॉर्मर [3]?
-
इसे कैसे अनुकूलित किया जाता है? ग्रेडिएंट डिसेंट वेरिएशन/बैकप्रॉप [2]?
-
कैसा डेटा शासन? छोटा लेबल वाला सेट, बिना लेबल वाले पाठ का सागर, नकली वातावरण?
-
विफलता के तरीके और सुरक्षा उपाय क्या हैं? पूर्वाग्रह, बहाव, मतिभ्रम, विलंबता, NIST के GOVERN-MAP-MEASURE-MANAGE [4] के अनुसार लागत-मानचित्रित।
यदि आप इनका उत्तर दे सकते हैं, तो आप मूलतः प्रणाली को समझ सकते हैं - बाकी तो कार्यान्वयन विवरण और डोमेन ज्ञान है।
बुकमार्क करने लायक त्वरित स्रोत 🔖
-
मशीन लर्निंग अवधारणाओं का सरल भाषा में परिचय (आईबीएम) [1]
-
आरेख और सरल गणित के साथ बैकप्रोपेगेशन [2]
-
ट्रांसफॉर्मर पेपर जिसने अनुक्रम मॉडलिंग को बदल दिया [3]
-
एनआईएसटी का एआई जोखिम प्रबंधन ढांचा (व्यावहारिक शासन) [4]
-
कैनोनिकल सुदृढीकरण सीखने की पाठ्यपुस्तक (निःशुल्क) [5]
FAQ बिजली दौर ⚡
क्या एआई सिर्फ़ आँकड़े हैं?
इसमें आँकड़े, अनुकूलन, गणना, डेटा इंजीनियरिंग और उत्पाद डिज़ाइन शामिल हैं। आँकड़े कंकाल हैं; बाकी सब मांसपेशियाँ हैं।
क्या बड़े मॉडल हमेशा जीतते हैं?
स्केलिंग मदद करती है, लेकिन डेटा की गुणवत्ता, मूल्यांकन और परिनियोजन संबंधी बाधाएँ अक्सर ज़्यादा मायने रखती हैं। आपके लक्ष्य को प्राप्त करने वाला सबसे छोटा मॉडल आमतौर पर उपयोगकर्ताओं और वॉलेट के लिए सबसे अच्छा होता है।
क्या AI समझ सकता है?
समझ को परिभाषित करें । मॉडल डेटा में संरचना को पकड़ते हैं और प्रभावशाली ढंग से सामान्यीकरण करते हैं; लेकिन उनमें कुछ खामियाँ होती हैं और वे पूरी तरह से गलत भी हो सकते हैं। उन्हें शक्तिशाली औज़ारों की तरह समझें, ऋषियों की तरह नहीं।
क्या ट्रांसफॉर्मर युग हमेशा के लिए है?
शायद हमेशा के लिए नहीं। यह अब इसलिए प्रमुख है क्योंकि ध्यान समानांतर होता है और अच्छी तरह से स्केल करता है, जैसा कि मूल पेपर [3] में दिखाया गया था। लेकिन शोध आगे बढ़ता रहता है।
AI कैसे काम करता है? बहुत लंबा है, पढ़ा नहीं 🧵
-
एआई डेटा से पैटर्न सीखता है, नुकसान को कम करता है, और नए इनपुट के लिए सामान्यीकरण करता है [1,2]।
-
पर्यवेक्षित, अपर्यवेक्षित, स्व-पर्यवेक्षित और सुदृढीकरण सीखना मुख्य प्रशिक्षण सेटअप हैं; आरएल पुरस्कारों से सीखता है [5]।
-
तंत्रिका नेटवर्क लाखों मापदंडों को कुशलतापूर्वक समायोजित करने के लिए बैकप्रोपेगेशन और ग्रेडिएंट डिसेंट का उपयोग करते हैं [2]।
-
ट्रांसफॉर्मर कई अनुक्रम कार्यों पर हावी होते हैं क्योंकि आत्म-ध्यान पैमाने पर समानांतर संबंधों को पकड़ता है [3]।
-
वास्तविक दुनिया एआई एक पाइपलाइन है - समस्या के निर्धारण से लेकर तैनाती और शासन तक - और एनआईएसटी का ढांचा आपको जोखिम के बारे में ईमानदार रखता है [4]।
अगर कोई फिर से पूछे कि AI कैसे काम करता है?, तो आप मुस्कुरा सकते हैं, कॉफ़ी की चुस्की ले सकते हैं और कह सकते हैं: यह डेटा से सीखता है, नुकसान को ऑप्टिमाइज़ करता है, और समस्या के अनुसार ट्रांसफ़ॉर्मर या ट्री एन्सेम्बल जैसे आर्किटेक्चर का इस्तेमाल करता है। फिर एक आँख मारें, क्योंकि यह सरल भी है और चुपके से पूरा भी। 😉
संदर्भ
[1] आईबीएम - मशीन लर्निंग क्या है?
और पढ़ें
[2] माइकल नीलसन - बैकप्रोपेगेशन एल्गोरिथम कैसे काम करता है
और पढ़ें
[3] वासवानी एट अल. - ध्यान ही आपकी ज़रूरत है (arXiv)
और पढ़ें
[4] एनआईएसटी - आर्टिफिशियल इंटेलिजेंस रिस्क मैनेजमेंट फ्रेमवर्क (एआई आरएमएफ 1.0)
और पढ़ें
[5] सटन और बार्टो - सुदृढीकरण सीखना: एक परिचय (दूसरा संस्करण)
और पढ़ें