संक्षिप्त उत्तर: व्यवहार में कारगर एआई एजेंट बनाने के लिए, इसे एक नियंत्रित लूप की तरह मानें: इनपुट लें, अगली कार्रवाई तय करें, एक सीमित दायरे वाले टूल को कॉल करें, परिणाम देखें और तब तक दोहराएं जब तक कि स्पष्ट "पूर्ण" जांच पास न हो जाए। यह तब उपयोगी होता है जब कार्य कई चरणों वाला और टूल-आधारित हो; यदि एक ही प्रॉम्प्ट से समस्या हल हो जाती है, तो एजेंट को छोड़ दें। सख्त टूल स्कीमा, चरण सीमाएं, लॉगिंग और एक वैलिडेटर/क्रिटिक जोड़ें ताकि जब टूल विफल हो जाएं या इनपुट अस्पष्ट हों, तो एजेंट लूप में फंसे रहने के बजाय आगे की कार्रवाई करे।
चाबी छीनना:
कंट्रोलर लूप : स्पष्ट स्टॉप शर्तों और अधिकतम चरणों के साथ इनपुट→एक्ट→ऑब्ज़र्व पुनरावृत्ति को लागू करें।
टूल डिज़ाइन : "डू एनीथिंग" जैसी अव्यवस्था से बचने के लिए टूल्स को सीमित, टाइप किए गए, अनुमति प्राप्त और मान्य रखें।
स्मृति स्वच्छता : संक्षिप्त अल्पकालिक जानकारी और दीर्घकालिक पुनर्प्राप्ति का उपयोग करें; संपूर्ण प्रतिलेखों को एक साथ सहेजने से बचें।
दुरुपयोग प्रतिरोध : जोखिम भरी कार्रवाइयों के लिए अनुमति सूची, दर सीमा, निष्क्रियता और "ड्राई-रन" जोड़ें।
परीक्षणयोग्यता : परिदृश्यों का एक समूह (विफलताएं, अस्पष्टता, इंजेक्शन) बनाए रखें और प्रत्येक परिवर्तन पर इसे दोबारा चलाएं।

🔗 AI प्रदर्शन को कैसे मापें
गति, सटीकता और विश्वसनीयता का आकलन करने के लिए व्यावहारिक मापदंडों को जानें।.
🔗 AI से कैसे बात करें
बेहतर उत्तर पाने के लिए संकेतों, संदर्भ और अनुवर्ती प्रश्नों का उपयोग करें।.
🔗 एआई मॉडल का मूल्यांकन कैसे करें
परीक्षणों, मापदंड मानदंडों और वास्तविक दुनिया के कार्य परिणामों का उपयोग करके मॉडलों की तुलना करें।.
🔗 एआई मॉडल को कैसे अनुकूलित करें
ट्यूनिंग, प्रूनिंग और मॉनिटरिंग के माध्यम से गुणवत्ता और लागत में सुधार करें।.
1) एक एआई एजेंट आम आदमी की भाषा में क्या होता है? 🧠
एक एआई एजेंट एक लूप होता है। लैंगचेन "एजेंट्स" दस्तावेज़।
बस इतना ही। एक लूप जिसके बीच में एक दिमाग है।.
इनपुट → सोचें → कार्य करें → अवलोकन करें → दोहराएँ । प्रतिक्रिया पत्र (तर्क + कार्य)
कहाँ:
-
इनपुट उपयोगकर्ता का अनुरोध या कोई घटना (नया ईमेल, सपोर्ट टिकट, सेंसर पिंग) हो सकता है।
-
थिंक एक भाषा मॉडल है जो अगले कदम के बारे में तर्क करता है।
-
Act किसी टूल को कॉल कर रहा है (आंतरिक दस्तावेज़ खोजें, कोड चलाएँ, टिकट बनाएँ, उत्तर लिखें)। OpenAI फ़ंक्शन कॉलिंग गाइड
-
ऑब्ज़र्व टूल के आउटपुट को पढ़ रहा है।
-
दोहराव ही वह हिस्सा है जो इसे "चैटी" के बजाय "एजेंटिक" जैसा महसूस कराता है। लैंगचेन "एजेंट्स" दस्तावेज़
कुछ एजेंट मूल रूप से स्मार्ट मैक्रो की तरह होते हैं। वहीं कुछ जूनियर ऑपरेटर की तरह काम करते हैं जो कई कार्यों को संभाल सकते हैं और गलतियों से उबर सकते हैं। दोनों ही महत्वपूर्ण हैं।.
साथ ही, आपको पूर्ण स्वायत्तता की आवश्यकता नहीं है। वास्तव में... शायद आप इसे चाहते भी नहीं हैं 🙃
2) आपको एजेंट कब बनाना चाहिए (और कब नहीं) 🚦
एजेंट का निर्माण तब करें जब:
-
यह काम कई चरणों वाला और बीच में होने वाली घटनाओं के आधार पर इसमें बदलाव होता रहता है।
-
इस कार्य में उपकरणों का उपयोग (डेटाबेस, सीआरएम, कोड निष्पादन, फ़ाइल निर्माण, ब्राउज़र, आंतरिक एपीआई)। लैंगचेन "टूल्स" दस्तावेज़ देखें।
-
आपको दोहराए जाने योग्य परिणाम , न कि केवल एक बार के समाधान।
-
आप "पूर्ण" को इस तरह से परिभाषित कर सकते हैं जिसे कंप्यूटर जांच सके, भले ही वह परिभाषा थोड़ी ढीली हो।.
एजेंट का निर्माण तब न करें जब:
-
एक सरल प्रॉम्प्ट + रिस्पॉन्स से ही समस्या हल हो जाती है (ज्यादा जटिल न बनाएं, वरना बाद में आपको पछतावा होगा)।.
-
आपको पूर्ण नियतिवाद की आवश्यकता है (एजेंट कुछ हद तक सुसंगत हो सकते हैं, लेकिन रोबोटिक नहीं)।.
-
आपके पास जुड़ने के लिए कोई उपकरण या डेटा नहीं है - तब यह ज्यादातर सिर्फ भावनाओं पर आधारित होता है।.
साफ़-साफ़ कहें तो, आधे से ज़्यादा “एआई एजेंट प्रोजेक्ट” कुछ शाखाओं वाले नियमों के साथ एक वर्कफ़्लो हो सकते हैं। लेकिन कभी-कभी माहौल भी मायने रखता है 🤷♂️
3) एक अच्छे एआई एजेंट में क्या खूबियां होनी चाहिए ✅
यह रहा वह भाग जिसके बारे में आपने पूछा था, "किसी चीज़ का अच्छा संस्करण क्या होता है", लेकिन मैं थोड़ा स्पष्टवादी होने जा रहा हूँ:
एक अच्छे एआई एजेंट का मतलब वह नहीं
-
इसे पता है कि इसे क्या करने की अनुमति है (दायरे की सीमाएं)
-
टूल का विश्वसनीय उपयोग (संरचित कॉल, रिट्राई, टाइमआउट) ओपनएआई फ़ंक्शन कॉलिंग गाइड एडब्ल्यूएस "टाइमआउट, रिट्राई और बैकऑफ़ विद जिटर"
-
यह मेमोरी की स्थिति को साफ-सुथरा रखता है (ऐसी मेमोरी जो खराब नहीं होती) LangChain “मेमोरी अवलोकन”
-
यह अपनी कार्रवाइयों की व्याख्या करता है (ऑडिट ट्रेल, न कि गुप्त तर्क-वितर्क का खुलासा) NIST AI RMF 1.0 (विश्वसनीयता और पारदर्शिता)
-
उचित रूप से रुकता है (पूर्णता जांच, अधिकतम चरण, वृद्धि) लैंगचेन "एजेंट" दस्तावेज़
-
सुरक्षित रूप से विफल होता है (मदद मांगता है, सत्ता का भ्रम नहीं होता) NIST AI RMF 1.0
-
इसका परीक्षण किया जा सकता है (आप इसे पूर्वनिर्धारित परिदृश्यों पर चला सकते हैं और परिणामों का मूल्यांकन कर सकते हैं)।
अगर आपके एजेंट का परीक्षण नहीं किया जा सकता, तो यह मूलतः एक बेहद भरोसेमंद स्लॉट मशीन की तरह है। पार्टियों में तो मज़ा आता है, लेकिन प्रोडक्शन में बेहद डरावना 😬
4) किसी एजेंट के मूल निर्माण खंड (उसकी "संरचना" 🧩)
अधिकांश विश्वसनीय एजेंटों में ये घटक होते हैं:
ए) नियंत्रक लूप 🔁
यह ऑर्केस्ट्रेटर है:
-
लक्ष्य निर्धारित करें
-
अगले कदम के लिए मॉडल से पूछें
-
रन टूल
-
अवलोकन जोड़ें
-
LangChain “Agents” दस्तावेज़ पूरा होने तक दोहराएँ
बी) उपकरण (यानी क्षमताएं) 🧰
एजेंट को प्रभावी बनाने वाले कारक उपकरण ही हैं: लैंगचेन "टूल्स" दस्तावेज़
-
डेटाबेस क्वेरीज़
-
ईमेल भेजना
-
फ़ाइलें खींचना
-
कोड चल रहा है
-
आंतरिक API को कॉल करना
-
स्प्रेडशीट या सीआरएम में लिखना
सी) स्मृति 🗃️
दो प्रकार महत्वपूर्ण हैं:
-
अल्पकालिक स्मृति : वर्तमान रन संदर्भ, हाल के चरण, वर्तमान योजना
-
दीर्घकालिक स्मृति : उपयोगकर्ता प्राथमिकताएँ, परियोजना संदर्भ, पुनर्प्राप्त ज्ञान (अक्सर एम्बेडिंग + एक वेक्टर स्टोर के माध्यम से) RAG पेपर
डी) योजना एवं निर्णय नीति 🧭
भले ही आप इसे "योजना" न कहें, आपको एक विधि की आवश्यकता है:
-
जाँच सूची
-
ReAct शैली का “सोचो फिर उपकरण” ReAct पेपर
-
कार्य ग्राफ़
-
पर्यवेक्षक-कर्मचारी पैटर्न
-
पर्यवेक्षक-कार्यकर्ता पैटर्न माइक्रोसॉफ्ट ऑटोजेन (मल्टी-एजेंट फ्रेमवर्क)
ई) सुरक्षा उपाय और मूल्यांकन 🧯
-
अनुमति
-
सुरक्षित उपकरण स्कीमा ओपनएआई संरचित आउटपुट
-
आउटपुट सत्यापन
-
चरण सीमाएँ
-
काटना
-
NIST AI RMF 1.0 का परीक्षण करता है
हाँ, यह प्रेरणा देने से ज़्यादा इंजीनियरिंग पर आधारित है। और यही तो… असल बात है।.
5) तुलनात्मक तालिका: एजेंट बनाने के लोकप्रिय तरीके 🧾
नीचे एक वास्तविक "तुलना तालिका" दी गई है - कुछ विचित्रताओं के साथ, क्योंकि वास्तविक टीमें विचित्र ही होती हैं 😄
| उपकरण / ढांचा | श्रोता | कीमत | यह कैसे काम करता है | टिप्पणियाँ (थोड़ी सी गड़बड़ी) | |
|---|---|---|---|---|---|
| लैंगचेन | जो बिल्डर लेगो-शैली के घटकों को पसंद करते हैं | लगभग मुफ़्त + बुनियादी ढांचा | टूल्स, मेमोरी और चेन के लिए बड़ा इकोसिस्टम | अगर आप चीजों का नाम स्पष्ट रूप से नहीं रखते हैं तो चीजें बहुत जल्दी उलझ सकती हैं। | |
| लामाइंडेक्स | RAG-भारी टीमें | लगभग मुफ़्त + बुनियादी ढांचा | मजबूत पुनर्प्राप्ति पैटर्न, अनुक्रमण, कनेक्टर | यह तब बहुत अच्छा होता है जब आपका एजेंट मूल रूप से "खोज + कार्रवाई" करता है... जो कि आम बात है। | |
| ओपनएआई असिस्टेंट शैली का दृष्टिकोण | तेज़ सेटअप चाहने वाली टीमें | उपयोग आधारित | अंतर्निर्मित टूल कॉलिंग पैटर्न और रन स्थिति | कुछ मामलों में कम लचीला, लेकिन कई ऐप्स के लिए साफ-सुथरा। | OpenAI API चलाता है, OpenAI असिस्टेंट फ़ंक्शन कॉलिंग |
| सिमेंटिक कर्नेल | वे डेवलपर जो संरचित ऑर्केस्ट्रेशन चाहते हैं | नि: शुल्क-ish | कौशल/कार्यों के लिए सुव्यवस्थित अमूर्तता | "व्यापारिक रूप से सुव्यवस्थित" लगता है - कभी-कभी यह तारीफ होती है 😉 | |
| ऑटोजेन | बहु-एजेंट प्रयोगकर्ता | नि: शुल्क-ish | एजेंट-से-एजेंट सहयोग पैटर्न | ज्यादा बोलने की आदत हो सकती है; समाप्ति के सख्त नियम निर्धारित करें | |
| CrewAI | “एजेंटों की टीमें” के प्रशंसक | नि: शुल्क-ish | भूमिकाओं + कार्यों + हस्तांतरणों को आसानी से व्यक्त किया जा सकता है | यह तब सबसे अच्छा काम करता है जब कार्य स्पष्ट हों, अस्पष्ट न हों। | |
| सूखी घास का ढेर | खोजें + पाइपलाइन लोग | नि: शुल्क-ish | ठोस पाइपलाइन, पुनर्प्राप्ति, घटक | "एजेंट थिएटर" की बजाय "व्यावहारिक कारखाना" की अधिक आवश्यकता है। | |
| अपना खुद का लूप बनाएं (कस्टम लूप) | नियंत्रण के दीवाने (स्नेही) | आपका समय | न्यूनतम जादू, अधिकतम स्पष्टता | आमतौर पर यही सबसे अच्छा दीर्घकालिक उपाय होता है... जब तक कि आप सब कुछ नए सिरे से न बना लें 😅 |
कोई एक विजेता नहीं है। सबसे अच्छा विकल्प इस बात पर निर्भर करता है कि आपके एजेंट का मुख्य काम डेटा पुनर्प्राप्ति , टूल निष्पादन , बहु-एजेंट समन्वय या वर्कफ़्लो स्वचालन ।
6) एआई एजेंट को चरण-दर-चरण कैसे बनाएं (वास्तविक विधि) 🍳🤖
यह वह हिस्सा है जिसे ज्यादातर लोग छोड़ देते हैं, और फिर सोचते हैं कि एजेंट एक पेंट्री में रैकून की तरह व्यवहार क्यों करता है।.
चरण 1: नौकरी को एक वाक्य में परिभाषित करें 🎯
उदाहरण:
-
"नीति और टिकट के संदर्भ का उपयोग करते हुए ग्राहक को जवाब का मसौदा तैयार करें, फिर अनुमोदन के लिए अनुरोध करें।"
-
"बग रिपोर्ट की जांच करें, समस्या को दोबारा उत्पन्न करें और समाधान प्रस्तावित करें।"
-
"अधूरे मीटिंग नोट्स को कार्यों, उनके मालिकों और समयसीमाओं में बदलें।"
अगर आप इसे सरल शब्दों में परिभाषित नहीं कर सकते, तो आपका एजेंट भी नहीं कर सकता। मेरा मतलब है कि वह कर तो सकता है, लेकिन वह तात्कालिकता के आधार पर निर्णय लेगा, और तात्कालिकता ही वह स्थिति है जहाँ बजट बर्बाद हो जाता है।.
चरण 2: स्वायत्तता स्तर तय करें (कम, मध्यम, तीखा) 🌶️
-
कम स्वायत्तता : चरणों का सुझाव देता है, मानव "अनुमोदन" पर क्लिक करता है।
-
मध्यम स्तर : टूल चलाता है, आउटपुट का मसौदा तैयार करता है, अनिश्चितता होने पर मामले को आगे बढ़ाता है
-
हाई : शुरू से अंत तक निष्पादित होता है, केवल अपवादों की स्थिति में ही मनुष्यों को सूचित करता है।
जितनी धीमी गति से आप शुरू करना चाहते हैं, उससे कम से शुरू करें। आप बाद में इसे कभी भी बढ़ा सकते हैं।.
चरण 3: अपनी मॉडल रणनीति चुनें 🧠
आप आमतौर पर चुनते हैं:
-
हर चीज के लिए एक मजबूत मॉडल (सरल)
-
एक मजबूत मॉडल + कम लागत वाले चरणों (वर्गीकरण, रूटिंग) के लिए एक छोटा मॉडल
-
आवश्यकता पड़ने पर विशेषीकृत मॉडल (दृष्टि, कोड, वाक्) उपलब्ध कराए जाते हैं।
इसके अलावा यह भी तय करें:
-
अधिकतम टोकन
-
तापमान
-
क्या आप आंतरिक रूप से लंबे तर्क-प्रक्रियाओं के विवरण की अनुमति देते हैं (आप दे सकते हैं, लेकिन अंतिम उपयोगकर्ताओं के सामने विचारों की कच्ची श्रृंखला को उजागर न करें)
चरण 4: सख्त स्कीमा के साथ टूल परिभाषित करें 🔩
उपकरण इस प्रकार होने चाहिए:
-
सँकरा
-
आपके द्वारा लिखा गया
-
अनुमति प्राप्त
-
मान्य ओपनएआई संरचित आउटपुट
do_anything(input: string) नामक टूल के बजाय , यह करें:
-
search_kb(query: string) -> results[] -
create_ticket(title: string, body: string, priority: enum) -> ticket_id -
send_email(to: string, subject: string, body: string) -> statusOpenAI फ़ंक्शन कॉलिंग गाइड
अगर आप एजेंट को चेन सॉ देते हैं, तो आश्चर्यचकित न हों जब वह बाड़ को हटाते हुए झाड़ी की छंटाई कर दे।.
चरण 5: कंट्रोलर लूप बनाएं 🔁
न्यूनतम लूप:
-
लक्ष्य और प्रारंभिक संदर्भ से शुरू करें
-
मॉडल से पूछें: "अगला कदम क्या होगा?"
-
यदि टूल कॉल हो तो टूल को निष्पादित करें
-
अवलोकन संलग्न करें
-
जाँच रोकें
-
LangChain “Agents” दस्तावेज़ों को (अधिकतम चरणों के साथ) दोहराएँ
जोड़ना:
-
समय समाप्ति
-
पुनः प्रयास (सावधान रहें - पुनः प्रयास लूप में चल सकते हैं) AWS “टाइमआउट, पुनः प्रयास और जिटर के साथ बैकऑफ़”
-
टूल त्रुटि प्रारूपण (स्पष्ट, संरचित)
चरण 6: मेमोरी को सावधानीपूर्वक जोड़ें 🗃️
अल्पकालिक: प्रत्येक चरण में अपडेट किया गया एक संक्षिप्त "स्थिति सारांश" रखें। लैंगचेन "मेमोरी अवलोकन"
दीर्घकालिक: स्थायी तथ्य (उपयोगकर्ता प्राथमिकताएं, संगठन नियम, स्थिर दस्तावेज़) संग्रहीत करें।
अंगूठे का नियम:
-
अगर इसमें बार-बार बदलाव होता है तो इसे अल्पकालिक ही रखें।
-
यदि यह स्थिर है तो इसे लंबे समय तक सुरक्षित रखें।
-
यदि यह संवेदनशील है तो इसे कम से कम मात्रा में (या बिल्कुल भी नहीं) संग्रहित करें।
चरण 7: सत्यापन और एक "आलोचनात्मक" पास जोड़ें 🧪
एक सस्ता और व्यावहारिक पैटर्न:
-
एजेंट परिणाम उत्पन्न करता है
-
वैलिडेटर संरचना और बाधाओं की जाँच करता है
-
NIST AI RMF 1.0 में छूटे हुए चरणों या नीति उल्लंघनों के लिए वैकल्पिक आलोचक मॉडल समीक्षाएँ शामिल हैं।
यह एकदम सही नहीं है, लेकिन यह चौंकाने वाली हद तक बेतुकी बातों को पकड़ लेता है।.
चरण 8: उन सभी चीजों को नोट करें जिन्हें नोट न करने पर आपको बाद में पछतावा होगा 📜
लकड़ी का लट्ठा:
-
टूल कॉल + इनपुट + आउटपुट
-
लिए गए निर्णय
-
त्रुटियाँ
-
अंतिम आउटपुट
-
ओपन टेलीमेट्री अवलोकनशीलता प्राइमर में टोकन और विलंबता का परिचय दिया गया
भविष्य में आप खुद को धन्यवाद देंगे। वर्तमान में आप भूल जाएंगे। यही तो जीवन है 😵💫
7) ऐसा टूल कॉलिंग जो आपकी आत्मा को ठेस न पहुंचाए 🧰😵
टूल कॉलिंग ही वह जगह है जहां "एआई एजेंट कैसे बनाएं" असल में सॉफ्टवेयर इंजीनियरिंग बन जाती है।.
उपकरणों को भरोसेमंद बनाएं (भरोसेमंद होना अच्छी बात है)
विश्वसनीय उपकरण निम्नलिखित हैं:
-
नियतात्मक
-
दायरे में संकीर्ण
-
परीक्षण करना आसान है
-
स्ट्राइप के "आइडम्पोटेंट अनुरोधों" को दोबारा चलाना सुरक्षित है।
केवल प्रॉम्प्ट ही नहीं, बल्कि टूल लेयर पर भी सुरक्षा उपाय जोड़ें।
प्रॉम्प्ट विनम्र सुझाव होते हैं। टूल वैलिडेशन एक बंद दरवाजे की तरह है। ओपनएआई स्ट्रक्चर्ड आउटपुट्स
करना:
-
अनुमति सूची (कि कौन से उपकरण चल सकते हैं)
-
इनपुट सत्यापन
-
उपयोगकर्ता/संगठन के अनुसार अनुमति जाँच
-
जोखिम भरी कार्रवाइयों के लिए "ड्राई-रन मोड"
आंशिक विफलता के लिए डिज़ाइन
उपकरण विफल हो जाते हैं। नेटवर्क अस्थिर हो जाते हैं। प्रमाणीकरण समाप्त हो जाता है। एक एजेंट को ये करना होगा:
-
व्याख्या त्रुटियाँ
-
उपयुक्त होने पर बैकऑफ़ के साथ पुनः प्रयास करें। Google क्लाउड पुनः प्रयास रणनीति (बैकऑफ़ + जिटर)
-
वैकल्पिक उपकरण चुनें
-
अटक जाने पर स्थिति को और बिगाड़ना
एक प्रभावी और चुपचाप काम करने वाली तरकीब: संरचित त्रुटियाँ लौटाएँ जैसे:
-
प्रकार: प्रमाणीकरण त्रुटि -
प्रकार: नहीं मिला -
प्रकार: दर सीमित।
ताकि मॉडल घबराहट के बजाय बुद्धिमानी से प्रतिक्रिया दे सके।
8) ऐसी यादें जो आपको परेशान करने के बजाय आपकी मदद करें 👻🗂️
स्मृति शक्तिशाली होती है, लेकिन यह कबाड़ का डिब्बा भी बन सकती है।.
अल्पकालिक स्मृति: इसे संक्षिप्त रखें
उपयोग:
-
अंतिम N चरण
-
एक निरंतर सारांश (प्रत्येक लूप में अपडेट किया जाता है)
-
वर्तमान योजना
-
वर्तमान बाधाएं (बजट, समय, नीतियां)
यदि आप हर चीज को संदर्भ में रखकर देखें, तो आपको यह मिलेगा:
-
उच्च लागत
-
धीमी विलंबता
-
और भी ज्यादा भ्रम (हाँ, तब भी)
दीर्घकालिक स्मृति: याद करने की प्रक्रिया, न कि "भरने की प्रक्रिया"
अधिकांश "दीर्घकालिक स्मृति" कुछ इस प्रकार होती है:
-
एम्बेडिंग
-
वेक्टर स्टोर
-
पुनर्प्राप्ति संवर्धित पीढ़ी (आरएजी) आरएजी पेपर
एजेंट डेटा को याद नहीं रखता। यह रनटाइम पर सबसे प्रासंगिक अंशों को पुनः प्राप्त करता है। LlamaIndex “RAG का परिचय”
व्यावहारिक स्मृति नियम
-
“प्राथमिकताओं” को स्पष्ट तथ्यों के रूप में संग्रहीत करें: “उपयोगकर्ता को बुलेट सारांश पसंद हैं और इमोजी से नफरत है” (हाहा, हालांकि यहां नहीं 😄)
-
निर्णयों को समय-सीमा या संस्करणों के साथ संग्रहित करें (अन्यथा विरोधाभास जमा हो जाएंगे)
-
जब तक बेहद जरूरी न हो, कभी भी गुप्त बातें न छिपाएं।
और यहाँ मेरा एक अपूर्ण उदाहरण है: स्मृति एक फ्रिज की तरह है। अगर आप इसे कभी साफ नहीं करते, तो अंततः आपके सैंडविच का स्वाद प्याज और पछतावे जैसा हो जाता है।.
9) योजना बनाने के तरीके (सरल से लेकर आकर्षक तक) 🧭✨
योजना बनाना तो बस नियंत्रित विघटन है। इसे रहस्यमय मत बनाइए।.
पैटर्न ए: चेकलिस्ट प्लानर ✅
-
मॉडल चरणों की एक सूची आउटपुट करता है
-
चरण-दर-चरण निष्पादित करता है
-
चेकलिस्ट की स्थिति अपडेट करें
ऑनबोर्डिंग के लिए बेहतरीन। सरल, परीक्षण योग्य।.
पैटर्न बी: प्रतिक्रिया लूप (तर्क + क्रिया) 🧠→🧰
-
मॉडल अगले टूल कॉल का निर्णय लेता है
-
आउटपुट का अवलोकन करता है
-
रिएक्ट पेपर को दोहराता है
यह एक क्लासिक एजेंट वाली फीलिंग है।.
पैटर्न सी: पर्यवेक्षक-कर्मचारी 👥
-
पर्यवेक्षक लक्ष्य को कार्यों में विभाजित करता है
-
श्रमिक विशेष कार्यों को अंजाम देते हैं।
-
पर्यवेक्षक Microsoft AutoGen (मल्टी-एजेंट फ्रेमवर्क) के
यह तब उपयोगी होता है जब कार्यों को समानांतर रूप से किया जा सकता है, या जब आप अलग-अलग "भूमिकाएँ" चाहते हैं जैसे:
-
शोधकर्ता
-
सांकेतिक शब्दों में बदलनेवाला
-
संपादक
-
QA चेकर
पैटर्न डी: योजना बनाएं, फिर उसे क्रियान्वित करें और आवश्यकतानुसार पुनर्योजना बनाएं 🔄
-
योजना बनाएं
-
निष्पादित करना
-
यदि उपकरण के परिणाम वास्तविकता को बदल दें, तो पुनर्योजना बनाएं।
इससे एजेंट को किसी खराब योजना का हठपूर्वक पालन करने से रोका जा सकता है। मनुष्य भी ऐसा ही करते हैं, सिवाय तब जब वे थके हुए हों, उस स्थिति में वे भी खराब योजनाओं का पालन करते हैं।.
10) सुरक्षा, विश्वसनीयता और नौकरी से न निकाले जाने का डर 🔐😅
यदि आपका एजेंट कार्रवाई कर सकता है, तो आपको सुरक्षा डिज़ाइन की आवश्यकता है। यह "हो तो अच्छा है" वाली बात नहीं, बल्कि आवश्यकता है। NIST AI RMF 1.0
कठोर सीमाएँ
-
प्रति दौड़ अधिकतम चरण
-
प्रति मिनट अधिकतम टूल कॉल
-
प्रति सत्र अधिकतम खर्च (टोकन बजट)
-
अनुमोदन के पीछे प्रतिबंधित उपकरण
डेटा संधारण
-
लॉग करने से पहले संवेदनशील इनपुट को संपादित करें
-
अलग-अलग वातावरण (डेवलपमेंट बनाम प्रोडक्शन)
-
न्यूनतम विशेषाधिकार उपकरण अनुमतियाँ
व्यवहार संबंधी बाधाएँ
-
एजेंट को आंतरिक साक्ष्य के अंश उद्धृत करने के लिए बाध्य करें (बाहरी लिंक नहीं, केवल आंतरिक संदर्भ)।
-
जब विश्वास कम हो तो अनिश्चितता के संकेत आवश्यक हैं
-
यदि इनपुट अस्पष्ट हों तो "स्पष्टीकरण प्रश्न पूछें" आवश्यक है।
एक भरोसेमंद एजेंट वह नहीं होता जो सबसे अधिक आत्मविश्वासी हो। भरोसेमंद एजेंट वह होता है जो जानता है कि वह कब अनुमान लगा रहा है... और यह बात वह स्पष्ट रूप से कह देता है।.
11) परीक्षण और मूल्यांकन (वह हिस्सा जिससे हर कोई बचता है) 🧪📏
आप जिस चीज को माप नहीं सकते, उसे सुधार भी नहीं सकते। हाँ, यह बात थोड़ी घिसी-पिटी है, लेकिन सच में बहुत सटीक है।.
परिदृश्यों का एक सेट बनाएं
30-100 टेस्ट केस बनाएं:
-
खुशहाल रास्ते
-
सीमांत मामले
-
“उपकरण विफल” मामले
-
अस्पष्ट अनुरोध
-
विरोधी संकेत (प्रॉम्प्ट इंजेक्शन प्रयास) OWASP LLM ऐप्स के लिए शीर्ष 10 OWASP LLM01 प्रॉम्प्ट इंजेक्शन
स्कोर परिणाम
निम्नलिखित जैसे मापदंडों का उपयोग करें:
-
कार्य सफलता दर
-
पूरा होने में लगने वाला समय
-
उपकरण त्रुटि पुनर्प्राप्ति दर
-
मतिभ्रम की दर (बिना सबूत के दावे)
-
मानव स्वीकृति दर (यदि पर्यवेक्षित मोड में हो)
प्रॉम्प्ट और टूल्स के लिए रिग्रेशन परीक्षण
जब भी आप बदलाव करें:
-
टूल स्कीमा
-
सिस्टम निर्देश
-
पुनर्प्राप्ति तर्क
-
मेमोरी फॉर्मेट।
सूट को दोबारा चलाएं।
एजेंट्स बहुत ही नाजुक होते हैं। घर में रखे जाने वाले पौधों की तरह, लेकिन उनसे कहीं ज्यादा महंगे।.
12) ऐसे तैनाती पैटर्न जो आपके बजट को बर्बाद न करें 💸🔥
एक ही सेवा से शुरुआत करें
-
एजेंट नियंत्रक एपीआई
-
इसके पीछे टूल सेवाएं हैं
-
लॉगिंग + मॉनिटरिंग ओपन टेलीमेट्री ऑब्जर्वेबिलिटी प्राइमर
लागत नियंत्रण उपायों को शुरुआत में ही लागू करें।
-
कैशिंग पुनर्प्राप्ति परिणाम
-
सारांशों के साथ वार्तालाप की स्थिति को संपीड़ित करना
-
रूटिंग और निष्कर्षण के लिए छोटे मॉडल का उपयोग करना
-
सबसे कठिन चरणों तक ही "गहन चिंतन मोड" को सीमित करना
सामान्य वास्तुकला विकल्प
-
स्टेटलेस कंट्रोलर + बाहरी स्टेट स्टोर (DB/redis)
-
जहां संभव हो, टूल कॉल आइडम्पोटेंट होते हैं (स्ट्राइप में "आइडम्पोटेंट अनुरोध")
-
लंबे कार्यों के लिए कतार बनाएं (ताकि आप किसी वेब अनुरोध को हमेशा के लिए खुला न रखें)
और हां: एक “किल स्विच” भी बना लें। आपको इसकी ज़रूरत तब तक नहीं पड़ेगी जब तक कि आपको इसकी सचमुच बहुत ज़्यादा ज़रूरत न हो जाए 😬
13) समापन टिप्पणी - एआई एजेंट बनाने का संक्षिप्त तरीका 🎁🤖
अगर आपको और कुछ याद न रहे, तो बस यह याद रखें:
-
AI एजेंट कैसे बनाएं, यह मुख्य रूप से एक मॉडल के चारों ओर एक सुरक्षित लूप बनाने के बारे में है। लैंगचेन "एजेंट्स" दस्तावेज़।
-
स्पष्ट लक्ष्य, सीमित स्वायत्तता और सख्त उपकरणों के साथ शुरुआत करें। ओपनएआई संरचित आउटपुट
-
पुनर्प्राप्ति के माध्यम से स्मृति बढ़ाएँ, न कि अंतहीन संदर्भ भरने के माध्यम से। RAG पेपर
-
योजना बनाना सरल हो सकता है - चेकलिस्ट और पुनर्योजना बनाने से बहुत मदद मिलती है।.
-
लॉगिंग और परीक्षण एजेंट की अव्यवस्था को ऐसी चीज़ में बदल देते हैं जिसे आप उपयोग में ला सकते हैं। ओपन टेलीमेट्री ऑब्जर्वेबिलिटी का प्रारंभिक परिचय।
-
सुरक्षा नियम कोड में होने चाहिए, न कि केवल प्रॉम्प्ट में। OWASP टॉप 10 फॉर एलएलएम ऐप्स
एजेंट कोई जादू नहीं है। यह एक ऐसी प्रणाली है जो अक्सर अच्छे निर्णय लेती है, जिससे उसका महत्व समझ में आता है... और नुकसान होने से पहले ही हार मान लेती है। एक तरह से यह चुपचाप सुकून देने वाला है 😌
और हाँ, अगर आप इसे सही तरीके से बनाते हैं, तो ऐसा लगता है जैसे आपने एक छोटे से डिजिटल इंटर्न को काम पर रखा हो जो कभी सोता नहीं, कभी-कभी घबरा जाता है और कागजी काम करना पसंद करता है। तो, मूल रूप से, एक इंटर्न ही है।.
अक्सर पूछे जाने वाले प्रश्न
सरल शब्दों में कहें तो एआई एजेंट क्या है?
एक एआई एजेंट मूल रूप से एक ऐसा चक्र है जो बार-बार दोहराता है: इनपुट लेना, अगला कदम तय करना, किसी टूल का उपयोग करना, परिणाम पढ़ना और प्रक्रिया पूरी होने तक दोहराते रहना। "एजेंटिक" शब्द केवल बातचीत करने से नहीं, बल्कि कार्य करने और अवलोकन करने से आता है। कई एजेंट केवल टूल तक पहुंच रखने वाले स्मार्ट ऑटोमेशन होते हैं, जबकि अन्य एक जूनियर ऑपरेटर की तरह व्यवहार करते हैं जो त्रुटियों से उबर सकते हैं।.
मुझे प्रॉम्प्ट का उपयोग करने के बजाय एआई एजेंट कब बनाना चाहिए?
जब काम कई चरणों वाला हो, बीच के परिणामों के आधार पर बदलता रहता हो, और विश्वसनीय टूल (एपीआई, डेटाबेस, टिकटिंग, कोड निष्पादन) के उपयोग की आवश्यकता हो, तो एजेंट बनाएं। एजेंट तब भी उपयोगी होते हैं जब आप सुरक्षा उपायों के साथ दोहराए जाने योग्य परिणाम चाहते हैं और "पूर्ण" की जांच करने का तरीका चाहते हैं। यदि एक सरल त्वरित प्रतिक्रिया काम करती है, तो एजेंट आमतौर पर अनावश्यक बोझ और अतिरिक्त विफलता का कारण होता है।.
मैं एक ऐसा एआई एजेंट कैसे बनाऊं जो लूप में न फंसे?
कठोर रोक शर्तें लागू करें: अधिकतम चरण, अधिकतम टूल कॉल और स्पष्ट पूर्णता जांच। संरचित टूल स्कीमा, टाइमआउट और ऐसे पुनः प्रयास जोड़ें जो हमेशा के लिए पुनः प्रयास न करें। निर्णयों और टूल आउटपुट को लॉग करें ताकि आप देख सकें कि समस्या कहाँ उत्पन्न होती है। एक सामान्य सुरक्षा उपाय है: यदि एजेंट अनिश्चित है या बार-बार त्रुटियाँ दोहराता है, तो उसे तात्कालिक समाधान खोजने के बजाय सहायता मांगनी चाहिए।.
AI एजेंट बनाने के लिए न्यूनतम आर्किटेक्चर क्या है?
कम से कम आपको एक कंट्रोलर लूप की आवश्यकता होगी जो मॉडल को एक लक्ष्य और संदर्भ प्रदान करे, अगली क्रिया के लिए पूछे, अनुरोध किए जाने पर टूल को निष्पादित करे, अवलोकन को जोड़े और प्रक्रिया को दोहराए। आपको ऐसे टूल की भी आवश्यकता होगी जिनमें इनपुट/आउटपुट के सटीक आकार हों और एक "पूर्ण" जाँच हो। यदि आप स्थिति को स्पष्ट रखते हैं और चरण सीमाओं को लागू करते हैं तो स्वयं द्वारा बनाया गया लूप भी अच्छी तरह से काम कर सकता है।.
मुझे टूल कॉलिंग को इस तरह से कैसे डिजाइन करना चाहिए जिससे यह प्रोडक्शन में विश्वसनीय हो?
टूल्स को सीमित, टाइप-आधारित, अनुमति-आधारित और मान्य रखें—सामान्य "कुछ भी कर सकने वाले" टूल से बचें। सख्त स्कीमा (जैसे संरचित आउटपुट/फ़ंक्शन कॉलिंग) को प्राथमिकता दें ताकि एजेंट इनपुट को अनदेखा न कर सके। टूल लेयर पर अनुमति सूची, दर सीमा और उपयोगकर्ता/संगठन अनुमति जांच जोड़ें। आइडमपोटेंसी पैटर्न का उपयोग करके, टूल्स को आवश्यकतानुसार सुरक्षित रूप से पुनः चलाने के लिए डिज़ाइन करें।.
एजेंट की कार्यक्षमता को कम किए बिना मेमोरी बढ़ाने का सबसे अच्छा तरीका क्या है?
मेमोरी को दो भागों में समझें: अल्पकालिक रन स्टेट (हाल के चरण, वर्तमान योजना, बाधाएं) और दीर्घकालिक रिट्रीवल (वरीयताएं, स्थिर नियम, प्रासंगिक दस्तावेज़)। अल्पकालिक मेमोरी को संक्षिप्त रखने के लिए पूर्ण ट्रांसक्रिप्ट के बजाय रनिंग समरी का उपयोग करें। दीर्घकालिक मेमोरी के लिए, रिट्रीवल (एम्बेडिंग + वेक्टर स्टोर/आरएजी पैटर्न) आमतौर पर सब कुछ संदर्भ में भरने और मॉडल को भ्रमित करने से बेहतर होता है।.
मुझे किस योजना पद्धति का उपयोग करना चाहिए: चेकलिस्ट, रिएक्ट या पर्यवेक्षक-कर्मचारी?
जब कार्य पूर्वानुमानित हों और आप कुछ ऐसा चाहते हों जिसका परीक्षण करना आसान हो, तो चेकलिस्ट प्लानर बहुत उपयोगी होता है। रीएक्ट-शैली के लूप तब कारगर साबित होते हैं जब टूल के परिणाम आपके अगले कार्य को प्रभावित करते हैं। पर्यवेक्षक-कार्यकर्ता पैटर्न (जैसे ऑटोजेन-शैली की भूमिका विभाजन) तब सहायक होते हैं जब कार्यों को समानांतर रूप से किया जा सकता है या अलग-अलग भूमिकाओं (शोधकर्ता, कोडर, क्यूए) से लाभ होता है। योजना बनाने के बाद उसे क्रियान्वित करना और फिर से योजना बनाना जिद्दी खराब योजनाओं से बचने का एक व्यावहारिक तरीका है।.
अगर कोई एजेंट वास्तविक कार्रवाई कर सकता है, तो मैं उसे सुरक्षित कैसे बनाऊं?
न्यूनतम विशेषाधिकार वाली अनुमतियों का उपयोग करें और जोखिम भरे उपकरणों को अनुमोदन या "ड्राई-रन" मोड के अंतर्गत रखें। बजट और सीमाएँ निर्धारित करें: अधिकतम चरण, अधिकतम व्यय और प्रति मिनट उपकरण कॉल सीमाएँ। लॉगिंग से पहले संवेदनशील डेटा को संपादित करें और विकास और उत्पादन वातावरण को अलग रखें। अस्पष्ट इनपुट होने पर, साक्ष्य के स्थान पर विश्वास को आधार बनाने के बजाय, अनिश्चितता के संकेत या स्पष्टीकरण प्रश्न अनिवार्य करें।.
मैं किसी एआई एजेंट का परीक्षण और मूल्यांकन कैसे करूं ताकि समय के साथ उसमें सुधार हो सके?
हैप्पी पाथ, एज केस, टूल फेलियर, अस्पष्ट अनुरोध और प्रॉम्प्ट-इंजेक्शन प्रयासों (OWASP-शैली) सहित एक सिनेरियो सूट बनाएं। टास्क की सफलता, पूरा होने में लगने वाला समय, टूल त्रुटियों से रिकवरी और बिना सबूत के दावों जैसे परिणामों का मूल्यांकन करें। जब भी आप टूल स्कीमा, प्रॉम्प्ट, रिट्रीवल या मेमोरी फॉर्मेटिंग में बदलाव करें, सूट को दोबारा चलाएं। यदि आप इसका परीक्षण नहीं कर सकते, तो आप इसे विश्वसनीय रूप से जारी नहीं कर सकते।.
मैं लेटेंसी और लागत को बढ़ाए बिना एजेंट को कैसे तैनात कर सकता हूँ?
एक सामान्य पैटर्न में स्टेटलेस कंट्रोलर, बाहरी स्टेट स्टोर (DB/Redis), इसके पीछे टूल सर्विसेज़ और मज़बूत लॉगिंग/मॉनिटरिंग (अक्सर OpenTelemetry) शामिल होते हैं। रिट्रीवल कैशिंग, कॉम्पैक्ट स्टेट समरी, राउटिंग/एक्सट्रैक्शन के लिए छोटे मॉडल और सबसे कठिन चरणों तक ही "गहन चिंतन" को सीमित करके लागत को नियंत्रित करें। लंबे कार्यों के लिए क्यू का उपयोग करें ताकि वेब रिक्वेस्ट खुली न रहें। हमेशा किल स्विच शामिल करें।.
संदर्भ
-
राष्ट्रीय मानक एवं प्रौद्योगिकी संस्थान (एनआईएसटी) - एनआईएसटी एआई आरएमएफ 1.0 (विश्वसनीयता एवं पारदर्शिता) - nvlpubs.nist.gov
-
ओपनएआई - संरचित आउटपुट - platform.openai.com
-
OpenAI - फ़ंक्शन कॉलिंग गाइड - platform.openai.com
-
OpenAI - दर सीमा संबंधी दिशानिर्देश - platform.openai.com
-
OpenAI - एपीआई चलाता है -platform.openai.com
-
OpenAI - असिस्टेंट फ़ंक्शन कॉलिंग - platform.openai.com
-
LangChain - एजेंट दस्तावेज़ (जावास्क्रिप्ट) - docs.langchain.com
-
LangChain - टूल्स डॉक्स (पायथन) - docs.langchain.com
-
लैंगचेन - मेमोरी का अवलोकन - docs.langchain.com
-
arXiv - ReAct पेपर (reason + act) - arxiv.org
-
arXiv - RAG पेपर - arxiv.org
-
अमेज़न वेब सर्विसेज (AWS) बिल्डर्स लाइब्रेरी - टाइमआउट, रिट्राई और बैकऑफ़ विद जिटर - aws.amazon.com
-
ओपन टेलीमेट्री - अवलोकनशीलता का परिचय - opentelemetry.io
-
स्ट्राइप - आइडम्पोटेंट अनुरोध - docs.stripe.com
-
गूगल क्लाउड - रिट्राई रणनीति (बैकऑफ़ + जिटर) - docs.cloud.google.com
-
OWASP - बड़े भाषा मॉडल अनुप्रयोगों के लिए शीर्ष 10 - owasp.org
-
OWASP - LLM01 त्वरित इंजेक्शन - genai.owasp.org
-
LlamaIndex - RAG का परिचय - developers.llamaindex.ai
-
माइक्रोसॉफ्ट - सिमेंटिक कर्नेल - learn.microsoft.com
-
Microsoft AutoGen - मल्टी-एजेंट फ्रेमवर्क (दस्तावेज़ीकरण) - microsoft.github.io
-
CrewAI - एजेंट अवधारणाएँ - docs.crewai.com
-
Haystack (deepset) - रिट्रीवर्स का दस्तावेज़ीकरण - docs.haystack.deepset.ai