एआई एजेंट कैसे बनाएं

एआई एजेंट कैसे बनाएं

संक्षिप्त उत्तर: व्यवहार में कारगर एआई एजेंट बनाने के लिए, इसे एक नियंत्रित लूप की तरह मानें: इनपुट लें, अगली कार्रवाई तय करें, एक सीमित दायरे वाले टूल को कॉल करें, परिणाम देखें और तब तक दोहराएं जब तक कि स्पष्ट "पूर्ण" जांच पास न हो जाए। यह तब उपयोगी होता है जब कार्य कई चरणों वाला और टूल-आधारित हो; यदि एक ही प्रॉम्प्ट से समस्या हल हो जाती है, तो एजेंट को छोड़ दें। सख्त टूल स्कीमा, चरण सीमाएं, लॉगिंग और एक वैलिडेटर/क्रिटिक जोड़ें ताकि जब टूल विफल हो जाएं या इनपुट अस्पष्ट हों, तो एजेंट लूप में फंसे रहने के बजाय आगे की कार्रवाई करे।

चाबी छीनना:

कंट्रोलर लूप : स्पष्ट स्टॉप शर्तों और अधिकतम चरणों के साथ इनपुट→एक्ट→ऑब्ज़र्व पुनरावृत्ति को लागू करें।

टूल डिज़ाइन : "डू एनीथिंग" जैसी अव्यवस्था से बचने के लिए टूल्स को सीमित, टाइप किए गए, अनुमति प्राप्त और मान्य रखें।

स्मृति स्वच्छता : संक्षिप्त अल्पकालिक जानकारी और दीर्घकालिक पुनर्प्राप्ति का उपयोग करें; संपूर्ण प्रतिलेखों को एक साथ सहेजने से बचें।

दुरुपयोग प्रतिरोध : जोखिम भरी कार्रवाइयों के लिए अनुमति सूची, दर सीमा, निष्क्रियता और "ड्राई-रन" जोड़ें।

परीक्षणयोग्यता : परिदृश्यों का एक समूह (विफलताएं, अस्पष्टता, इंजेक्शन) बनाए रखें और प्रत्येक परिवर्तन पर इसे दोबारा चलाएं।

एआई एजेंट कैसे बनाएं? इन्फोग्राफिक
इस लेख के बाद आप ये लेख भी पढ़ सकते हैं:

🔗 AI प्रदर्शन को कैसे मापें
गति, सटीकता और विश्वसनीयता का आकलन करने के लिए व्यावहारिक मापदंडों को जानें।.

🔗 AI से कैसे बात करें
बेहतर उत्तर पाने के लिए संकेतों, संदर्भ और अनुवर्ती प्रश्नों का उपयोग करें।.

🔗 एआई मॉडल का मूल्यांकन कैसे करें
परीक्षणों, मापदंड मानदंडों और वास्तविक दुनिया के कार्य परिणामों का उपयोग करके मॉडलों की तुलना करें।.

🔗 एआई मॉडल को कैसे अनुकूलित करें
ट्यूनिंग, प्रूनिंग और मॉनिटरिंग के माध्यम से गुणवत्ता और लागत में सुधार करें।.


1) एक एआई एजेंट आम आदमी की भाषा में क्या होता है? 🧠

एक एआई एजेंट एक लूप होता है। लैंगचेन "एजेंट्स" दस्तावेज़।

बस इतना ही। एक लूप जिसके बीच में एक दिमाग है।.

इनपुट → सोचें → कार्य करें → अवलोकन करें → दोहराएँप्रतिक्रिया पत्र (तर्क + कार्य)

कहाँ:

  • इनपुट उपयोगकर्ता का अनुरोध या कोई घटना (नया ईमेल, सपोर्ट टिकट, सेंसर पिंग) हो सकता है।

  • थिंक एक भाषा मॉडल है जो अगले कदम के बारे में तर्क करता है।

  • Act किसी टूल को कॉल कर रहा है (आंतरिक दस्तावेज़ खोजें, कोड चलाएँ, टिकट बनाएँ, उत्तर लिखें)। OpenAI फ़ंक्शन कॉलिंग गाइड

  • ऑब्ज़र्व टूल के आउटपुट को पढ़ रहा है।

  • दोहराव ही वह हिस्सा है जो इसे "चैटी" के बजाय "एजेंटिक" जैसा महसूस कराता है। लैंगचेन "एजेंट्स" दस्तावेज़

कुछ एजेंट मूल रूप से स्मार्ट मैक्रो की तरह होते हैं। वहीं कुछ जूनियर ऑपरेटर की तरह काम करते हैं जो कई कार्यों को संभाल सकते हैं और गलतियों से उबर सकते हैं। दोनों ही महत्वपूर्ण हैं।.

साथ ही, आपको पूर्ण स्वायत्तता की आवश्यकता नहीं है। वास्तव में... शायद आप इसे चाहते भी नहीं हैं 🙃


2) आपको एजेंट कब बनाना चाहिए (और कब नहीं) 🚦

एजेंट का निर्माण तब करें जब:

  • यह काम कई चरणों वाला और बीच में होने वाली घटनाओं के आधार पर इसमें बदलाव होता रहता है।

  • इस कार्य में उपकरणों का उपयोग (डेटाबेस, सीआरएम, कोड निष्पादन, फ़ाइल निर्माण, ब्राउज़र, आंतरिक एपीआई)। लैंगचेन "टूल्स" दस्तावेज़ देखें।

  • आपको दोहराए जाने योग्य परिणाम , न कि केवल एक बार के समाधान।

  • आप "पूर्ण" को इस तरह से परिभाषित कर सकते हैं जिसे कंप्यूटर जांच सके, भले ही वह परिभाषा थोड़ी ढीली हो।.

एजेंट का निर्माण तब न करें जब:

  • एक सरल प्रॉम्प्ट + रिस्पॉन्स से ही समस्या हल हो जाती है (ज्यादा जटिल न बनाएं, वरना बाद में आपको पछतावा होगा)।.

  • आपको पूर्ण नियतिवाद की आवश्यकता है (एजेंट कुछ हद तक सुसंगत हो सकते हैं, लेकिन रोबोटिक नहीं)।.

  • आपके पास जुड़ने के लिए कोई उपकरण या डेटा नहीं है - तब यह ज्यादातर सिर्फ भावनाओं पर आधारित होता है।.

साफ़-साफ़ कहें तो, आधे से ज़्यादा “एआई एजेंट प्रोजेक्ट” कुछ शाखाओं वाले नियमों के साथ एक वर्कफ़्लो हो सकते हैं। लेकिन कभी-कभी माहौल भी मायने रखता है 🤷♂️


3) एक अच्छे एआई एजेंट में क्या खूबियां होनी चाहिए ✅

यह रहा वह भाग जिसके बारे में आपने पूछा था, "किसी चीज़ का अच्छा संस्करण क्या होता है", लेकिन मैं थोड़ा स्पष्टवादी होने जा रहा हूँ:

एक अच्छे एआई एजेंट का मतलब वह नहीं

अगर आपके एजेंट का परीक्षण नहीं किया जा सकता, तो यह मूलतः एक बेहद भरोसेमंद स्लॉट मशीन की तरह है। पार्टियों में तो मज़ा आता है, लेकिन प्रोडक्शन में बेहद डरावना 😬


4) किसी एजेंट के मूल निर्माण खंड (उसकी "संरचना" 🧩)

अधिकांश विश्वसनीय एजेंटों में ये घटक होते हैं:

ए) नियंत्रक लूप 🔁

यह ऑर्केस्ट्रेटर है:

  • लक्ष्य निर्धारित करें

  • अगले कदम के लिए मॉडल से पूछें

  • रन टूल

  • अवलोकन जोड़ें

  • LangChain “Agents” दस्तावेज़ पूरा होने तक दोहराएँ

बी) उपकरण (यानी क्षमताएं) 🧰

एजेंट को प्रभावी बनाने वाले कारक उपकरण ही हैं: लैंगचेन "टूल्स" दस्तावेज़

  • डेटाबेस क्वेरीज़

  • ईमेल भेजना

  • फ़ाइलें खींचना

  • कोड चल रहा है

  • आंतरिक API को कॉल करना

  • स्प्रेडशीट या सीआरएम में लिखना

सी) स्मृति 🗃️

दो प्रकार महत्वपूर्ण हैं:

  • अल्पकालिक स्मृति : वर्तमान रन संदर्भ, हाल के चरण, वर्तमान योजना

  • दीर्घकालिक स्मृति : उपयोगकर्ता प्राथमिकताएँ, परियोजना संदर्भ, पुनर्प्राप्त ज्ञान (अक्सर एम्बेडिंग + एक वेक्टर स्टोर के माध्यम से) RAG पेपर

डी) योजना एवं निर्णय नीति 🧭

भले ही आप इसे "योजना" न कहें, आपको एक विधि की आवश्यकता है:

ई) सुरक्षा उपाय और मूल्यांकन 🧯

हाँ, यह प्रेरणा देने से ज़्यादा इंजीनियरिंग पर आधारित है। और यही तो… असल बात है।.


5) तुलनात्मक तालिका: एजेंट बनाने के लोकप्रिय तरीके 🧾

नीचे एक वास्तविक "तुलना तालिका" दी गई है - कुछ विचित्रताओं के साथ, क्योंकि वास्तविक टीमें विचित्र ही होती हैं 😄

उपकरण / ढांचा श्रोता कीमत यह कैसे काम करता है टिप्पणियाँ (थोड़ी सी गड़बड़ी)
लैंगचेन जो बिल्डर लेगो-शैली के घटकों को पसंद करते हैं लगभग मुफ़्त + बुनियादी ढांचा टूल्स, मेमोरी और चेन के लिए बड़ा इकोसिस्टम अगर आप चीजों का नाम स्पष्ट रूप से नहीं रखते हैं तो चीजें बहुत जल्दी उलझ सकती हैं।
लामाइंडेक्स RAG-भारी टीमें लगभग मुफ़्त + बुनियादी ढांचा मजबूत पुनर्प्राप्ति पैटर्न, अनुक्रमण, कनेक्टर यह तब बहुत अच्छा होता है जब आपका एजेंट मूल रूप से "खोज + कार्रवाई" करता है... जो कि आम बात है।
ओपनएआई असिस्टेंट शैली का दृष्टिकोण तेज़ सेटअप चाहने वाली टीमें उपयोग आधारित अंतर्निर्मित टूल कॉलिंग पैटर्न और रन स्थिति कुछ मामलों में कम लचीला, लेकिन कई ऐप्स के लिए साफ-सुथरा। OpenAI API चलाता है, OpenAI असिस्टेंट फ़ंक्शन कॉलिंग
सिमेंटिक कर्नेल वे डेवलपर जो संरचित ऑर्केस्ट्रेशन चाहते हैं नि: शुल्क-ish कौशल/कार्यों के लिए सुव्यवस्थित अमूर्तता "व्यापारिक रूप से सुव्यवस्थित" लगता है - कभी-कभी यह तारीफ होती है 😉
ऑटोजेन बहु-एजेंट प्रयोगकर्ता नि: शुल्क-ish एजेंट-से-एजेंट सहयोग पैटर्न ज्यादा बोलने की आदत हो सकती है; समाप्ति के सख्त नियम निर्धारित करें
CrewAI “एजेंटों की टीमें” के प्रशंसक नि: शुल्क-ish भूमिकाओं + कार्यों + हस्तांतरणों को आसानी से व्यक्त किया जा सकता है यह तब सबसे अच्छा काम करता है जब कार्य स्पष्ट हों, अस्पष्ट न हों।
सूखी घास का ढेर खोजें + पाइपलाइन लोग नि: शुल्क-ish ठोस पाइपलाइन, पुनर्प्राप्ति, घटक "एजेंट थिएटर" की बजाय "व्यावहारिक कारखाना" की अधिक आवश्यकता है।
अपना खुद का लूप बनाएं (कस्टम लूप) नियंत्रण के दीवाने (स्नेही) आपका समय न्यूनतम जादू, अधिकतम स्पष्टता आमतौर पर यही सबसे अच्छा दीर्घकालिक उपाय होता है... जब तक कि आप सब कुछ नए सिरे से न बना लें 😅

कोई एक विजेता नहीं है। सबसे अच्छा विकल्प इस बात पर निर्भर करता है कि आपके एजेंट का मुख्य काम डेटा पुनर्प्राप्ति , टूल निष्पादन , बहु-एजेंट समन्वय या वर्कफ़्लो स्वचालन


6) एआई एजेंट को चरण-दर-चरण कैसे बनाएं (वास्तविक विधि) 🍳🤖

यह वह हिस्सा है जिसे ज्यादातर लोग छोड़ देते हैं, और फिर सोचते हैं कि एजेंट एक पेंट्री में रैकून की तरह व्यवहार क्यों करता है।.

चरण 1: नौकरी को एक वाक्य में परिभाषित करें 🎯

उदाहरण:

  • "नीति और टिकट के संदर्भ का उपयोग करते हुए ग्राहक को जवाब का मसौदा तैयार करें, फिर अनुमोदन के लिए अनुरोध करें।"

  • "बग रिपोर्ट की जांच करें, समस्या को दोबारा उत्पन्न करें और समाधान प्रस्तावित करें।"

  • "अधूरे मीटिंग नोट्स को कार्यों, उनके मालिकों और समयसीमाओं में बदलें।"

अगर आप इसे सरल शब्दों में परिभाषित नहीं कर सकते, तो आपका एजेंट भी नहीं कर सकता। मेरा मतलब है कि वह कर तो सकता है, लेकिन वह तात्कालिकता के आधार पर निर्णय लेगा, और तात्कालिकता ही वह स्थिति है जहाँ बजट बर्बाद हो जाता है।.

चरण 2: स्वायत्तता स्तर तय करें (कम, मध्यम, तीखा) 🌶️

  • कम स्वायत्तता : चरणों का सुझाव देता है, मानव "अनुमोदन" पर क्लिक करता है।

  • मध्यम स्तर : टूल चलाता है, आउटपुट का मसौदा तैयार करता है, अनिश्चितता होने पर मामले को आगे बढ़ाता है

  • हाई : शुरू से अंत तक निष्पादित होता है, केवल अपवादों की स्थिति में ही मनुष्यों को सूचित करता है।

जितनी धीमी गति से आप शुरू करना चाहते हैं, उससे कम से शुरू करें। आप बाद में इसे कभी भी बढ़ा सकते हैं।.

चरण 3: अपनी मॉडल रणनीति चुनें 🧠

आप आमतौर पर चुनते हैं:

  • हर चीज के लिए एक मजबूत मॉडल (सरल)

  • एक मजबूत मॉडल + कम लागत वाले चरणों (वर्गीकरण, रूटिंग) के लिए एक छोटा मॉडल

  • आवश्यकता पड़ने पर विशेषीकृत मॉडल (दृष्टि, कोड, वाक्) उपलब्ध कराए जाते हैं।

इसके अलावा यह भी तय करें:

  • अधिकतम टोकन

  • तापमान

  • क्या आप आंतरिक रूप से लंबे तर्क-प्रक्रियाओं के विवरण की अनुमति देते हैं (आप दे सकते हैं, लेकिन अंतिम उपयोगकर्ताओं के सामने विचारों की कच्ची श्रृंखला को उजागर न करें)

चरण 4: सख्त स्कीमा के साथ टूल परिभाषित करें 🔩

उपकरण इस प्रकार होने चाहिए:

do_anything(input: string) नामक टूल के बजाय , यह करें:

अगर आप एजेंट को चेन सॉ देते हैं, तो आश्चर्यचकित न हों जब वह बाड़ को हटाते हुए झाड़ी की छंटाई कर दे।.

चरण 5: कंट्रोलर लूप बनाएं 🔁

न्यूनतम लूप:

  1. लक्ष्य और प्रारंभिक संदर्भ से शुरू करें

  2. मॉडल से पूछें: "अगला कदम क्या होगा?"

  3. यदि टूल कॉल हो तो टूल को निष्पादित करें

  4. अवलोकन संलग्न करें

  5. जाँच रोकें

  6. LangChain “Agents” दस्तावेज़ों को (अधिकतम चरणों के साथ) दोहराएँ

जोड़ना:

चरण 6: मेमोरी को सावधानीपूर्वक जोड़ें 🗃️

अल्पकालिक: प्रत्येक चरण में अपडेट किया गया एक संक्षिप्त "स्थिति सारांश" रखें। लैंगचेन "मेमोरी अवलोकन"
दीर्घकालिक: स्थायी तथ्य (उपयोगकर्ता प्राथमिकताएं, संगठन नियम, स्थिर दस्तावेज़) संग्रहीत करें।

अंगूठे का नियम:

  • अगर इसमें बार-बार बदलाव होता है तो इसे अल्पकालिक ही रखें।

  • यदि यह स्थिर है तो इसे लंबे समय तक सुरक्षित रखें।

  • यदि यह संवेदनशील है तो इसे कम से कम मात्रा में (या बिल्कुल भी नहीं) संग्रहित करें।

चरण 7: सत्यापन और एक "आलोचनात्मक" पास जोड़ें 🧪

एक सस्ता और व्यावहारिक पैटर्न:

  • एजेंट परिणाम उत्पन्न करता है

  • वैलिडेटर संरचना और बाधाओं की जाँच करता है

  • NIST AI RMF 1.0 में छूटे हुए चरणों या नीति उल्लंघनों के लिए वैकल्पिक आलोचक मॉडल समीक्षाएँ शामिल हैं।

यह एकदम सही नहीं है, लेकिन यह चौंकाने वाली हद तक बेतुकी बातों को पकड़ लेता है।.

चरण 8: उन सभी चीजों को नोट करें जिन्हें नोट न करने पर आपको बाद में पछतावा होगा 📜

लकड़ी का लट्ठा:

भविष्य में आप खुद को धन्यवाद देंगे। वर्तमान में आप भूल जाएंगे। यही तो जीवन है 😵💫


7) ऐसा टूल कॉलिंग जो आपकी आत्मा को ठेस न पहुंचाए 🧰😵

टूल कॉलिंग ही वह जगह है जहां "एआई एजेंट कैसे बनाएं" असल में सॉफ्टवेयर इंजीनियरिंग बन जाती है।.

उपकरणों को भरोसेमंद बनाएं (भरोसेमंद होना अच्छी बात है)

विश्वसनीय उपकरण निम्नलिखित हैं:

केवल प्रॉम्प्ट ही नहीं, बल्कि टूल लेयर पर भी सुरक्षा उपाय जोड़ें।

प्रॉम्प्ट विनम्र सुझाव होते हैं। टूल वैलिडेशन एक बंद दरवाजे की तरह है। ओपनएआई स्ट्रक्चर्ड आउटपुट्स

करना:

  • अनुमति सूची (कि कौन से उपकरण चल सकते हैं)

  • इनपुट सत्यापन

  • दर सीमा मार्गदर्शिका

  • उपयोगकर्ता/संगठन के अनुसार अनुमति जाँच

  • जोखिम भरी कार्रवाइयों के लिए "ड्राई-रन मोड"

आंशिक विफलता के लिए डिज़ाइन

उपकरण विफल हो जाते हैं। नेटवर्क अस्थिर हो जाते हैं। प्रमाणीकरण समाप्त हो जाता है। एक एजेंट को ये करना होगा:

एक प्रभावी और चुपचाप काम करने वाली तरकीब: संरचित त्रुटियाँ लौटाएँ जैसे:

  • प्रकार: प्रमाणीकरण त्रुटि

  • प्रकार: नहीं मिला

  • प्रकार: दर सीमित।
    ताकि मॉडल घबराहट के बजाय बुद्धिमानी से प्रतिक्रिया दे सके।


8) ऐसी यादें जो आपको परेशान करने के बजाय आपकी मदद करें 👻🗂️

स्मृति शक्तिशाली होती है, लेकिन यह कबाड़ का डिब्बा भी बन सकती है।.

अल्पकालिक स्मृति: इसे संक्षिप्त रखें

उपयोग:

  • अंतिम N चरण

  • एक निरंतर सारांश (प्रत्येक लूप में अपडेट किया जाता है)

  • वर्तमान योजना

  • वर्तमान बाधाएं (बजट, समय, नीतियां)

यदि आप हर चीज को संदर्भ में रखकर देखें, तो आपको यह मिलेगा:

  • उच्च लागत

  • धीमी विलंबता

  • और भी ज्यादा भ्रम (हाँ, तब भी)

दीर्घकालिक स्मृति: याद करने की प्रक्रिया, न कि "भरने की प्रक्रिया"

अधिकांश "दीर्घकालिक स्मृति" कुछ इस प्रकार होती है:

  • एम्बेडिंग

  • वेक्टर स्टोर

  • पुनर्प्राप्ति संवर्धित पीढ़ी (आरएजी) आरएजी पेपर

एजेंट डेटा को याद नहीं रखता। यह रनटाइम पर सबसे प्रासंगिक अंशों को पुनः प्राप्त करता है। LlamaIndex “RAG का परिचय”

व्यावहारिक स्मृति नियम

  • “प्राथमिकताओं” को स्पष्ट तथ्यों के रूप में संग्रहीत करें: “उपयोगकर्ता को बुलेट सारांश पसंद हैं और इमोजी से नफरत है” (हाहा, हालांकि यहां नहीं 😄)

  • निर्णयों को समय-सीमा या संस्करणों के साथ संग्रहित करें (अन्यथा विरोधाभास जमा हो जाएंगे)

  • जब तक बेहद जरूरी न हो, कभी भी गुप्त बातें न छिपाएं।

और यहाँ मेरा एक अपूर्ण उदाहरण है: स्मृति एक फ्रिज की तरह है। अगर आप इसे कभी साफ नहीं करते, तो अंततः आपके सैंडविच का स्वाद प्याज और पछतावे जैसा हो जाता है।.


9) योजना बनाने के तरीके (सरल से लेकर आकर्षक तक) 🧭✨

योजना बनाना तो बस नियंत्रित विघटन है। इसे रहस्यमय मत बनाइए।.

पैटर्न ए: चेकलिस्ट प्लानर ✅

  • मॉडल चरणों की एक सूची आउटपुट करता है

  • चरण-दर-चरण निष्पादित करता है

  • चेकलिस्ट की स्थिति अपडेट करें

ऑनबोर्डिंग के लिए बेहतरीन। सरल, परीक्षण योग्य।.

पैटर्न बी: ​​प्रतिक्रिया लूप (तर्क + क्रिया) 🧠→🧰

  • मॉडल अगले टूल कॉल का निर्णय लेता है

  • आउटपुट का अवलोकन करता है

  • रिएक्ट पेपर को दोहराता है

यह एक क्लासिक एजेंट वाली फीलिंग है।.

पैटर्न सी: पर्यवेक्षक-कर्मचारी 👥

यह तब उपयोगी होता है जब कार्यों को समानांतर रूप से किया जा सकता है, या जब आप अलग-अलग "भूमिकाएँ" चाहते हैं जैसे:

  • शोधकर्ता

  • सांकेतिक शब्दों में बदलनेवाला

  • संपादक

  • QA चेकर

पैटर्न डी: योजना बनाएं, फिर उसे क्रियान्वित करें और आवश्यकतानुसार पुनर्योजना बनाएं 🔄

  • योजना बनाएं

  • निष्पादित करना

  • यदि उपकरण के परिणाम वास्तविकता को बदल दें, तो पुनर्योजना बनाएं।

इससे एजेंट को किसी खराब योजना का हठपूर्वक पालन करने से रोका जा सकता है। मनुष्य भी ऐसा ही करते हैं, सिवाय तब जब वे थके हुए हों, उस स्थिति में वे भी खराब योजनाओं का पालन करते हैं।.


10) सुरक्षा, विश्वसनीयता और नौकरी से न निकाले जाने का डर 🔐😅

यदि आपका एजेंट कार्रवाई कर सकता है, तो आपको सुरक्षा डिज़ाइन की आवश्यकता है। यह "हो तो अच्छा है" वाली बात नहीं, बल्कि आवश्यकता है। NIST AI RMF 1.0

कठोर सीमाएँ

  • प्रति दौड़ अधिकतम चरण

  • प्रति मिनट अधिकतम टूल कॉल

  • प्रति सत्र अधिकतम खर्च (टोकन बजट)

  • अनुमोदन के पीछे प्रतिबंधित उपकरण

डेटा संधारण

  • लॉग करने से पहले संवेदनशील इनपुट को संपादित करें

  • अलग-अलग वातावरण (डेवलपमेंट बनाम प्रोडक्शन)

  • न्यूनतम विशेषाधिकार उपकरण अनुमतियाँ

व्यवहार संबंधी बाधाएँ

  • एजेंट को आंतरिक साक्ष्य के अंश उद्धृत करने के लिए बाध्य करें (बाहरी लिंक नहीं, केवल आंतरिक संदर्भ)।

  • जब विश्वास कम हो तो अनिश्चितता के संकेत आवश्यक हैं

  • यदि इनपुट अस्पष्ट हों तो "स्पष्टीकरण प्रश्न पूछें" आवश्यक है।

एक भरोसेमंद एजेंट वह नहीं होता जो सबसे अधिक आत्मविश्वासी हो। भरोसेमंद एजेंट वह होता है जो जानता है कि वह कब अनुमान लगा रहा है... और यह बात वह स्पष्ट रूप से कह देता है।.


11) परीक्षण और मूल्यांकन (वह हिस्सा जिससे हर कोई बचता है) 🧪📏

आप जिस चीज को माप नहीं सकते, उसे सुधार भी नहीं सकते। हाँ, यह बात थोड़ी घिसी-पिटी है, लेकिन सच में बहुत सटीक है।.

परिदृश्यों का एक सेट बनाएं

30-100 टेस्ट केस बनाएं:

स्कोर परिणाम

निम्नलिखित जैसे मापदंडों का उपयोग करें:

  • कार्य सफलता दर

  • पूरा होने में लगने वाला समय

  • उपकरण त्रुटि पुनर्प्राप्ति दर

  • मतिभ्रम की दर (बिना सबूत के दावे)

  • मानव स्वीकृति दर (यदि पर्यवेक्षित मोड में हो)

प्रॉम्प्ट और टूल्स के लिए रिग्रेशन परीक्षण

जब भी आप बदलाव करें:

  • टूल स्कीमा

  • सिस्टम निर्देश

  • पुनर्प्राप्ति तर्क

  • मेमोरी फॉर्मेट।
    सूट को दोबारा चलाएं।

एजेंट्स बहुत ही नाजुक होते हैं। घर में रखे जाने वाले पौधों की तरह, लेकिन उनसे कहीं ज्यादा महंगे।.


12) ऐसे तैनाती पैटर्न जो आपके बजट को बर्बाद न करें 💸🔥

एक ही सेवा से शुरुआत करें

लागत नियंत्रण उपायों को शुरुआत में ही लागू करें।

  • कैशिंग पुनर्प्राप्ति परिणाम

  • सारांशों के साथ वार्तालाप की स्थिति को संपीड़ित करना

  • रूटिंग और निष्कर्षण के लिए छोटे मॉडल का उपयोग करना

  • सबसे कठिन चरणों तक ही "गहन चिंतन मोड" को सीमित करना

सामान्य वास्तुकला विकल्प

  • स्टेटलेस कंट्रोलर + बाहरी स्टेट स्टोर (DB/redis)

  • जहां संभव हो, टूल कॉल आइडम्पोटेंट होते हैं (स्ट्राइप में "आइडम्पोटेंट अनुरोध")

  • लंबे कार्यों के लिए कतार बनाएं (ताकि आप किसी वेब अनुरोध को हमेशा के लिए खुला न रखें)

और हां: एक “किल स्विच” भी बना लें। आपको इसकी ज़रूरत तब तक नहीं पड़ेगी जब तक कि आपको इसकी सचमुच बहुत ज़्यादा ज़रूरत न हो जाए 😬


13) समापन टिप्पणी - एआई एजेंट बनाने का संक्षिप्त तरीका 🎁🤖

अगर आपको और कुछ याद न रहे, तो बस यह याद रखें:

एजेंट कोई जादू नहीं है। यह एक ऐसी प्रणाली है जो अक्सर अच्छे निर्णय लेती है, जिससे उसका महत्व समझ में आता है... और नुकसान होने से पहले ही हार मान लेती है। एक तरह से यह चुपचाप सुकून देने वाला है 😌

और हाँ, अगर आप इसे सही तरीके से बनाते हैं, तो ऐसा लगता है जैसे आपने एक छोटे से डिजिटल इंटर्न को काम पर रखा हो जो कभी सोता नहीं, कभी-कभी घबरा जाता है और कागजी काम करना पसंद करता है। तो, मूल रूप से, एक इंटर्न ही है।.


अक्सर पूछे जाने वाले प्रश्न

सरल शब्दों में कहें तो एआई एजेंट क्या है?

एक एआई एजेंट मूल रूप से एक ऐसा चक्र है जो बार-बार दोहराता है: इनपुट लेना, अगला कदम तय करना, किसी टूल का उपयोग करना, परिणाम पढ़ना और प्रक्रिया पूरी होने तक दोहराते रहना। "एजेंटिक" शब्द केवल बातचीत करने से नहीं, बल्कि कार्य करने और अवलोकन करने से आता है। कई एजेंट केवल टूल तक पहुंच रखने वाले स्मार्ट ऑटोमेशन होते हैं, जबकि अन्य एक जूनियर ऑपरेटर की तरह व्यवहार करते हैं जो त्रुटियों से उबर सकते हैं।.

मुझे प्रॉम्प्ट का उपयोग करने के बजाय एआई एजेंट कब बनाना चाहिए?

जब काम कई चरणों वाला हो, बीच के परिणामों के आधार पर बदलता रहता हो, और विश्वसनीय टूल (एपीआई, डेटाबेस, टिकटिंग, कोड निष्पादन) के उपयोग की आवश्यकता हो, तो एजेंट बनाएं। एजेंट तब भी उपयोगी होते हैं जब आप सुरक्षा उपायों के साथ दोहराए जाने योग्य परिणाम चाहते हैं और "पूर्ण" की जांच करने का तरीका चाहते हैं। यदि एक सरल त्वरित प्रतिक्रिया काम करती है, तो एजेंट आमतौर पर अनावश्यक बोझ और अतिरिक्त विफलता का कारण होता है।.

मैं एक ऐसा एआई एजेंट कैसे बनाऊं जो लूप में न फंसे?

कठोर रोक शर्तें लागू करें: अधिकतम चरण, अधिकतम टूल कॉल और स्पष्ट पूर्णता जांच। संरचित टूल स्कीमा, टाइमआउट और ऐसे पुनः प्रयास जोड़ें जो हमेशा के लिए पुनः प्रयास न करें। निर्णयों और टूल आउटपुट को लॉग करें ताकि आप देख सकें कि समस्या कहाँ उत्पन्न होती है। एक सामान्य सुरक्षा उपाय है: यदि एजेंट अनिश्चित है या बार-बार त्रुटियाँ दोहराता है, तो उसे तात्कालिक समाधान खोजने के बजाय सहायता मांगनी चाहिए।.

AI एजेंट बनाने के लिए न्यूनतम आर्किटेक्चर क्या है?

कम से कम आपको एक कंट्रोलर लूप की आवश्यकता होगी जो मॉडल को एक लक्ष्य और संदर्भ प्रदान करे, अगली क्रिया के लिए पूछे, अनुरोध किए जाने पर टूल को निष्पादित करे, अवलोकन को जोड़े और प्रक्रिया को दोहराए। आपको ऐसे टूल की भी आवश्यकता होगी जिनमें इनपुट/आउटपुट के सटीक आकार हों और एक "पूर्ण" जाँच हो। यदि आप स्थिति को स्पष्ट रखते हैं और चरण सीमाओं को लागू करते हैं तो स्वयं द्वारा बनाया गया लूप भी अच्छी तरह से काम कर सकता है।.

मुझे टूल कॉलिंग को इस तरह से कैसे डिजाइन करना चाहिए जिससे यह प्रोडक्शन में विश्वसनीय हो?

टूल्स को सीमित, टाइप-आधारित, अनुमति-आधारित और मान्य रखें—सामान्य "कुछ भी कर सकने वाले" टूल से बचें। सख्त स्कीमा (जैसे संरचित आउटपुट/फ़ंक्शन कॉलिंग) को प्राथमिकता दें ताकि एजेंट इनपुट को अनदेखा न कर सके। टूल लेयर पर अनुमति सूची, दर सीमा और उपयोगकर्ता/संगठन अनुमति जांच जोड़ें। आइडमपोटेंसी पैटर्न का उपयोग करके, टूल्स को आवश्यकतानुसार सुरक्षित रूप से पुनः चलाने के लिए डिज़ाइन करें।.

एजेंट की कार्यक्षमता को कम किए बिना मेमोरी बढ़ाने का सबसे अच्छा तरीका क्या है?

मेमोरी को दो भागों में समझें: अल्पकालिक रन स्टेट (हाल के चरण, वर्तमान योजना, बाधाएं) और दीर्घकालिक रिट्रीवल (वरीयताएं, स्थिर नियम, प्रासंगिक दस्तावेज़)। अल्पकालिक मेमोरी को संक्षिप्त रखने के लिए पूर्ण ट्रांसक्रिप्ट के बजाय रनिंग समरी का उपयोग करें। दीर्घकालिक मेमोरी के लिए, रिट्रीवल (एम्बेडिंग + वेक्टर स्टोर/आरएजी पैटर्न) आमतौर पर सब कुछ संदर्भ में भरने और मॉडल को भ्रमित करने से बेहतर होता है।.

मुझे किस योजना पद्धति का उपयोग करना चाहिए: चेकलिस्ट, रिएक्ट या पर्यवेक्षक-कर्मचारी?

जब कार्य पूर्वानुमानित हों और आप कुछ ऐसा चाहते हों जिसका परीक्षण करना आसान हो, तो चेकलिस्ट प्लानर बहुत उपयोगी होता है। रीएक्ट-शैली के लूप तब कारगर साबित होते हैं जब टूल के परिणाम आपके अगले कार्य को प्रभावित करते हैं। पर्यवेक्षक-कार्यकर्ता पैटर्न (जैसे ऑटोजेन-शैली की भूमिका विभाजन) तब सहायक होते हैं जब कार्यों को समानांतर रूप से किया जा सकता है या अलग-अलग भूमिकाओं (शोधकर्ता, कोडर, क्यूए) से लाभ होता है। योजना बनाने के बाद उसे क्रियान्वित करना और फिर से योजना बनाना जिद्दी खराब योजनाओं से बचने का एक व्यावहारिक तरीका है।.

अगर कोई एजेंट वास्तविक कार्रवाई कर सकता है, तो मैं उसे सुरक्षित कैसे बनाऊं?

न्यूनतम विशेषाधिकार वाली अनुमतियों का उपयोग करें और जोखिम भरे उपकरणों को अनुमोदन या "ड्राई-रन" मोड के अंतर्गत रखें। बजट और सीमाएँ निर्धारित करें: अधिकतम चरण, अधिकतम व्यय और प्रति मिनट उपकरण कॉल सीमाएँ। लॉगिंग से पहले संवेदनशील डेटा को संपादित करें और विकास और उत्पादन वातावरण को अलग रखें। अस्पष्ट इनपुट होने पर, साक्ष्य के स्थान पर विश्वास को आधार बनाने के बजाय, अनिश्चितता के संकेत या स्पष्टीकरण प्रश्न अनिवार्य करें।.

मैं किसी एआई एजेंट का परीक्षण और मूल्यांकन कैसे करूं ताकि समय के साथ उसमें सुधार हो सके?

हैप्पी पाथ, एज केस, टूल फेलियर, अस्पष्ट अनुरोध और प्रॉम्प्ट-इंजेक्शन प्रयासों (OWASP-शैली) सहित एक सिनेरियो सूट बनाएं। टास्क की सफलता, पूरा होने में लगने वाला समय, टूल त्रुटियों से रिकवरी और बिना सबूत के दावों जैसे परिणामों का मूल्यांकन करें। जब भी आप टूल स्कीमा, प्रॉम्प्ट, रिट्रीवल या मेमोरी फॉर्मेटिंग में बदलाव करें, सूट को दोबारा चलाएं। यदि आप इसका परीक्षण नहीं कर सकते, तो आप इसे विश्वसनीय रूप से जारी नहीं कर सकते।.

मैं लेटेंसी और लागत को बढ़ाए बिना एजेंट को कैसे तैनात कर सकता हूँ?

एक सामान्य पैटर्न में स्टेटलेस कंट्रोलर, बाहरी स्टेट स्टोर (DB/Redis), इसके पीछे टूल सर्विसेज़ और मज़बूत लॉगिंग/मॉनिटरिंग (अक्सर OpenTelemetry) शामिल होते हैं। रिट्रीवल कैशिंग, कॉम्पैक्ट स्टेट समरी, राउटिंग/एक्सट्रैक्शन के लिए छोटे मॉडल और सबसे कठिन चरणों तक ही "गहन चिंतन" को सीमित करके लागत को नियंत्रित करें। लंबे कार्यों के लिए क्यू का उपयोग करें ताकि वेब रिक्वेस्ट खुली न रहें। हमेशा किल स्विच शामिल करें।.

संदर्भ

  1. राष्ट्रीय मानक एवं प्रौद्योगिकी संस्थान (एनआईएसटी) - एनआईएसटी एआई आरएमएफ 1.0 (विश्वसनीयता एवं पारदर्शिता) - nvlpubs.nist.gov

  2. ओपनएआई - संरचित आउटपुट - platform.openai.com

  3. OpenAI - फ़ंक्शन कॉलिंग गाइड - platform.openai.com

  4. OpenAI - दर सीमा संबंधी दिशानिर्देश - platform.openai.com

  5. OpenAI - एपीआई चलाता है -platform.openai.com

  6. OpenAI - असिस्टेंट फ़ंक्शन कॉलिंग - platform.openai.com

  7. LangChain - एजेंट दस्तावेज़ (जावास्क्रिप्ट) - docs.langchain.com

  8. LangChain - टूल्स डॉक्स (पायथन) - docs.langchain.com

  9. लैंगचेन - मेमोरी का अवलोकन - docs.langchain.com

  10. arXiv - ReAct पेपर (reason + act) - arxiv.org

  11. arXiv - RAG पेपर - arxiv.org

  12. अमेज़न वेब सर्विसेज (AWS) बिल्डर्स लाइब्रेरी - टाइमआउट, रिट्राई और बैकऑफ़ विद जिटर - aws.amazon.com

  13. ओपन टेलीमेट्री - अवलोकनशीलता का परिचय - opentelemetry.io

  14. स्ट्राइप - आइडम्पोटेंट अनुरोध - docs.stripe.com

  15. गूगल क्लाउड - रिट्राई रणनीति (बैकऑफ़ + जिटर) - docs.cloud.google.com

  16. OWASP - बड़े भाषा मॉडल अनुप्रयोगों के लिए शीर्ष 10 - owasp.org

  17. OWASP - LLM01 त्वरित इंजेक्शन - genai.owasp.org

  18. LlamaIndex - RAG का परिचय - developers.llamaindex.ai

  19. माइक्रोसॉफ्ट - सिमेंटिक कर्नेल - learn.microsoft.com

  20. Microsoft AutoGen - मल्टी-एजेंट फ्रेमवर्क (दस्तावेज़ीकरण) - microsoft.github.io

  21. CrewAI - एजेंट अवधारणाएँ - docs.crewai.com

  22. Haystack (deepset) - रिट्रीवर्स का दस्तावेज़ीकरण - docs.haystack.deepset.ai

आधिकारिक एआई असिस्टेंट स्टोर पर नवीनतम एआई खोजें

हमारे बारे में

ब्लॉग पर वापस जाएँ