2008-09-17 6 views
9

कम से कम, एक आवेदन स्वास्थ्य-निगरानी प्रणाली आपके लिए (डेवलपर) और/या आपके मालिक (आईटी प्रबंधक) और/या संचालन (ऑन-कॉल) कर्मचारियों के लिए क्या करनी चाहिए?आवेदन स्वास्थ्य निगरानी प्रणाली के लिए क्या आवश्यकताएं हैं?

न्यूनतम आवश्यकताओं के ऊपर यह और क्या करना चाहिए?

'आधारभूत संरचना' अनुप्रयोगों (एमएस-एक्सचेंज, अपाचे, इत्यादि) की निगरानी कर रहा है या अलग-अलग उपयोगकर्ता एप्लिकेशन, वेब साइट्स और डेटाबेस को निगरानी रखने की भी आवश्यकता है?

यदि उत्तरार्द्ध, आपको उनके बारे में क्या जानने की आवश्यकता है?

परिशिष्ट: इनपुट के लिए धन्यवाद, मैं सच में अनुप्रयोग स्तर की निगरानी बुनियादी ढांचे नहीं की निगरानी के लिए देख रहा था, लेकिन यह दोनों

+0

हाँ का उपयोग करके बुनियादी आधारभूत संरचना निगरानी, ​​यह एक आत्म-सेवा प्रश्न है। तो क्या? –

+0

यह एक शिलालेख के लिए अस्पष्ट लगता है कि आप वास्तव में क्या निगरानी कर रहे हैं? –

+0

यही वह है जो मैं आपको बताना चाहता हूं ... –

उत्तर

11
  • चाहे एप्लिकेशन चल रहा हो।
  • असामान्य सीपीयू/मेमोरी/नेटवर्क उपयोग।
  • किसी भी अनचाहे अपवाद की रिपोर्ट करें।
  • विभिन्न मॉड्यूल की स्थिति (यदि लागू हो)।
  • बाहरी घटकों की स्थिति (डेटाबेस, webservices, fileservers, आदि)
  • लंबित पृष्ठभूमि कार्यों की संख्या (यदि लागू हो)।
  • शायद अधिकतर कम उपयोग की गई कार्यक्षमताओं पर एप्लिकेशन का उपयोग ट्रैक और रिपोर्ट आंकड़े ट्रैक करें ताकि आपको पता चले कि अनुकूलन सबसे अधिक फायदेमंद हैं।
+0

आप "असामान्य" को कैसे परिभाषित करते हैं? –

+0

यह एप्लिकेशन पर निर्भर करता है, लेकिन मूल रूप से मुझे एक विशिष्ट अवधि (5 मिनट कहने) पर औसत उपयोग मिल जाएगा, और यदि यह एक्स (90% सीपीयू, 1 गीगा मेमोरी, 200 केबीपीएस से अधिक है ... ये मान वास्तव में निर्भर हैं ऐप पर), इसकी रिपोर्ट करें। –

1

न्यूनतम के बारे में पता करने के लिए अच्छा है: सुनिश्चित करें कि यह चल रहा है :)

हालांकि , कुछ अन्य सामान बहुत उपयोगी होगा। उदाहरण के लिए, सीपीयू लोड, रैम उपयोग और (बहुउद्देशीय प्रणालियों में) जो उपयोगकर्ता चल रहा है। साथ ही, उन अनुप्रयोगों के लिए जो नेटवर्क तक पहुंचते हैं, प्रत्येक ऐप के लिए नेटवर्क कनेक्शन की एक सूची। और (यदि आपके पास क्लाइंट कंप्यूटर तक पहुंच है) तो ऐप के 'विंडो शीर्षक' को देखने में सक्षम होना अच्छा होगा - अगर यह बदल जाता है और इसे सहेजता है तो प्रत्येक 2-3 मिनट की जांच करें। साथ ही, एप्लिकेशन द्वारा खुली फाइलों की एक सूची बहुत उपयोगी हो सकती है, लेकिन यह जरूरी नहीं है।

+0

अपाचे, एक्सचेंज और अन्य सामान्य सेवाओं की निगरानी के लिए, नागियो (ओपन सोर्स) जैसे सॉफ़्टवेयर पर नज़र डालें जो पहले से ही सभी काम करता है। बस स्थापित करें, कॉन्फ़िगर करें और आनंद लें। –

2

उत्तर 'यह निर्भर करता है'। आपको निगरानी करने की आवश्यकता क्यों है? आपके ऑपरेशन स्टाफ कितने बड़े हैं? क्या आपको रिपोर्टिंग की आवश्यकता है? एप्लिकेशन पर्यावरण क्या है? एप्लिकेशन पर असफल होने पर कौन परवाह करता है? अगर कोई अपवाद होता है तो कौन परवाह करता है? क्या कोई भी त्रुटि पुनर्प्राप्त करने योग्य है? मैं इस तरह के प्रश्नों को लंबे समय से पूछ सकता हूं।

+0

कृपया जारी रखें ... –

+0

[@ डेविड मेडिनेट्स]: "आपको मॉनिटर करने की आवश्यकता क्यों है" के लिए जवाब है: समर्थन के बारे में सक्रिय होने के लिए, यानी यह जानने के लिए कि तुरंत कुछ गलत हो जाता है, इसलिए हम इसे –

1

मुझे लगता है कि यह काफी सरल है - मॉनिटर ताकि आपको कुछ गलत होने से पहले पर्याप्त चेतावनी दी जा सके। इसका मतलब मॉनीटर निर्भरता और एप्लिकेशन ही है।

यदि आप उस एप्लिकेशन पर विवरण देने वाले नहीं हैं, तो आप सामान्य नियम के रूप में उपयोग करना चाहते हैं, तो यह विशिष्ट रूप से प्रदान करना मुश्किल है।

+0

ठीक कर सकते हैं मेरी परियोजना .NET अनुप्रयोगों की निगरानी के लिए एक प्रणाली है - सभी प्रकार के –

2

यह एक खुला खुला प्रश्न है, लेकिन मैं भौतिक माप से शुरू करूंगा।
1. क्या सभी मशीनें मुझे लगता है कि इस साइट को पिंगेबल होस्ट कर रहे हैं।
2. क्या वे सभी मशीनें हैं जो कुछ सामग्री की सेवा करने वाली सामग्री की सेवा करनी चाहिए। (आदर्श रूप से यह बाहरी नेटवर्क से मारा जाएगा।
3. प्रत्येक मशीन पर प्रत्येक अपेक्षित सेवा
3a चल रही है। क्या ये सेवाएं हाल ही में चल रही हैं?
4।क्या प्रत्येक मशीन में हार्ड ड्राइव स्पेस छोड़ा गया है? (डीबी को मत भूलना)
5. क्या इन मशीनों का बैक अप लिया गया है? पिछली बार कब था?

एक बार सिस्टम की भौतिक निगरानी को बाहर करने के बाद, कोई सिस्टम के लिए विशिष्ट लोगों को संबोधित कर सकता है?

1. क्या स्वचालित स्क्रिप्ट लॉग इन कर सकती है? इसके लिए कितना समय लगा?
2. कितने उपयोगकर्ता लाइव हैं? क्या लाखों नकली खाते जोड़े गए हैं?
...
इस तरह के प्रश्न अधिक घबराहट हो जाते हैं, और यह बहुत ही प्रणाली विशिष्ट हो सकता है। Phsyical माप का जवाब देते समय वे आमतौर पर प्रतिक्रियात्मक रूप से व्युत्पन्न किया जा सकता है। हार्ड ड्राइव भरें, शायद वेब सर्वर लॉग भर गए हैं क्योंकि एजेंटों के समूह ने बहुत सारे नकली उपयोगकर्ताओं को बनाया है। उस तरह की चीस।

जबकि योजना ए अनिवार्य रूप से प्रतिक्रियाशील नहीं होना चाहिए, वैसे ही यह साइट एक निगरानी प्रणाली स्थापित करने का तरीका है।

+0

उत्कृष्ट अंक, लेकिन प्रत्येक मशीन पर चल रहे अनुप्रयोगों के बारे में क्या? –

1

कम से कम आप यह जानना चाहते हैं कि सिस्टम स्वस्थ है। यह आपकी प्रणाली को परिभाषित करने में व्यक्तिपरक है। क्या यह कंप्यूटर ऊपर है, आवश्यक संसाधन मौजूद हैं, डेटा सिस्टम के माध्यम से बह रहा है, डेटा सही ढंग से परिणाम, आदि इत्यादि का उत्पादन कर रहा है।

मेरी परियोजना में हम इनमें से अधिकांश की निगरानी करते हैं और फिर कुछ। यह वास्तव में नीचे आता है कि उच्चतम स्तर क्या है जिसका उपयोग आप यह विश्लेषण करने के लिए कर सकते हैं कि सबकुछ काम कर रहा है। हमारे मामले में हमें डेटा आउटपुट को जानना होगा। यदि आपको बस इन मशीनों को जानने की आवश्यकता है, तो यह आपको एक अनुभवहीन अंत उपयोगकर्ता को गलत दिखाने का प्रयास करने पर बचाता है।

"शेल्फ से बाहर" उपकरण भी हैं जो आपके लिए बहुत मेहनत करेंगे यदि आप डेटा परिणामों में बहुत कठिन लग रहे हैं। मुझे विशेष रूप से Nagios पसंद आया जब मैं चारों ओर देख रहा था लेकिन हमें आसानी से दिखाने की आवश्यकता थी इसलिए मैंने अपनी निगरानी प्रणाली लिखी। असल में हम सिस्टम, मेमोरी/सीपीयू स्पाइक्स इत्यादि में "विशिष्टताओं" के लिए भी देखते हैं ...

+0

नागीओस - कई अन्य लोगों की तरह - केवल 'बुनियादी ढांचे' अनुप्रयोगों पर नज़र रखता है, व्यक्तिगत अनुप्रयोग नहीं। यह सुनिश्चित करने के लिए आपको क्या चाहिए कि आपके उपयोगकर्ता के कार्यक्रम 'स्वस्थ' हैं? –

1

इनपुट के लिए सभी को धन्यवाद, मैं वास्तव में बुनियादी स्तर की निगरानी के लिए आवेदन-स्तरीय निगरानी की तलाश में था, लेकिन यह जानना अच्छा है दोनों

के बारे में अंतर है:

  • बुनियादी सुविधाओं की निगरानी सर्वर प्लस एमएस एक्सचेंज सर्वर, अपाचे, आईआईएस, और इसके आगे
  • आवेदन निगरानी होगा उपयोगकर्ता मशीनों और विशिष्ट कार्यक्रमों है कि वे करने के लिए उपयोग किया जाएगा अपनी नौकरियां, और/या सर्वर के साथ-साथ डेटा-चलती/बैकएंड अनुप्रयोग जो वे

कभी-कभी लाइन को आकर्षित करना मुश्किल होता है - एक ओवरम्प्लीफाइड परिभाषा "हो सकती है, यदि आपकी टीम ने इसे लिखा है, तो यह एक आवेदन है; यदि आप इसे खरीदा है, यह बुनियादी ढांचे "

व्यवहार में मुझे लगता है कि यह सबसे अच्छा है दोनों

1

आपको क्या करने की जरूरत है आवेदन के व्यापार प्रक्रिया को तोड़ने के लिए और फिर सॉफ्टवेयर प्रमुख पर घटनाओं फेंकना है पर नजर रखने के इसके अलावा, आपको सिंथेटिक लेन-देन को समाप्त करने की आवश्यकता होगी (उदाहरण के लिए। वेबसाइट पर क्लिक करने वाले अंतिम उपयोगकर्ताओं को अनुकरण करना)। वह डेटा एक निगरानी उपकरण में खिलाया जाएगा। अतीत में, मैंने जेएमएक्स किया है जिनके आवेदन टिवोली मॉनिटरिंग के जेएमएक्स एडाप्टर में बह गए और फिर मैंने स्क्रिप्ट्स की हैं जो "नकली उपयोगकर्ता" को लागू करते हैं और फिर परिणामों में पाइपोली मॉनिटरिंग स्क्रिप्ट एडाप्टर में पाइप करते हैं। टिवोली मॉनीटरिंग डेटा लेता है और फिर उस से एप्लिकेशन स्वास्थ्य और प्रदर्शन चार्ट बनाता है कच्चा डेटा।

+0

दिलचस्प - लेकिन मैं परिणामों को अनुकरण करने की कोशिश नहीं कर रहा हूं, मैं वास्तविक समय पर वास्तविक परिणाम की निगरानी करने की कोशिश कर रहा हूं –

+0

निगरानी वास्तविक समय है ... अनुकरण भाग वास्तविक समय निगरानी में डेटा बहने वाला था डैशबोर्ड। –

2

शानदार सवाल।

हम कुछ समय पहले बिना किसी किस्मत के हमारी आवश्यकताओं के लिए कुछ एप्लिकेशन-स्तरीय निगरानी समाधान की तलाश में हैं। लोकप्रिय निगरानी समाधान ज्यादातर बुनियादी ढांचे की निगरानी के लिए संबोधित किए जाते हैं और - मेरी राय में - वे छोटी और मध्यम आकार की कंपनियों की आवश्यकताओं के लिए बहुत जटिल हैं।

हम आवश्यक (मुख्य रूप से) निम्नलिखित विशेषताएं:

  • अलर्ट - हम के रूप में तेजी से संभव
  • दर्दरहित प्रबंधन के रूप में के बारे में घटना में जानना चाहता था - होस्ट की गई सेवा सबसे अच्छा
  • दृश्यावलोकन wouldbe - यह अच्छा है यह जानने के लिए कि क्या हो रहा है और डेटा से कुछ ज्ञान लें

क्योंकि हमें उपयुक्त soluti नहीं मिला हमने अपना खुद लिखना शुरू कर दिया। अंत में हम AlertGrid नामक अप-एंड-रनिंग सेवा के साथ समाप्त हो गए हैं। (आप इसे मुफ्त में देख सकते हैं।)

इसके पीछे विचार कस्टम निगरानी परिदृश्यों को संभालने का एक आसान तरीका प्रदान करना है। एकीकरण API बहुत सरल है (दो आवश्यक पैरामीटर वाले एक समारोह)।

  • पर नजर रखने के लिए निर्धारित कार्यों (क्रॉन नौकरियों)
  • पर नजर रखने के पूरे आवेदन तर्क निष्पादन
  • त्रुटियों पर आवेदन
  • हम भी उदाहरण पर काम कर रहे में चेतावनी: momment में हम और दूसरों के लिए यह प्रयोग कर रहे हैं अलर्टग्रिड