2011-12-29 9 views
8

किसी अनुप्रयोग सर्वर पर एक x64 dotnet सेवा को क्रैश करने में समस्याएं आ रही हैं। सेवा बिना किसी समस्या के घंटों, दिन या सप्ताह तक चल सकती है, लेकिन फिर अधिक जानकारी के साथ खत्म हो जाती है।WinDbg: शिकार अपवाद जो किसी .net सेवा को क्रैश करने के लिए

सेवा दो सर्वरों में क्लस्टर (3 एक्स सेवा प्रत्येक सर्वर) में चलती है - और दोनों सर्वरों पर किसी भी सेवा के क्रैश को देखा गया है। एक प्रतिकृति वातावरण एक ही व्यवहार दिखाता है, इसलिए मैंने कॉन्फ़िगरेशन समस्या के विचार को 'थका दिया' है।

मूल रूप से आवेदन सर्वर के ईवेंट लॉग से खींचा त्रुटि थी:

Error message from event log on server XXXX 

Application: MySvc.exe 
Framework Version: v4.0.30319 
Description: The process was terminated due to an internal error in the .NET Runtime 
at IP 000007FEEFD8CD4C (000007FEEFC70000) with exit code 80131506 

यह अधिक से अधिक विवरण और सबसे अच्छा संकेत मैं ऑनलाइन पाया है प्रदर्शित नहीं करता है करने के लिए 'पार उंगलियों' ...

है

Application Crashes With "Internal Error In The .NET Runtime"

http://www.jamesewelch.com/2010/09/30/troubleshooting-internal-error-in-the-net-runtime/

अंत के बाद AdPlus डीबगर के साथ चल रहा है के एक महीने हम संलग्न असफलताओं और कुछ क्रैश डंप की एक स्ट्रिंग है। अब जब मुझे डंप हैं तो मुझे उनसे कुछ भी उपयोग करने में परेशानी हो रही है।

मैंने पहले सफलतापूर्वक कुछ 'हैंग' डंप की जांच की है और टेस फेरांडेज़ के ब्लॉगों को दूसरों के बीच पढ़ा है, लेकिन 'क्रैश' डंप मैं मर चुका हूं। कचरा संग्रह & केवल मुख्य धागे शेष के लिए चिह्नित अधिकांश ऑब्जेक्ट्स, अपवाद आदि - मुझे शायद कुछ याद आ रहा है।

मैं विस्तार से जोड़ूंगा! विश्लेषण -v और डंप लॉग भी - जो अपवाद दिखाते हैं।

तो - इस पर असली सवाल यह है: क्या कोई मुझे यहां से कहां से जाने के लिए कुछ संकेत दे सकता है। डंप लॉग में अपवाद वास्तविक डंप में जो देख सकते हैं उससे मेल नहीं खाते हैं।

DUMP 1 लॉग यहाँ लाभ: http://pastebin.com/Eg5YCqww

DUMP 1 विश्लेषण करें:

0:000> !analyze -v 
*** 
FAULTING_IP: 
+112c9440 
00000000`00000000 ??    ??? 

EXCEPTION_RECORD: ffffffffffffffff -- (.exr 0xffffffffffffffff) 
ExceptionAddress: 0000000000000000 
    ExceptionCode: 80000003 (Break instruction exception) 
    ExceptionFlags: 00000000 
NumberParameters: 0 

FAULTING_THREAD: 00000000000011f8 

PROCESS_NAME: MySvc.exe 

ERROR_CODE: (NTSTATUS) 0x80000003 - {EXCEPTION} Breakpoint A breakpoint has been reached. 

EXCEPTION_CODE: (HRESULT) 0x80000003 (2147483651) - One or more arguments are invalid 

MOD_LIST: <ANALYSIS/> 

NTGLOBALFLAG: 0 

APPLICATION_VERIFIER_FLAGS: 0 

MANAGED_STACK: 
(TransitionMU) 
000000000022EBB0 000007FEF40CB1AB System_ServiceProcess_ni!DomainBoundILStubClass.IL_STUB_PInvoke(IntPtr)+0x3b 
000000000022EC70 000007FEF40CD20D System_ServiceProcess_ni!System.ServiceProcess.ServiceBase.Run(System.ServiceProcess.ServiceBase[])+0x26d 
000000000022EDA0 000007FF00170227 MySvc!Ax.Remoting.MySvc.Main()+0x107 
(TransitionUM) 

MANAGED_STACK_COMMAND: _EFN_StackTrace 

BUGCHECK_STR: APPLICATION_FAULT_WRONG_SYMBOLS_FILL_PATTERN_ffffffff 

PRIMARY_PROBLEM_CLASS: WRONG_SYMBOLS_FILL_PATTERN_ffffffff 

DEFAULT_BUCKET_ID: WRONG_SYMBOLS_FILL_PATTERN_ffffffff 

LAST_CONTROL_TRANSFER: from 000007fefd8810ac to 000000007760f6fa 

STACK_TEXT: 
00000000`0022e818 000007fe`fd8810ac : 00000000`007541f0 000007fe`f40ce089 00000000`0022e9c0 00000000`00000000 : ntdll!ZwWaitForSingleObject+0xa 
00000000`0022e820 000007fe`fe7daffb : 00000000`ffffffff 000007fe`fe7d344c 00000000`00000000 00000000`0000032c : KERNELBASE!WaitForSingleObjectEx+0x79 
00000000`0022e8c0 000007fe`fe7d9d61 : 00000000`01d47ff0 00000000`0000032c 00000000`00000000 00000000`00000000 : sechost!ScSendResponseReceiveControls+0x13b 
00000000`0022e9b0 000007fe`fe7d9c16 : 00000000`0022eb18 00000000`00000000 00000000`00000000 000007fe`00000000 : sechost!ScDispatcherLoop+0x121 
00000000`0022eac0 000007fe`f19017c7 : 00000000`11213890 00000000`01d635c0 00000000`00000000 00000000`00000000 : sechost!StartServiceCtrlDispatcherW+0x14e 
00000000`0022eb10 000007fe`f40cb1ab : 00000000`01d63680 00000000`0022ebe8 000007fe`f40a5b50 0000bf6c`4589127e : clr!DoNDirectCall__PatchGetThreadCall+0x7b 
00000000`0022ebb0 000007fe`f40cd20d : 00000000`01d63680 00000000`00000000 00000000`01d63698 00000000`00000000 : System_ServiceProcess_ni+0x2b1ab 
00000000`0022ec70 000007ff`00170227 : 00000000`10ff1ac8 00000000`10ff1af0 00000000`10ff1af0 00000000`10ff1af0 : System_ServiceProcess_ni+0x2d20d 
00000000`0022eda0 000007fe`f196dc54 : 00000000`0022ee80 000007fe`f1904e65 ffffffff`fffffffe 00000000`0022f3a0 : 0x7ff`00170227 
00000000`0022ee30 000007fe`f196dd69 : 000007ff`000551f8 00000000`00000001 00000000`00000000 00000000`00000000 : clr!CallDescrWorker+0x84 
00000000`0022ee70 000007fe`f196dde5 : 00000000`0022ef88 00000000`00000000 00000000`0022ef90 00000000`0022f168 : clr!CallDescrWorkerWithHandler+0xa9 
00000000`0022eef0 000007fe`f1a214c5 : 00000000`00000000 00000000`0022f178 00000000`00000000 00000000`00000000 : clr!MethodDesc::CallDescr+0x2a1 
00000000`0022f120 000007fe`f1a215fc : 00000000`000ad7c0 00000000`000ad7c0 00000000`00000000 00000000`00000000 : clr!ClassLoader::RunMain+0x228 
00000000`0022f370 000007fe`f1a213b2 : 00000000`0022f970 00000000`00000200 00000000`000b7a80 00000000`00000200 : clr!Assembly::ExecuteMainMethod+0xac 
00000000`0022f620 000007fe`f1ac6d66 : 00000000`00000000 00000000`10fd0000 00000000`00000000 00000000`00000000 : clr!SystemDomain::ExecuteMainMethod+0x452 
00000000`0022fbd0 000007fe`f1ac6c83 : 00000000`10fd0000 00000000`00000000 00000000`00000000 00000000`00000000 : clr!ExecuteEXE+0x43 
00000000`0022fc30 000007fe`f1a2c515 : 00000000`000ad7c0 ffffffff`ffffffff 00000000`00000000 00000000`00000000 : clr!CorExeMainInternal+0xc4 
00000000`0022fca0 000007fe`f8973309 : 00000000`00000000 00000000`00000000 00000000`00000000 00000000`0022fc88 : clr!CorExeMain+0x15 
00000000`0022fce0 000007fe`f8a05b21 : 000007fe`f1a2c500 000007fe`f89732c0 00000000`00000000 00000000`00000000 : mscoreei!CorExeMain+0x41 
00000000`0022fd10 00000000`773bf56d : 000007fe`f8970000 00000000`00000000 00000000`00000000 00000000`00000000 : mscoree!CorExeMain_Exported+0x57 
00000000`0022fd40 00000000`775f2cc1 : 00000000`00000000 00000000`00000000 00000000`00000000 00000000`00000000 : kernel32!BaseThreadInitThunk+0xd 
00000000`0022fd70 00000000`00000000 : 00000000`00000000 00000000`00000000 00000000`00000000 00000000`00000000 : ntdll!RtlUserThreadStart+0x1d 


STACK_COMMAND: ~0s; .ecxr ; kb 

FOLLOWUP_IP: 
sechost!ScSendResponseReceiveControls+13b 
000007fe`fe7daffb 85c0   test eax,eax 

SYMBOL_STACK_INDEX: 2 

SYMBOL_NAME: sechost!ScSendResponseReceiveControls+13b 

FOLLOWUP_NAME: MachineOwner 

MODULE_NAME: sechost 

IMAGE_NAME: sechost.dll 

DEBUG_FLR_IMAGE_TIMESTAMP: 4a5be05e 

FAILURE_BUCKET_ID: WRONG_SYMBOLS_FILL_PATTERN_ffffffff_80000003_sechost.dll!ScSendResponseReceiveControls 

BUCKET_ID: X64_APPLICATION_FAULT_WRONG_SYMBOLS_FILL_PATTERN_ffffffff_sechost!ScSendResponseReceiveControls+13b 

अद्यतन 1 (29 दिसंबर) (मैं एक प्रतीक मुद्दा मैं हल नहीं कर सकते .. है):

डंप लॉग से सीएलआर अपवादों में से एक को पुनर्निर्मित किया गया, कॉल स्टैक निम्नानुसार है। अपवाद की तरह लग रहा है जब डीबी (ODAC के माध्यम से) बुला

clr!RaiseTheExceptionInternalOnly+0x363 
clr!IL_Throw+0x146 
gm.a(System.String, System.String, Int32, System.String, XXBase, Int32, XXDataParameter[]) 
gm.b(XXBase, XXBase, Boolean, Boolean, Boolean, Int32) 
gm.b(XXBase, XXBase) 
od.a(XXGridQueue, TaskStatus, ProcessResult, Int32, Int32, Int32) 
od.b(XXGridQueue) 
he.b(XXBaseCollection) 
he.a(Boolean ByRef) 
XX.MySvc.tmr_Elapsed(System.Object) 
System.Threading.ExecutionContext.Run(System.Threading.ExecutionContext, System.Threading.ContextCallback, System.Object, Boolean) 

से पुन: पहुँच उल्लंघन अपवाद कॉल स्टैक होता है। ODAC लाइब्रेरी के कॉल होने के बाद कचरा कलेक्टर को कॉल करते समय त्रुटि फेंक दी जाती है। (नई जानकारी से)

(1330.1074): Access violation - code c0000005 (first chance) 
FirstChance_av_AccessViolation 

clr!WKS::gc_heap::plan_phase+0x5ac 
clr!WKS::gc_heap::gc1+0xbb 
clr!WKS::gc_heap::garbage_collect+0x276 
clr!WKS::GCHeap::GarbageCollectGeneration+0x14e 
clr!WKS::gc_heap::try_allocate_more_space+0x25f 
clr!WKS::GCHeap::Alloc+0x7e 
clr!FastAllocatePrimitiveArray+0xc5 
clr!JIT_NewArr1+0x389 
System.Decimal.GetBits(System.Decimal) 
Oracle.DataAccess.Types.DecimalConv.GetDecimal(IntPtr) 
Oracle.DataAccess.Client.OracleDataReader.GetDecimal(Int32) 
Oracle.DataAccess.Client.OracleDataReader.GetValue(Int32) 
Oracle.DataAccess.Client.OracleDataReader.GetValues(System.Object[]) 
jr.a(System.Data.IDataReader, Boolean, ku, Boolean, DbTypeEnum, System.Type[]) 
ls.a(System.Data.IDataReader, Boolean, ku, Boolean, DbTypeEnum, System.Type[]) 
ba.a(System.String, System.Data.IDataReader, Boolean, ku, Boolean, System.Type[]) 
... 
XX.MySvc.tmr_Elapsed(System.Object) 

संभव इसी तरह के मुद्दों: http://markmail.org/message/yy3mvbngula4i3mu#query:+page:1+mid:l546gn5sfxtxxm5i+state:results http://social.msdn.microsoft.com/Forums/en/clr/thread/33920b39-690c-42c8-b04a-0f1f7176835a

अद्यतन 2 (23 फरवरी):

ODAC घटकों DotNet 4.0 के लिए सही संस्करण में अपग्रेड कर रहे थे (या जो ओरेकल वेबसाइट पर संगत के रूप में सूचीबद्ध है) और मुद्दा अभी भी फिर से हुआ है।यह अभी भी एक या दो हफ्तों में एक बहुत ही अड़चन फैशन में फिर से होता है। जो सेवा होती है वह हर दिन साइकिल चलती है।

हाल के दुर्घटनाओं से कुछ और डंप हैं, और ये अभी भी भ्रष्टाचार को ढेर करने के लिए इंगित करते हैं - हालांकि पूर्ण डंप नहीं हैं (प्रवेश उल्लंघन)। असल में ऐसा लगता है कि पूर्ण डंप विफल रहा है।

Creating d:\dumps\2xx_Crash_Mode\FULLDUMP_FirstChance_epr_Process_Shut_Down_MySvc.exe__0344.dmp - mini user dump 
WriteFullMemory.Memory.Read(0x262c000, 0x1000) failed 0x8007012b, ABORT. 
Dump creation failed, Win32 error 0n299 
    "Only part of a ReadProcessMemory or WriteProcessMemory request was completed." 

साथ ही एक कस्टम कामयाब (डॉटनैट) पुस्तकालय आवेदन में लोड किया जाता है, और यह भी, हालांकि यह सिर्फ एक 'पहला मौका' है एक अपवाद फेंकने किया जा रहा है, और इस प्रक्रिया विफलता का कारण बन प्रतीत नहीं होता है (मुझे लगता है कि यह एक कारक हो सकता है)। यह वास्तव में हमारी लाइब्रेरी भी है, इसलिए मैं यह सत्यापित करने में सक्षम हूं कि यह प्रबंधित कोड को कॉल नहीं कर रहा है। त्रुटि है:

EXCEPTION_RECORD: ffffffffffffffff -- (.exr 0xffffffffffffffff) 
ExceptionAddress: 000007fefcffaa7d (KERNELBASE!RaiseException+0x0000000000000039) 
ExceptionCode: c0000006 (In-page I/O error) 
ExceptionFlags: 00000000 
NumberParameters: 3 
Parameter[0]: 0000000000000000 
Parameter[1]: 000000006d34aca0 
Parameter[2]: 00000000c00000c4 
Inpage operation failed at 000000006d34aca0, due to I/O error 00000000c00000c4 

PROCESS_NAME: MySvc.exe 

ERROR_CODE: (NTSTATUS) 0xc0000006 - The instruction at 0x%p referenced memory at 0x%p. The required data was not placed into memory because of an I/O error status of 0x%x. 

EXCEPTION_OBJECT: !pe 1a8106a8 
Exception object: 000000001a8106a8 
Exception type: System.Runtime.InteropServices.SEHException 
Message:   External component has thrown an exception. 
InnerException: <none> 
StackTrace (generated): 
SP    IP    Function 
000000002C77B980 0000000000000000 ... 
000000002C77BA50 000007FF01DCBA51 ... 

StackTraceString: <none> 
HResult: 80004005 

MANAGED_OBJECT: !dumpobj 148306f8 
Name:  System.String 
MethodTable: 000007feed9a6870 
EEClass:  000007feed52ed58 
Size:  112(0x70) bytes 
File:  C:\Windows\Microsoft.Net\assembly\GAC_64\mscorlib\v4.0_4.0.0.0__b77a5c561934e089\mscorlib.dll 
String:  External component has thrown an exception. 
Fields: 
       MT Field Offset     Type VT  Attr   Value Name 
0000000000000000 4000103  8   System.Int32 1 instance    43 m_stringLength 
0000000000000000 4000104  c   System.Char 1 instance    45 m_firstChar 
000007feed9a6870 4000105  10  System.String 0 shared   static Empty 
          >> Domain:Value 00000000002a69f0:NotInit 000000000dd738d0:NotInit << 

EXCEPTION_MESSAGE: External component has thrown an exception. 

MANAGED_OBJECT_NAME: System.Runtime.InteropServices.SEHException 

MANAGED_STACK_COMMAND: !pe 1a8106a8 

LAST_CONTROL_TRANSFER: from 000007fef47e8fc1 to 000007fefcffaa7d 

ADDITIONAL_DEBUG_TEXT: Followup set based on attribute [Is_ChosenCrashFollowupThread] from Frame:[0] on thread:[PSEUDO_THREAD] ; Followup set based on attribute [ip_is_call_value_Arch_si] from Frame:[23] on thread:[162c] 

FAULTING_THREAD: ffffffffffffffff 

BUGCHECK_STR: APPLICATION_FAULT__SYSTEM.RUNTIME.INTEROPSERVICES.SEHEXCEPTION_APPLICATION_FAULT_CALL 

PRIMARY_PROBLEM_CLASS: _SYSTEM.RUNTIME.INTEROPSERVICES.SEHEXCEPTION_CALL 

DEFAULT_BUCKET_ID: _SYSTEM.RUNTIME.INTEROPSERVICES.SEHEXCEPTION_CALL 

STACK_TEXT: 
00000000`2c77b980 00000000`00000000 ... 
00000000`2c77ba50 00000000`ffffffff ... 

कैसे एक समीचीन फैशन में इस आगे आगे बढ़ाने के लिए के किसी भी विचारों के साथ किसी भी एक। मैं कुछ और पूर्ण डंप प्राप्त करने के लिए उत्सुक हूं - लेकिन निश्चित रूप से अगली विफलता की तुलना में उत्तर खोजने की आवश्यकता है !!

+0

टेस का ब्लॉग जानकारी देखने के लिए जगह है। क्या आपको इससे कुछ नहीं मिला? –

+0

क्या आप अप्रबंधित कोड के साथ किसी भी घटक/डीएलएल का उपयोग कर रहे हैं? – Yahia

+0

यह लगभग निश्चित रूप से अप्रबंधित कोड होने जा रहा है जो आपकी मेमोरी स्पेस को खराब कर रहा है। यह डरने के लिए शायद यह सही दर्द होगा। क्या आपने किसी तीसरे पक्ष से एक डीएल अपडेट किया है, या हाल ही में अपने स्वयं के अप्रबंधित कोड को बदल दिया है? क्या यह 32 बिट सिस्टम पर खुशी से चलता है? –

उत्तर

0

आपके क्रैश (ब्रेक पॉइंट हिट) का कारण प्रक्रिया में ढेर भ्रष्टाचार का संकेत देता है। एक डीबग ब्रेक जारी करके ढेर प्रबंधन कार्यों द्वारा हीप भ्रष्टाचार विफलताओं की सूचना दी जाती है।

लॉग त्रुटियों से जुड़ाव, .NET रनटाइम इन्हें संभालने के लिए तैयार नहीं है (मैं गलत हो सकता हूं और बेहतर स्पष्टीकरण हो सकता है)। ढेर भ्रष्टाचार को ट्रैक करने का सामान्य तरीका (पूर्ण) पृष्ठ ढेर सक्षम कर रहा है जो भ्रष्टाचार के बिंदु के करीब प्रक्रिया को दुर्घटनाग्रस्त करके अपमानजनक घटक का पता लगाने में मदद करता है।

एक ढेर भ्रष्टाचार को कम करना कम से कम कहने का असली दर्द है, लेकिन अगर स्मृति खपत इसे अनुमति देता है, तो मैं पूर्ण पृष्ठ ढेर के साथ मध्यम स्मृति आवश्यकताओं वाले ऐप्स के लिए सबसे प्रभावी होने के साथ जाऊंगा।

उम्मीद है कि यह मदद करता है।

+0

धन्यवाद। इसके अतिरिक्त यहां पर एक अच्छा ब्लॉग है: http://blogs.msdn.com/b/tess/archive/2006/02/09/net-crash-managed-heap-corruption-calling-unmanaged-code.aspx – glendon

+0

दिलचस्प - ओडीएसी 11.1.0.7/x64/.NET 4 का उपयोग करें - प्रलेखन की तरह दिखता है यह नया 11.2.0.1.2 संस्करण होना चाहिए - लेकिन इस तरह की त्रुटियों के कारण केवल एक उदाहरण (उपरोक्त लिंक) मिल सकता है। – glendon

0

x64 .NET 4.0 का जीसी एक बग है। यह हो सकता है कि आप इससे प्रभावित हैं। एमएस समवर्ती जीसी को तब तक अक्षम करने की सिफारिश करता है जब तक उन्हें हॉटफिक्स नहीं मिल जाता। वैकल्पिक रूप से आप सर्वर जीसी को प्रति कोर एक जीसी थ्रेड प्राप्त करने में सक्षम कर सकते हैं, यदि आपके पास एक से अधिक कोर हैं तो संभव है।

अन्यथा सर्वर जीसी ध्वज का कोई प्रभाव नहीं पड़ेगा।

यहाँ चीजों 1. की KB article.

0

युगल लिंक सुनिश्चित करें कि आप clr का नवीनतम संस्करण चला रहे 2. देशी ढेर भ्रष्टाचार pageheap के लिए एक अच्छा विकल्प है और प्रबंधित करने के लिए आप की कोशिश कर सकते हो सकता है सुनिश्चित है जीसीस्ट्रेस How to turn GCStress on in Windows 7? 3. प्रबंधित ढेर पर ढेर भ्रष्टाचार को सत्यापित करने के लिए आप एसओएस https://msdn.microsoft.com/en-us/library/bb190764(v=vs.110).aspx का हिस्सा सत्यापित सत्यापन का उपयोग कर सकते हैं "VerifyHeap भ्रष्टाचार के संकेतों के लिए कचरा कलेक्टर ढेर की जांच करता है और किसी भी त्रुटि को प्रदर्शित करता है। ढेर भ्रष्टाचार प्लेटफार्मों के आह्वान के कारण हो सकते हैं गलत तरीके से निर्मित हैं। "