2012-10-27 50 views
6

पर असेंबली का अनुवाद करना मैं संकलित सी में लिखे गए "बम" से जुड़े होमवर्क प्रोजेक्ट पर काम कर रहा हूं, जिसमें मुझे 5 स्ट्रिंग्स के साथ आने के लिए रिवर्स-इंजीनियर करना है जो बम के पांच चरणों में से प्रत्येक को निष्क्रिय करेगा। मैं अभी चरण 3 पर फंस गया हूं, असेंबली का अनुवाद करने की कोशिश कर रहा हूं (x86, AT & टी सिंटैक्स मुझे विश्वास है) उस समारोह के लिए जीडीबी द्वारा उत्पादित किया गया है। जो मैं अब तक समझने में सक्षम हूं वह यह है कि यह उपयोगकर्ता इनपुट के रूप में छः संख्याओं की एक स्ट्रिंग लेने की कोशिश कर रहा है और कुछ मानदंडों पर उनका न्याय करता है, लेकिन यही वह जगह है जहां मैं इसे खो रहा हूं। फ़ंक्शन निम्नानुसार है (इसके आगे मेरे प्रयास किए गए छद्म कोड अनुवाद के साथ)।स्यूडोकोड

0x08048816 <phase_3+0>: push %ebp 
0x08048817 <phase_3+1>: mov %esp,%ebp 
0x08048819 <phase_3+3>: push %edi 
0x0804881a <phase_3+4>: push %ebx 
0x0804881b <phase_3+5>: sub $0x30,%esp 
0x0804881e <phase_3+8>: lea -0x24(%ebp),%eax        
0x08048821 <phase_3+11>: mov %eax,0x4(%esp)       
0x08048825 <phase_3+15>: mov 0x8(%ebp),%eax       
0x08048828 <phase_3+18>: mov %eax,(%esp)        
0x0804882b <phase_3+21>: call 0x8048d2c <read_six_numbers> 
0x08048830 <phase_3+26>: mov -0x24(%ebp),%eax      eax = p1 
0x08048833 <phase_3+29>: cmp $0x1,%eax        if eax != 1 
0x08048836 <phase_3+32>: je  0x804883d <phase_3+39>     explode bomb 
0x08048838 <phase_3+34>: call 0x8048fec <explode_bomb>    else 
0x0804883d <phase_3+39>: movl $0x1,-0xc(%ebp)      ebp[-12] = 1 
0x08048844 <phase_3+46>: jmp 0x804888a <phase_3+116>    while ebp[-12] < 5 { 
0x08048846 <phase_3+48>: mov -0xc(%ebp),%eax       eax = ebp[-12] 
0x08048849 <phase_3+51>: mov -0x24(%ebp,%eax,4),%eax     {magic} 
0x0804884d <phase_3+55>: mov %eax,%ebx        ebx = eax 
0x0804884f <phase_3+57>: mov -0xc(%ebp),%eax       eax = ebp[-12] 
0x08048852 <phase_3+60>: sub $0x1,%eax         eax -= 1 
0x08048855 <phase_3+63>: mov -0x24(%ebp,%eax,4),%eax     {magic} 
0x08048859 <phase_3+67>: mov %eax,%edx        edx = eax 
0x0804885b <phase_3+69>: mov 0x804a6d8,%eax       eax = 0x804a6d8 
0x08048860 <phase_3+74>: mov $0xffffffff,%ecx      ecx = 255 
0x08048865 <phase_3+79>: mov %eax,-0x2c(%ebp)       ebp[-12] = eax 
0x08048868 <phase_3+82>: mov $0x0,%eax         eax = 0 
0x0804886d <phase_3+87>: cld       
0x0804886e <phase_3+88>: mov -0x2c(%ebp),%edi       edi = ebp[-12] 
0x08048871 <phase_3+91>: repnz scas %es:(%edi),%al      {deep magic} 
0x08048873 <phase_3+93>: mov %ecx,%eax        eax = ecx 
0x08048875 <phase_3+95>: not %eax          eax = -eax 
0x08048877 <phase_3+97>: sub $0x1,%eax         eax -= 1 
0x0804887a <phase_3+100>: imul %edx,%eax        eax *= edx 
0x0804887d <phase_3+103>: cmp %eax,%ebx        if (eax != ebx) 
0x0804887f <phase_3+105>: je  0x8048886 <phase_3+112>      explode_bomb 
0x08048881 <phase_3+107>: call 0x8048fec <explode_bomb>     else 
0x08048886 <phase_3+112>: addl $0x1,-0xc(%ebp)       ebp[-12] += 1 
0x0804888a <phase_3+116>: cmpl $0x5,-0xc(%ebp) 
0x0804888e <phase_3+120>: jle 0x8048846 <phase_3+48>    } 
0x08048890 <phase_3+122>: add $0x30,%esp 
0x08048893 <phase_3+125>: pop %ebx 
0x08048894 <phase_3+126>: pop %edi 
0x08048895 <phase_3+127>: pop %ebp 
0x08048896 <phase_3+128>: ret 

मैं इनमें से अधिकतर में कम से कम थोड़ा सा (हालांकि बहुत कुछ नहीं) विश्वास करता हूं; जिन रेखाओं को मैं पूरी तरह से सुनिश्चित करता हूं वे गलत हैं, जिन्हें वर्तमान में "जादू" के रूप में चिह्नित तीन पंक्तियां हैं - चरण_3 + 51, चरण_3 + 63, और चरण_3 + 9 1 (अजीब वाक्यविन्यास और repnz के साथ दो mov लाइनें)। मैंने या तो सिंटेक्स को ज्यादा नहीं देखा है और मैं यह नहीं समझ सकता कि उन्हें देखने के लिए किस खोज शब्द का उपयोग करना है।

इस पर मेरे प्रयास की कोई सामान्य (और/या गंभीर) आलोचनाएं? स्पष्ट जगहें जहां मैं रेल से बाहर जा रहा हूं? जाहिर है, चूंकि यह गृहकार्य है, मुझे किसी को जवाब देने के लिए किसी की आवश्यकता नहीं है; मैं सिर्फ यह जानना चाहता हूं कि मेरी व्याख्या आम तौर पर ध्वनि है (और उन तीन पंक्तियों का क्या मतलब है कि मैं परेशान हूं)।

किसी भी मदद के लिए बहुत बहुत धन्यवाद!

* संपादित करें ***

read_six_numbers समारोह के रूप में निम्नानुसार disassembles:

0x08048d2c <read_six_numbers+0>: push %ebp 
0x08048d2d <read_six_numbers+1>: mov %esp,%ebp 
0x08048d2f <read_six_numbers+3>: push %esi 
0x08048d30 <read_six_numbers+4>: push %ebx 
0x08048d31 <read_six_numbers+5>: sub $0x30,%esp 
0x08048d34 <read_six_numbers+8>: mov 0xc(%ebp),%eax 
0x08048d37 <read_six_numbers+11>: add $0x14,%eax 
0x08048d3a <read_six_numbers+14>: mov 0xc(%ebp),%edx 
0x08048d3d <read_six_numbers+17>: add $0x10,%edx 
0x08048d40 <read_six_numbers+20>: mov 0xc(%ebp),%ecx 
0x08048d43 <read_six_numbers+23>: add $0xc,%ecx 
0x08048d46 <read_six_numbers+26>: mov 0xc(%ebp),%ebx 
0x08048d49 <read_six_numbers+29>: add $0x8,%ebx 
0x08048d4c <read_six_numbers+32>: mov 0xc(%ebp),%esi 
0x08048d4f <read_six_numbers+35>: add $0x4,%esi 
0x08048d52 <read_six_numbers+38>: mov %eax,0x1c(%esp) 
0x08048d56 <read_six_numbers+42>: mov %edx,0x18(%esp) 
0x08048d5a <read_six_numbers+46>: mov %ecx,0x14(%esp) 
0x08048d5e <read_six_numbers+50>: mov %ebx,0x10(%esp) 
0x08048d62 <read_six_numbers+54>: mov %esi,0xc(%esp) 
0x08048d66 <read_six_numbers+58>: mov 0xc(%ebp),%eax 
0x08048d69 <read_six_numbers+61>: mov %eax,0x8(%esp) 
0x08048d6d <read_six_numbers+65>: movl $0x804965d,0x4(%esp) 
0x08048d75 <read_six_numbers+73>: mov 0x8(%ebp),%eax 
0x08048d78 <read_six_numbers+76>: mov %eax,(%esp) 
0x08048d7b <read_six_numbers+79>: call 0x80485a4 <[email protected]> 
0x08048d80 <read_six_numbers+84>: mov %eax,-0xc(%ebp) 
0x08048d83 <read_six_numbers+87>: cmpl $0x5,-0xc(%ebp) 
0x08048d87 <read_six_numbers+91>: jg  0x8048d8e <read_six_numbers+98> 
0x08048d89 <read_six_numbers+93>: call 0x8048fec <explode_bomb> 
0x08048d8e <read_six_numbers+98>: add $0x30,%esp 
0x08048d91 <read_six_numbers+101>: pop %ebx 
0x08048d92 <read_six_numbers+102>: pop %esi 
0x08048d93 <read_six_numbers+103>: pop %ebp 
0x08048d94 <read_six_numbers+104>: ret  
+1

यदि यह असेंबलर है ... क्या लोगों को वास्तुकला को जानने की आवश्यकता नहीं होगी? X86 की तरह? – FoolishSeth

+0

@FoolishSeth निश्चित रूप से x86 –

+0

प्रश्न में एक नोट जोड़ा गया - यह x86, एटी एंड टी वाक्यविन्यास है। – rosalindwills

उत्तर

7
mov -0x24(%ebp,%eax,4),%eax 

ऊपर दिए गए निर्देश एक सरणी का एक तत्व तक पहुँच रहा है। इसे स्केल, इंडेक्स, बेस के लिए x86 में संबोधित SIB कहा जाता है। ऑफसेट घटक भी है। सरणी बेस रजिस्टर (EBP) द्वारा निर्धारित पते पर आधारित है, साथ ही ऑफ़सेट (फ्रेम सूचक का उपयोग करते समय, स्थानीय चर, सरणी समेत, फ्रेम सूचक से ऑफसेट के रूप में संबोधित किया जाता है)। तत्व संख्या इंडेक्स रजिस्टर (EAX यहां) पर है। प्रत्येक तत्व का आकार स्केल द्वारा निर्धारित किया जाता है (4 यहां)।

mov 0x804a6d8,%eax 
mov $0xffffffff,%ecx 
mov %eax,-0x2c(%ebp) 
mov $0x0,%eax 
cld       
mov -0x2c(%ebp),%edi 
repnz scas %es:(%edi),%al 
mov %ecx,%eax 
not %eax 
sub $0x1,%eax 

यह सिर्फ strlen(0x805a6d8) है। ES:EDI0x804a6d8 पर स्कैन करने के लिए एक स्ट्रिंग को एक स्ट्रिंग (दोबारा संदर्भ बाइट की तुलना करें) पर इंगित करता है। AL में स्कैन करने के लिए वर्ण शामिल है: 0 - ASCII NULcld स्कैन के लिए दिशा निर्धारित करता है: आरोही (std स्कैन अवरोही कर देगा)। ECX को ~0 = -1 में प्रारंभ किया गया है: सभी बिट्स 1. repnzscas (SCAN STRING) निर्देश ECX को कम करने के निर्देश को दोहराता है जबकि ECX शून्य नहीं है (जो ऐसा नहीं होगा क्योंकि ईसीएक्स इसे रोकने के लिए काफी बड़ा है) और स्कैन सफल नहीं है (एनजेड, जबकि स्कैन (स्ट्रिंग और संदर्भ AL के बीच तुलना) शून्य ध्वज सेट नहीं किया था)। उसके बाद, ECX में -1-(steps in the scan) शामिल हैं। NOT बनाता है (steps in the scan)SUB बनाता है (steps in the scan) - 1 = (length of string not including the terminating NUL)http://www.int80h.org/strlen/ पर भी समझाया गया।

+0

वाह, धन्यवाद। यह बहुत उपयोगी है। आपका बहुत बहुत धन्यवाद! – rosalindwills