मैं जानने के लिए उत्सुक था अगर वहाँ किसी भी जैव सूचना विज्ञान उपकरण एक multiFASTA फ़ाइल मुझे आदि दृश्यों की संख्या, लंबाई, न्यूक्लियोटाइड/aminoacid सामग्री, जैसे infos दे प्रोसेस करने में सक्षम हो सकत
मैं पहले से ही गठबंधन अनुक्रमों को स्कोर करने का प्रयास करता हूं। कहना seq1 = 'PAVKDLGAEG-ASDKGT--SHVVY----------TI-QLASTFE'
seq2 = 'PAVEDLGATG-ANDKGT--LYNIYARNTEGHPRSTV-QLGSTFE'
दिए गए मापदंडों su
में एक खुले पठन फ्रेम को कैसे ढूंढें I ORF (खुली पठन फ्रेम) खोजने के लिए पाइथन और नियमित अभिव्यक्ति का उपयोग कर रहा हूं। एक उप-स्ट्रिंग एक स्ट्रिंग है केवल अक्षर ATGC (कोई रिक्तियों या नई रेखाओं) कि स