बाइट सरणी (लेक्सिकोग्राफिक)

के लिए जावा तुलनाकर्ता मेरे पास बाइट [] कुंजी के साथ हैशैप है। मैं इसे एक TreeMap के माध्यम से सॉर्ट करना चाहता हूं।बाइट सरणी (लेक्सिकोग्राफिक)

लेक्सिकोग्राफिक आदेश के लिए तुलनित्र को लागू करने का सबसे प्रभावी तरीका क्या है?

स्रोत

2011-02-24 marcorossi

Guava का उपयोग करके आप किसी का भी उपयोग कर सकते हैं:

UnsignedBytes तुलनित्र Unsafe कि इसे इस्तेमाल करता है, तो यह कर सकते हैं का उपयोग कर एक अनुकूलित प्रपत्र प्रतीत होता है। कोड में टिप्पणियां इंगित करती हैं कि यह सामान्य जावा कार्यान्वयन के रूप में कम से कम दोगुनी हो सकती है।

स्रोत

2011-02-24 17:49:57 ColinD

हम "जावा" में समाधान है, यदि ऐसा है तो एक काम उदाहरण पोस्ट करें। – Deepak

कॉलिन डी मेरे जवाब पर टिप्पणी में कहता है, मेरा समाधान गुवा में गैर अनुकूलित एक जैसा है। तो आप सीधे मेरा उपयोग कर सकते हैं, जो एक कामकाजी उदाहरण है, या कॉलिनडी के लिंक का पालन करें। – marcorossi

-2

आप एक तुलनित्र का उपयोग कर सकते हैं जो सरणी में प्रत्येक बाइट्स के Character.toLowerCase() को मानता है (बाइट [] एएससीआईआई में है) यदि आपको चरित्र को डीकोड करने या new String(bytes, charSet).toLowerCase() का उपयोग करने की आवश्यकता नहीं है, यह कुशल होने की संभावना नहीं है।

स्रोत

2011-02-24 17:25:14

-1

मुझे लगता है कि समस्या सिर्फ "बाइट बनाम बाइट" तुलना के साथ है। सरणी से निपटना सीधा है, इसलिए मैं इसे कवर नहीं करूँगा। बाइट बनाम बाइट के संबंध में, तो मेरा पहला विचार यह करने के लिए है:

public class ByteComparator implements Comparator<byte> { 
    public int compare(byte b1, byte b2) { 
    return new Byte(b1).compareTo(b2); 
    } 
}

लेकिन उस कोषगत नहीं होगा: 0xFF (-1 के लिए हस्ताक्षर किए बाइट) से छोटी 0x00 पर विचार किया जाएगा, जब कोषगत यह है बड़ा। मुझे लगता है कि इस चाल करना चाहिए:

public class ByteComparator implements Comparator<byte> { 
    public int compare(byte b1, byte b2) { 
    // convert to unsigned bytes (0 to 255) before comparing them. 
    int i1 = b1 < 0 ? 256 + b1 : b1; 
    int i2 = b2 < 0 ? 256 + b2 : b2; 
    return i2 - i1; 
    } 
}

शायद वहाँ अपाचे के कॉमन्स-लैंग या यह करता है कि आम-गणित पुस्तकालयों में कुछ है, लेकिन मैं इसे बंद हाथ पता नहीं है।

स्रोत

2011-02-24 17:40:17

अपाचे HBase में कोड का यह अच्छा टुकड़ा मिला:

public int compare(byte[] left, byte[] right) { 
     for (int i = 0, j = 0; i < left.length && j < right.length; i++, j++) { 
      int a = (left[i] & 0xff); 
      int b = (right[j] & 0xff); 
      if (a != b) { 
       return a - b; 
      } 
     } 
     return left.length - right.length; 
    }

स्रोत

2011-02-24 18:12:39 marcorossi

यह मूल रूप से गुवा के 'UnsignedBytes.lexicographicalComparator() 'का गैर-अनुकूलित संस्करण क्या है। – ColinD

हम्म, उन्होंने 'i' और' j' का उपयोग क्यों किया, जब एक चर पर्याप्त होता। साथ ही, 'int length = Math.min (left.length, right.length)' संग्रहित करना और 'i

के लिए इसे बेहतर करेगा, आप उम्मीद करेंगे कि सरणी का लंबा क्षेत्र महंगा होगा – marcorossi

उत्तर

संबंधित मुद्दे