मुझे उत्सुकता है कि यूट्यूब किस प्रकार की आईडी का उपयोग अपने वीडियो की पहचान के लिए करता है? वे Digg और Bit.ly जैसी साइटों पर छोटे यूआरएल के लिए उपयोग की जाने वाली एक ही प्रकार की आईडी प्रतीत होते हैं।यूट्यूब अपने वीडियो के लिए किस प्रकार की आईडी का उपयोग करता है?
उत्तर
यह शायद एक GUID का एक संशोधित बेस 64 प्रतिनिधित्व है। (सामान्य बेस 64 कार्यान्वयन में यूआरएल के लिए समस्या वर्ण शामिल हैं)।
वे इस आईडी का उपयोग लोगों को खेती/वीडियो को स्पैमिंग से रोकने के लिए करते हैं ताकि आसानी से संख्या बढ़ाई जा सके।
मैं कम से कम एक "_" मिश्रण में रेखांकित के साथ एक देखा है। जो मुझे आश्चर्यचकित कर रहा था ... क्योंकि मैंने Piskvor के रूप में एक ही regexp माना था ... अब तक ...
याप .. उदाहरण के लिए : https://www.youtube.com/watch?v=ivjPQZ_3-xM –
इशमेल के अनुमान के रूप में यह बेस 64 संशोधित है। सामान्य बेस 64 [ए-जेए-जेड -9 \ 9 \ /] [=] * है। यही है, संख्याओं में ए-जेड, ए-जेड, 0-9, +, या /, और अंत में 0, 1, या 2 "=" के साथ गद्देदार हैं। यूट्यूब पैडिंग को छोड़ने लगता है (जैसे एमआईएमएफ -7 बेस 64 एमआईएम के लिए), और यूआरएल के लिए + और/पॉज़ की समस्याएं, और _ क्रमशः प्रतिस्थापित की जाती हैं।
इसलिए, यूट्यूब आईडी REGEXP से मेल खाना चाहिए:/[a-zA-Z0-9 \ -_] +/या/[\ w \ -] +/(वे बराबर हैं क्योंकि \ w है [ए- Za-z0-9_])
मैं इसे गतिशील YouTube SWFObject लोडर कार्यान्वयन में उपयोग करता हूं और यह ठीक काम करता है। मैंने YouTube आईडी में - और _ दोनों को देखा है, लेकिन कभी भी कोई अन्य गैर-अल्फा-न्यूमेरिक वर्ण नहीं है। विकिपीडिया पर अधिक बेस 64 जानकारी पाई जा सकती है: URL applications of Base64
शुभकामनाएं!
संभवतः लगता है। यह GUID का डेटा 4 हिस्सा हो सकता है (यानी 'XXXXXXXX-XXXX-XXXX-XXXX-XXXXXXXXXXXX' प्रतिनिधित्व का अंतिम 2 खंड), जो 8 बाइट्स है, 11char बेस 64 प्रतिनिधित्व (यूआरएल-सुरक्षित संस्करण) – mykhal