यूआरएल एन्कोडिंग का संक्षिप्त परिचय

एक वेबसाइट का यूआरएल जिसे आमतौर पर "वेबसाइट एड्रेस" के नाम से भी जाना जाता है, वह एक विशिष्ट वेबसाइट तक पहुंचने के लिए किसी वेब ब्राउजर में प्रवेश करेगा। जब आप किसी यूआरएल के माध्यम से जानकारी पास करते हैं, तो आपको यह सुनिश्चित करना होगा कि यह केवल विशिष्ट अनुमत वर्णों का उपयोग करे। इन अनुमत वर्णों में वर्णमाला वर्ण, अंक, और कुछ विशेष वर्ण शामिल हैं जिनका URL स्ट्रिंग में अर्थ है। यूआरएल में जोड़े जाने वाले किसी भी अन्य अक्षर को एन्कोड किया जाना चाहिए ताकि वे उन पृष्ठों और संसाधनों को ढूंढने के लिए ब्राउज़र की यात्रा के दौरान समस्याएं नहीं पैदा कर सकें जिन्हें आप ढूंढ रहे हैं।

एक यूआरएल एन्कोडिंग

URL स्ट्रिंग में सबसे अधिक एन्कोडेड वर्ण वर्ण है। जब भी आप किसी URL में प्लस-साइन (+) देखते हैं तो आप इस चरित्र को देखते हैं। यह अंतरिक्ष चरित्र का प्रतिनिधित्व करता है। प्लस साइन एक विशेष वर्ण के रूप में कार्य करता है जो उस यूआरएल में उस स्थान का प्रतिनिधित्व करता है। सबसे आम तरीका यह है कि आप इसे एक मेलटो लिंक में देखेंगे जिसमें एक विषय शामिल है। यदि आप विषय में रिक्त स्थान चाहते हैं, तो आप उन्हें प्लस के रूप में एन्कोड कर सकते हैं:

mailto:? ईमेल विषय = इस + मेरे + विषय + है

एन्कोडिंग टेक्स्ट का यह बिट "यह मेरा विषय है" का विषय प्रसारित करेगा। एन्कोडिंग में "+" वर्ण को वास्तविक के साथ प्रतिस्थापित किया जाएगा जब इसे ब्राउज़र में प्रस्तुत किया जाता है।

एक यूआरएल एन्कोड करने के लिए, आप बस विशेष अक्षरों को उनके एन्कोडिंग स्ट्रिंग के साथ प्रतिस्थापित करते हैं। यह लगभग हमेशा% चरित्र के साथ शुरू होगा।

एक यूआरएल एन्कोडिंग

कड़ाई से बोलते हुए, आपको हमेशा यूआरएल में पाए गए किसी भी विशेष पात्र को एन्कोड करना चाहिए। एक महत्वपूर्ण नोट, यदि आप इस बात या एन्कोडिंग से थोड़ा डरा महसूस कर रहे हैं, तो यह है कि आपको आम तौर पर फॉर्म डेटा के अलावा उनके सामान्य संदर्भ के बाहर यूआरएल में कोई विशेष पात्र नहीं मिलेगा।

अधिकांश यूआरएल उन सरल पात्रों का उपयोग करते हैं जिन्हें हमेशा अनुमति दी जाती है, इसलिए कोई भी एन्कोडिंग की आवश्यकता नहीं होती है।

यदि आप जीईटी विधि का उपयोग कर सीजीआई स्क्रिप्ट्स पर डेटा जमा करते हैं, तो आपको डेटा एन्कोड करना चाहिए क्योंकि यह यूआरएल पर भेजा जाएगा। उदाहरण के लिए, यदि आप एक आरएसएस फ़ीड को बढ़ावा देने के लिए एक लिंक लिख रहे हैं, तो आपके यूआरएल को उस स्क्रिप्ट यूआरएल में जोड़ने के लिए एन्कोड किया जाना होगा जिसे आप इसे बढ़ावा दे रहे हैं।

एनकोडेड क्या होना चाहिए?

कोई भी चरित्र जो वर्णमाला वर्ण, संख्या या एक विशेष वर्ण नहीं है जिसका उपयोग अपने सामान्य संदर्भ के बाहर किया जा रहा है, को आपके पृष्ठ में एन्कोड करने की आवश्यकता होगी। नीचे सामान्य वर्णों की एक सारणी है जो एक यूआरएल और उनके एन्कोडिंग में पाई जा सकती है।

आरक्षित वर्ण यूआरएल एन्कोडिंग

चरित्र यूआरएल में उद्देश्य एन्कोडिंग
: पते से अलग प्रोटोकॉल (http) % 3 बी
/ अलग डोमेन और निर्देशिकाएं % 2F
# अलग एंकर % 23
? अलग क्वेरी स्ट्रिंग % 3F
और अलग क्वेरी तत्व % 24
@ डोमेन से अलग उपयोगकर्ता नाम और पासवर्ड 40%
% एक एन्कोडेड चरित्र इंगित करता है % 25
+ एक जगह इंगित करता है % 2 बी
<अंतरिक्ष> यूआरएल में अनुशंसित नहीं है % 20 या +

ध्यान दें कि इन एन्कोडेड उदाहरण HTML विशेष वर्णों के साथ आपको जो भी मिलता है उससे अलग हैं। उदाहरण के लिए, यदि आपको एम्पर्सेंड (&) वर्ण वाले यूआरएल को एन्कोड करने की आवश्यकता है, तो आप उपरोक्त तालिका में दिखाए गए% 24 का उपयोग करेंगे। यदि आप HTML लिख रहे थे और आप टेक्स्ट में एम्पर्सेंड जोड़ना चाहते थे, तो आप% 24 का उपयोग नहीं कर सके। इसके बजाय, आप या तो "& amp;" का उपयोग करेंगे; या "& # 38;", जो दोनों प्रस्तुत किए जाने पर HTML पृष्ठ में और लिखेंगे। यह पहली बार भ्रमित प्रतीत हो सकता है, लेकिन यह मूल रूप से पृष्ठ पर दिखाई देने वाले पाठ के बीच का अंतर है, जो HTML कोड का हिस्सा है, और यूआरएल स्ट्रिंग, जो एक अलग इकाई है और इसलिए विभिन्न नियमों के अधीन है।

तथ्य यह है कि "&" चरित्र, साथ ही कई अन्य पात्र, प्रत्येक में दिखाई दे सकते हैं, आपको दोनों के बीच मतभेदों को भ्रमित नहीं करना चाहिए।

जेनिफर क्रिनिन द्वारा मूल लेख। जेरेमी गिरार्ड द्वारा संपादित।