ऑप्टिकल कैरेक्टर रिकग्निशन (ओसीआर) सॉफ़्टवेयर को संदर्भित करता है जो मुद्रित, टाइप किए गए, या हस्तलिखित दस्तावेज़ का डिजिटल संस्करण बनाता है जो कंप्यूटर मैन्युअल रूप से टेक्स्ट टाइप या दर्ज करने की आवश्यकता के बिना पढ़ सकता है। ओसीआर आमतौर पर पीडीएफ प्रारूप में स्कैन किए गए दस्तावेज़ों पर प्रयोग किया जाता है, लेकिन एक छवि फ़ाइल के भीतर पाठ का कंप्यूटर-पठनीय संस्करण भी बना सकता है।
ओसीआर क्या है?
ओसीआर, जिसे पाठ मान्यता के रूप में भी जाना जाता है, सॉफ्टवेयर तकनीक है जो मुद्रित या लिखित दस्तावेज़ों से संख्याओं, अक्षरों और विराम चिह्न (जिसे ग्लाइफ भी कहा जाता है) जैसे इलेक्ट्रॉनिक रूप में बदलती है और कंप्यूटर और अन्य सॉफ्टवेयर प्रोग्रामों द्वारा आसानी से पहचाना और पढ़ा जाता है। कुछ ओसीआर कार्यक्रम इसे दस्तावेज़ के रूप में स्कैन या डिजिटल कैमरे के साथ चित्रित करते हैं और अन्य इस प्रक्रिया को दस्तावेजों पर लागू कर सकते हैं जिन्हें पहले स्कैन किया गया था या ओसीआर के बिना फोटो खिंचवाया गया था। ओसीआर उपयोगकर्ताओं को पीडीएफ दस्तावेज़ों के भीतर खोज करने, पाठ संपादित करने और दस्तावेज़ों को दोबारा प्रारूपित करने की अनुमति देता है।
ओसीआर के लिए क्या उपयोग किया जाता है?
जल्दी से, हर दिन स्कैनिंग की जरूरत है, ओसीआर एक बड़ा सौदा नहीं हो सकता है। यदि आप बड़ी मात्रा में स्कैनिंग करते हैं, तो आपको जो सटीक आवश्यकता है उसे ढूंढने के लिए पीडीएफ के भीतर खोज करने में सक्षम होने से काफी समय बचा सकता है और आपके स्कैनर प्रोग्राम में ओसीआर कार्यक्षमता अधिक महत्वपूर्ण हो जाती है। ओसीआर कुछ अन्य चीजें यहां मदद करता है:
- स्वचालित डेटा प्रोसेसिंग और डेटा एंट्री (उदाहरण: रिज्यूमे के लिए जॉब आवेदक ट्रैकिंग सिस्टम)
- स्कैन की गई किताबों को खोजने योग्य बनाना
- हस्तलिखित स्कैन को कंप्यूटर-पठनीय पाठ में परिवर्तित करना
- दस्तावेज़ों को और अधिक उपयोग करने योग्य पाठक प्रोग्राम जो अधिक दृष्टिहीन उपयोगकर्ताओं की सहायता करते हैं
- ऐतिहासिक दस्तावेजों और समाचार पत्रों को संरक्षित करते हुए, जबकि उन्हें खोजने योग्य भी बनाते हैं
- लेखांकन कार्यक्रमों में डेटा निष्कर्षण और स्थानांतरण (उदाहरण: रसीदें और चालान)
- खोज इंजन द्वारा उपयोग के लिए सूचकांक दस्तावेज
- स्पीड कैमरा और रेड-लाइट कैमरा सॉफ़्टवेयर द्वारा ड्राइवर लाइसेंस प्लेटों की पहचान
- उन लोगों के लिए भाषण सिंथेसाइज़र जो बोल नहीं सकते - सैद्धांतिक भौतिक विज्ञानी, स्टीफन हॉकिंग, शायद भाषण सिंथेसाइज़र प्रोग्राम का सबसे प्रसिद्ध उपयोगकर्ता है
ओसीआर का उपयोग क्यों करें?
क्यों न सिर्फ एक तस्वीर ले लो, है ना? क्योंकि आप कुछ भी संपादित करने या पाठ को खोजने में सक्षम नहीं होंगे क्योंकि यह सिर्फ एक छवि होगी। दस्तावेज़ स्कैनिंग और ओसीआर सॉफ़्टवेयर चलाने से उस फ़ाइल को उस चीज़ में बदल दिया जा सकता है जिसे आप संपादित कर सकते हैं और खोज में सक्षम हो सकते हैं।
ओसीआर का इतिहास
जबकि पाठ पहचान का सबसे शुरुआती उपयोग 1 9 14 तक है, व्यापक रूप से फैल गया विकास और ओसीआर से संबंधित प्रौद्योगिकियों का उपयोग 1 9 50 के दशक में ईमानदारी से शुरू हुआ, विशेष रूप से बहुत सरल फोंट के निर्माण के साथ जो डिजिटल रूप से पठनीय पाठ में परिवर्तित करना आसान था। इन सरलीकृत फोंटों में से पहला डेविड शेपर्ड द्वारा बनाया गया था और आमतौर पर ओसीआर -7 बी के रूप में जाना जाता है। क्रेडिट कार्ड और डेबिट कार्ड पर इस्तेमाल होने वाले मानक फ़ॉन्ट के लिए आज भी ओसीआर -7 बी वित्तीय उद्योग में उपयोग में है। 1 9 60 के दशक में, कई देशों में डाक सेवाओं ने संयुक्त राज्य अमेरिका, ग्रेट ब्रिटेन, कनाडा और जर्मनी समेत मेल सॉर्टिंग को तेजी से बढ़ाने के लिए ओसीआर तकनीक का उपयोग शुरू किया। ओसीआर अभी भी दुनिया भर में डाक सेवाओं के लिए मेल सॉर्ट करने के लिए उपयोग की जाने वाली कोर तकनीक है। 2000 में, ओसीआर प्रौद्योगिकी की सीमाओं और क्षमताओं के महत्वपूर्ण ज्ञान का उपयोग बॉट्स और स्पैमर को रोकने के लिए उपयोग किए गए कैप्चा कार्यक्रमों को विकसित करने के लिए किया गया था।
दशकों से, ओसीआर कृत्रिम बुद्धि , मशीन सीखने और कंप्यूटर दृष्टि जैसे संबंधित प्रौद्योगिकी क्षेत्रों में प्रगति के कारण अधिक सटीक और अधिक परिष्कृत हो गया है। आज, ओसीआर सॉफ्टवेयर पहले से कहीं अधिक तेज़ और अधिक सटीक दस्तावेजों को बदलने के लिए पैटर्न पहचान, फीचर डिटेक्शन और टेक्स्ट खनन का उपयोग करता है।