भाषण मान्यता क्या है?

इनपुट विधि के रूप में अपनी आवाज का उपयोग करना

भाषण मान्यता एक ऐसी तकनीक है जो सिस्टम में बोले गए इनपुट की अनुमति देती है। आप अपने कंप्यूटर, फोन या डिवाइस से बात करते हैं और यह कुछ क्रियाओं को ट्रिगर करने के लिए इनपुट के रूप में आपने जो कहा है उसका उपयोग करता है। तकनीक का उपयोग अन्य तरीकों से टाइपिंग, क्लिक या चयन जैसे इनपुट के अन्य तरीकों को बदलने के लिए किया जा रहा है। यह उपकरणों और सॉफ्टवेयर को अधिक उपयोगकर्ता के अनुकूल बनाने और उत्पादकता बढ़ाने के लिए एक माध्यम है।

वहां बहुत से अनुप्रयोग और क्षेत्र हैं जहां सेना सहित, भाषण मान्यता का उपयोग किया जाता है, जिसमें विकलांग व्यक्तियों की सहायता के रूप में (मेडिकल क्षेत्र में, रोबोटिक्स आदि में चिकित्सा क्षेत्र में, किसी व्यक्ति की कल्पना या हाथ या उंगलियों की कल्पना करें) निकट भविष्य में, कंप्यूटर और मोबाइल फोन जैसे सामान्य उपकरणों के प्रचार के कारण लगभग सभी को भाषण मान्यता के संपर्क में लाया जाएगा।

कुछ स्मार्टफोन भाषण मान्यता का दिलचस्प उपयोग कर रहे हैं। आईफोन और एंड्रॉइड डिवाइस इसके उदाहरण हैं। उनके माध्यम से, आप केवल 'कॉल ऑफिस' जैसे बोले गए निर्देश प्राप्त करके संपर्क में कॉल शुरू कर सकते हैं। अन्य आदेशों का भी मनोरंजन किया जा सकता है, जैसे 'ब्लूटूथ पर स्विच करें'।

भाषण मान्यता के साथ समस्याएं

भाषण मान्यता, स्पीच टू टेक्स्ट (एसटीटी) के नाम से जाना जाने वाला संस्करण, बोले गए शब्दों को पाठ में अनुवाद करने के लिए लंबे समय तक उपयोग किया गया है। "आप बात करते हैं, यह टाइप करता है", क्योंकि वायावॉइस अपने बॉक्स पर कहता है। लेकिन एसटीटी के साथ एक समस्या है क्योंकि हम इसे जानते हैं। 10 साल से अधिक समय तक, मैंने वायावॉइस की कोशिश की और यह मेरे कंप्यूटर पर एक सप्ताह तक नहीं चला। क्यूं कर? यह काफी गलत था और मैंने सबकुछ टाइप करने से अधिक समय और ऊर्जा बोलने और सही करने में खर्च किया। ViaVoice उद्योग में सबसे अच्छा है, तो बाकी की कल्पना करो। तकनीक परिपक्व और सुधार हुई है, लेकिन पाठ में भाषण अभी भी लोगों से प्रश्न पूछता है। शब्दों की व्याख्या करने में लोगों के बीच इसकी मुख्य कठिनाइयों में से एक है।

सभी भाषाओं को भाषण मान्यता में नहीं माना जाता है, और जो लोग अक्सर अंग्रेजी के साथ समर्थित नहीं होते हैं। नतीजतन, भाषण मान्यता सॉफ्टवेयर चलाने वाले अधिकांश डिवाइस केवल अंग्रेजी के साथ ही प्रदर्शन करते हैं।

हार्डवेयर आवश्यकताओं का एक सेट कुछ मामलों में भाषण मान्यता को तैनात करना मुश्किल बनाता है। आपको एक माइक्रोफ़ोन की आवश्यकता है जो पृष्ठभूमि शोर को फ़िल्टर करने के लिए पर्याप्त बुद्धिमान है लेकिन साथ ही साथ ध्वनि को स्वाभाविक रूप से कैप्चर करने के लिए पर्याप्त शक्तिशाली है।

पृष्ठभूमि शोर की बात करते हुए, यह पूरे सिस्टम को असफल कर सकता है। नतीजतन, उपयोगकर्ता के नियंत्रण से बाहर होने वाली शोर के कारण कई मामलों में भाषण मान्यता विफल हो जाती है।

बड़े पैमाने पर पाठ इनपुट के लिए उत्पादकता उपकरण के मुकाबले, वीओआईपी जैसे नए फोन और संचार प्रौद्योगिकियों के लिए एक इनपुट विधि के रूप में भाषण मान्यता बेहतर साबित हो रही है।

भाषण मान्यता के अनुप्रयोग

प्रौद्योगिकी कई क्षेत्रों में लोकप्रियता प्राप्त कर रही है और निम्नलिखित में सफल रही है:

- डिवाइस नियंत्रण। एंड्रॉइड फोन पर बस "ओके Google" कहकर एक सिस्टम को आग लगती है जो आपके वॉइस कमांड के सभी कान हैं।

कार ब्लूटूथ सिस्टम। कई कारें ऐसी प्रणाली से लैस होती हैं जो ब्लूटूथ के माध्यम से अपने स्मार्टफोन को अपने स्मार्टफोन से जोड़ती है। फिर आप अपने स्मार्टफोन को छूए बिना कॉल कर सकते हैं और प्राप्त कर सकते हैं, और केवल उन्हें कहकर नंबर डायल कर सकते हैं।

- आवाज प्रतिलेखन। उन क्षेत्रों में जहां लोगों को बहुत कुछ टाइप करना पड़ता है, कुछ बुद्धिमान सॉफ़्टवेयर उनके बोले गए शब्दों को कैप्चर करते हैं और उन्हें टेक्स्ट में ट्रांसक्रिप्ट करते हैं। यह कुछ शब्द संसाधन सॉफ्टवेयर में वर्तमान है। वॉयस ट्रांसक्रिप्शन भी विजुअल वॉयस मेल के साथ काम करता है।