भाषण मान्यता एक ऐसी तकनीक है जो सिस्टम में बोले गए इनपुट की अनुमति देती है। आप अपने कंप्यूटर, फोन या डिवाइस से बात करते हैं और यह कुछ क्रियाओं को ट्रिगर करने के लिए इनपुट के रूप में आपने जो कहा है उसका उपयोग करता है। तकनीक का उपयोग अन्य तरीकों से टाइपिंग, क्लिक या चयन जैसे इनपुट के अन्य तरीकों को बदलने के लिए किया जा रहा है। यह उपकरणों और सॉफ्टवेयर को अधिक उपयोगकर्ता के अनुकूल बनाने और उत्पादकता बढ़ाने के लिए एक माध्यम है।
वहां बहुत से अनुप्रयोग और क्षेत्र हैं जहां सेना सहित, भाषण मान्यता का उपयोग किया जाता है, जिसमें विकलांग व्यक्तियों की सहायता के रूप में (मेडिकल क्षेत्र में, रोबोटिक्स आदि में चिकित्सा क्षेत्र में, किसी व्यक्ति की कल्पना या हाथ या उंगलियों की कल्पना करें) निकट भविष्य में, कंप्यूटर और मोबाइल फोन जैसे सामान्य उपकरणों के प्रचार के कारण लगभग सभी को भाषण मान्यता के संपर्क में लाया जाएगा।
कुछ स्मार्टफोन भाषण मान्यता का दिलचस्प उपयोग कर रहे हैं। आईफोन और एंड्रॉइड डिवाइस इसके उदाहरण हैं। उनके माध्यम से, आप 'कॉल ऑफिस' जैसे बोले गए निर्देश प्राप्त करके संपर्क में कॉल शुरू कर सकते हैं। अन्य आदेशों का भी मनोरंजन किया जा सकता है, जैसे 'ब्लूटूथ पर स्विच करें।'
भाषण मान्यता के साथ समस्याएं
भाषण मान्यता, स्पीच टू टेक्स्ट (एसटीटी) के नाम से जाना जाने वाला संस्करण, बोले गए शब्दों को पाठ में अनुवाद करने के लिए लंबे समय तक उपयोग किया गया है। ViaVoice अपने बॉक्स पर कहेंगे, "आप बात करते हैं, यह टाइप करता है।" लेकिन एसटीटी के साथ एक समस्या है क्योंकि हम इसे जानते हैं। ViaVoice उद्योग में सबसे अच्छा है, तो बाकी की कल्पना करो। तकनीक परिपक्व और सुधार हुई है, लेकिन पाठ में भाषण अभी भी लोगों से प्रश्न पूछता है। शब्दों की व्याख्या करने में लोगों के बीच इसकी मुख्य कठिनाइयों में से एक है।
सभी भाषाओं को भाषण मान्यता में नहीं माना जाता है, और जो लोग अक्सर अंग्रेजी के साथ समर्थित नहीं होते हैं। नतीजतन, भाषण मान्यता सॉफ्टवेयर चलाने वाले अधिकांश डिवाइस केवल अंग्रेजी में ही उचित प्रदर्शन करते हैं।
हार्डवेयर आवश्यकताओं का एक सेट कुछ मामलों में भाषण मान्यता को तैनात करना मुश्किल बनाता है। आपको एक माइक्रोफ़ोन की आवश्यकता है जो पृष्ठभूमि शोर को फ़िल्टर करने के लिए पर्याप्त बुद्धिमान है लेकिन साथ ही साथ ध्वनि को स्वाभाविक रूप से कैप्चर करने के लिए पर्याप्त शक्तिशाली है।
पृष्ठभूमि शोर की बात करते हुए, यह पूरे सिस्टम को असफल कर सकता है। नतीजतन, उपयोगकर्ता के नियंत्रण से बाहर होने वाली शोर के कारण कई मामलों में भाषण मान्यता विफल हो जाती है।
बड़े पैमाने पर पाठ इनपुट के लिए उत्पादकता उपकरण के मुकाबले, वीओआईपी जैसे नए फोन और संचार प्रौद्योगिकियों के लिए एक इनपुट विधि के रूप में भाषण मान्यता बेहतर साबित हो रही है।
भाषण मान्यता के अनुप्रयोग
प्रौद्योगिकी कई क्षेत्रों में लोकप्रियता प्राप्त कर रही है और निम्नलिखित में सफल रही है:
- डिवाइस नियंत्रण। एंड्रॉइड फोन पर बस "ओके Google" कहकर एक सिस्टम को आग लगती है जो आपके वॉइस कमांड के सभी कान हैं।
- कार ब्लूटूथ सिस्टम। कई कारें ऐसी प्रणाली से लैस होती हैं जो ब्लूटूथ के माध्यम से अपने स्मार्टफोन को अपने स्मार्टफोन से जोड़ती है। फिर आप अपने स्मार्टफोन को छूए बिना कॉल कर सकते हैं और प्राप्त कर सकते हैं, और केवल उन्हें कहकर नंबर डायल कर सकते हैं।
- आवाज प्रतिलेखन। उन क्षेत्रों में जहां लोगों को बहुत कुछ टाइप करना पड़ता है, कुछ बुद्धिमान सॉफ़्टवेयर उनके बोले गए शब्दों को कैप्चर करते हैं और उन्हें टेक्स्ट में ट्रांसक्रिप्ट करते हैं। यह कुछ शब्द संसाधन सॉफ्टवेयर में वर्तमान है। वॉयस ट्रांसक्रिप्शन भी विजुअल वॉयस मेल के साथ काम करता है।




