ASR Full Form: Automated Speech Recognition
ASR का Full Form Automated Speech Recognition (स्वचालित भाषण पहचान) है। यह एक ऐसी Technology को संदर्भित करता है जो बोले गए शब्दों को लिखित पाठ में परिवर्तित करती है। यह तकनीक कंप्यूटर को उन शब्दों को पहचानने और संसाधित करने की अनुमति देती है जो कोई व्यक्ति किसी इनपुट डिवाइस या कंप्यूटर से जुड़े माइक्रोफ़ोन में बोलता है।
ASR प्रकार
ASR स्वतंत्र ट्रांसक्रिप्शन सॉफ्टवेयर है जिसे बोली जाने वाली भाषा को प्लेन टेक्स्ट में बदलने के लिए डिज़ाइन किया गया है। इसके दो प्रकार होते हैं, जो इस प्रकार हैं
1) प्रत्यक्ष संवाद वार्तालाप: यह ASR का एक मूल संस्करण है। इसमें एक मशीन इंटरफेस होता है जो मनुष्यों के साथ संचार करता है। आपके और कंप्यूटर के बीच मौखिक संपर्क आवश्यक है; मशीन आपको शब्दों की सूची से एक विशिष्ट शब्द के साथ उत्तर देने के लिए कहती है और तदनुसार आपके अनुरोध का जवाब देती है या प्रतिक्रिया करती है। स्वचालित टेलीफोन बैंकिंग इस तकनीक का उपयोग ग्राहकों को टेलीफोन पर विभिन्न प्रकार के वित्तीय लेनदेन करने में सक्षम बनाने के लिए करती है।
2) प्राकृतिक भाषा वार्तालाप: यह ASR का अधिक उन्नत और परिष्कृत संस्करण है। यह उपयोगकर्ता के भाषण या लिखित सामग्री को समझता है और समझी गई सामग्री के आधार पर उपयोगकर्ता को प्रतिक्रिया देता है। यह लोगों को रोजमर्रा की भाषा के माध्यम से कंप्यूटर के साथ संवाद करने की अनुमति देता है।
ASR कैसे काम करता है
ASR में घटनाओं का मूल क्रम इस प्रकार है:
1) एक व्यक्ति माइक्रोफ़ोन जैसे इनपुट डिवाइस का उपयोग करके सॉफ़्टवेयर से बात करता है।
2) इनपुट डिवाइस आपके शब्दों की एक वेव फाइल बनाता है।
3) तरंग फ़ाइल का आयतन सामान्य हो जाएगा और पृष्ठभूमि शोर हटा दिया जाएगा।
4) साफ की गई तरंग फ़ाइल को स्वरों में विभाजित किया जाता है, सबसे छोटी ध्वनि इकाइयाँ। अंग्रेजी में लगभग 44 स्वर हैं।
5) ASR सॉफ्टवेयर पहले फोनेम से शुरू होकर फोनेम का विश्लेषण करता है। यह एक पूर्ण वाक्य बनाने से पहले पूरे शब्दों का पता लगाने के लिए सांख्यिकीय संभाव्यता विश्लेषण का उपयोग करता है।
6) अब, शब्दों को समझने के बाद, ASR सार्थक तरीके से प्रतिक्रिया करता है।