[AI/ASR] ASR(자동 음성 인식)이란 무엇인가? (정의, 구성요소, 장단점, 핵심 분야, 실습)
·
AI Study/[LLM]
1. 들어가며"헤이 카카오, 오늘 날씨 어때?", "아리아, 노래 틀어줘."우리는 이제 기계와 목소리로 대화하는 것이 익숙한 세상에 살고 있습니다. 불과 십수 년 전만 해도 기계가 사람의 말을 알아듣는 것은 SF 영화에서나 가능한 일처럼 보였습니다.사람의 목소리(Voice)라는 아날로그 파동을 컴퓨터가 이해할 수 있는 텍스트(Text)로 변환하는 기술, 바로 ASR(Automatic Speech Recognition) 덕분입니다. 최근에는 OpenAI의 Whisper, 알리바바의 Qwen-ASR 등 초거대 모델들이 등장하며 인간을 뛰어넘는 인식률을 보여주고 있습니다.이번 포스팅에서는 STT(Speech-to-Text)라고도 불리는 ASR의 핵심 원리부터 최신 트렌드, 그리고 파이썬으로 직접 구현하는 방법..