
음향공학_음향공학 수업에서 다루는 다양한 주제와 관련한 자유로운 조사과제를 수행합니다.
본 내용은
"
음향공학_음향공학 수업에서 다루는 다양한 주제와 관련한 자유로운 조사과제를 수행합니다.
"
의 원문 자료에서 일부 인용된 것입니다.
2023.08.16
문서 내 토픽
-
1. 음성인식음성을 인식한다는 것은 언어의 의사소통의 교류의 가장 기초적인 개념이다. 이제는 이러한 음성인식 기능이 단순히 타자를 쳐서 언어를 전달하는 것이 아닌 인간의 음성을 듣고 문자형식의 전달이 가능한 정도로 변화하였다. 음성인식은 하나의 단어만 발성한 것을 인식하는 고립단어인식, 여러 단어를 중간에 짧은 유지구간을 넣어 발성한 인식의 연결단어인식, 여러 단어를 연속적으로 발음한 것을 인식하는 연속음성인식, 연속적으로 발성한 음성에서 주어진 핵심어 추출의 핵심어 인식으로 구분된다. 또한 인식은 훈련을 한 사람의 음성만 인식하는 화자 종속 인식, 별도의 훈련이 없는 화자 독립 인식, 최소의 훈련만을 실시하여 기본이 되는 음성모델에 새로운 사용자의 발성 특성을 적응시키는 화자적응 인식으로 구분된다.
-
2. 음성 생성단계음성을 생성하는 단계를 보면 음원의 발생, 조음, 방사 3가지의 단계로 구성되어 인간의 발성기관을 볼 수 있다. 폐, 기관, 후두, 인두, 비강, 구강으로 구성되어져 있으며 전체가 하나의 연속된 관을 형성하는데 폐에서 나오는 공기의 흐름이 입,코를 통해서 밖으로 나오기까지 조음기에 의해 여러 가지의 소리로 변화하는 과정이다.
-
3. 지니 그리고 빅스비KT의 기가 지니의 음성인식은 연속음성인식 방식에 화자 독립적인 인식에서의 화자 적응의 기능을 탑재한 인식기능을 가지고 있어서 텔레비전의 사용자 자체의 불특정 다수라는 특성을 고려한 인식기능을 사용하고 있다. 반면 빅스비는 핸드폰에 탑재되어 있는 특징에서 개인적이고 사적인 공간이라는 점에서 핸드폰 사용자의 개인 음성에 초점을 맞춘 음성인식 기능을 가지고 있다. 이것은 훈련을 한 사람의 음성만을 인식하는 화자 종속적인 특징을 가지고 있다.
-
1. 음성인식음성인식 기술은 인공지능 분야에서 매우 중요한 기술 중 하나입니다. 음성인식 기술은 사용자의 음성을 텍스트로 변환하여 다양한 응용 분야에서 활용될 수 있습니다. 최근 딥러닝 기술의 발전으로 음성인식 성능이 크게 향상되었으며, 스마트폰, 스마트 스피커, 자동차 등 다양한 기기에서 활용되고 있습니다. 하지만 아직 다양한 환경과 사용자 음성에 대한 인식 정확도 향상, 실시간 처리 속도 개선, 다국어 지원 등의 과제가 남아있습니다. 향후 음성인식 기술이 더욱 발전하여 사용자 편의성을 높이고 다양한 서비스에 활용될 수 있기를 기대합니다.
-
2. 음성 생성단계음성 생성 기술은 인공지능 시스템이 사용자의 요청이나 대화 내용을 바탕으로 자연스러운 음성을 출력하는 기술입니다. 이 기술은 텍스트 음성 변환(TTS) 기술을 기반으로 하며, 최근 딥러닝 기술의 발전으로 더욱 자연스러운 음성 생성이 가능해졌습니다. 음성 생성 기술은 음성 대화형 인터페이스, 오디오북 제작, 자동 번역 등 다양한 분야에 활용될 수 있습니다. 하지만 아직 감정 표현, 억양, 말투 등 자연스러운 음성 생성을 위한 과제가 남아있습니다. 향후 음성 생성 기술이 더욱 발전하여 사용자 경험을 향상시킬 수 있기를 기대합니다.
-
3. 지니 그리고 빅스비지니와 빅스비는 각각 삼성전자와 LG전자가 개발한 인공지능 음성 비서 서비스입니다. 이 두 서비스는 스마트폰, 스마트 스피커, 가전제품 등 다양한 기기에서 사용자의 음성 명령을 인식하고 이에 따른 작업을 수행할 수 있습니다. 지니와 빅스비는 음성인식, 자연어 처리, 음성 합성 등의 기술을 활용하여 사용자와 자연스러운 대화를 할 수 있습니다. 최근 인공지능 기술의 발전으로 이들 서비스의 성능이 점차 향상되고 있지만, 여전히 다국어 지원, 문맥 이해, 개인화 등의 과제가 남아있습니다. 향후 지니와 빅스비가 더욱 발전하여 사용자 편의성을 높이고 다양한 서비스에 활용될 수 있기를 기대합니다.