*병* 스토어

*병*

개인인증

팔로워0 팔로우

소개

등록된 소개글이 없습니다.

전문분야 등록된 전문분야가 없습니다.

판매자 정보

학교정보

입력된 정보가 없습니다.

직장정보

입력된 정보가 없습니다.

자격증

입력된 정보가 없습니다.

판매지수

판매중 자료수

90개
전체 판매량

428개
최근 3개월 판매량

0개
자료후기 점수

평균B
자료문의 응답률

-

전체자료 90개

[화자인식] 화자인식(인증)응용 산업현황과 전망

화자인식(인증)응용 산업현황과 전망목 차화자인식(Speaker Recogintion) 화자인식의 분류 화자확인 화자식별 화자인식의 응용분야 국내외 산업현황 음성인식관련 국내특허 음성인식관련 일본특허 음성인식관련 미국특허 음성관련 시장동향화자인식(Speaker Recognition)음성 : 언어정보 + 화자정보 + 상황정보 화자인식(음성의 개인특성) 선천적 요인 : 성대, 성도(Vocal tract)의 구조적 차이 - 주파수 구조상의 차이 후천적 요인 : 발성의 습관의 차이 (강세, 빠르기) - 주파수 구조의 시각적 변화화자인식의 분류인식의 형태에 의한 분류 화자식별(speaker identification) : 범죄수사등에 이용 화자확인(speaker verification): 출입 통제, 본인확인등 보안에 이용 발성된 문맥 정보에 따른 분류 어구독립(text independent): 자연스러운 발성 어구종속(text dependent): 특정단어화자 확인화자확인: 사칭자와 실제 화자를 구분하는 application에 적용 한명의 화자를 대상으로 하는 작업화자 모델 (화자 #M)특징 벡터 추출유사도 계산결정화자확인 결과 (수락/거부)음성입력화자 ID (화자 #M)임계치화자 식별화자식별: 신원확인을 청구한 화자가 등록된 화자들 중에서 누구인지 또는 화자가 맞는지여부를 결정함 화자식별은 여러명의 화자를 대상으로 이루어짐특징 벡터 추출유사도 계산최대유사도 값 선택화자식별 결과 (화자 ID)음성입력화자 모델 (화자 # 1)유사도 계산화자 모델 (화자 # 1)화자인식 응용분야응용분야 기개인정보 / 기밀정보 검색(Network Access Control) 기밀지역 / 건물 출입통제 Home banking / Phone bankin국내 산업현황한국전자통신연구원, 한국과학기술원, 한국통신, 삼성전자, LG전자등에서 1980년대 후반부터 음성관련 연구시작 간편한 음성암호로 비밀 단어 사용 사용자 목소리 변화를 인식시 DB에 반영하는 화자 적응기능 있음 숫자 음의 조합을 사용한 숫자요규형 화자 인식기술 보유 음성과 지문, 얼굴등 다른 생체 인식기술과 관련연구 진행국외 산업현황음성정보 기술을 21세기 정보화 사회의 핵심기술로 규정(다보스 포럼 MIT대학)하고 대규모 투자를 하고 있음) 미국 국방선산하 DARPA(Defense Advance Research Project Agency)주도로 음성인식기술개발 – 1990년부터 매년 1500불 투자(음성인식 분야) EU- 독일주도로 휴대형 자동통역기 개발을 위한 Verbmobile Project추진 1993년부터 매년 700만불투자(음성인식 분야) C-STAR 프로젝트 –한국,미국, 일본,이탈리아등 7개국 참여 자동번역기 시스템개발(음성인식분야)화자인식관련 국내특허숫자로 구성된 어휘를 인식하고 동시에 발성화자를 인증하는 방법 시스템-보이스웨어㈜ 음향바코드를 이용한 인증시스템-최중인 음성의 모음 피치주기를 이용한 사용자 인증시스템- 네오사피아㈜ 화자인증을 이용한 인터넷폰 및 시건장치-보이스웨어㈜ 인터넷 상에서 음성인식을 이용하여 이용자를 인증한는 방법 및 시스템-웹프로텍㈜화자인증관련 일본특허적절한 타이밍으로 등록음성의 갱신을 행할 수 있고 안정성 확보를 할 수 있는 화자인식장치(2001년) 등록화자수가 상당히 많은 본인 인증에 대하여도 충분한 성능을 얻을 수 있는 화자인식장치(2000년) 녹음된 음성이 인식대상으로서 이용되는 것을 배제 하는 장치(2000년) 화장의 입력음성 전송변형에 의해 조합성능이 낮아지는 것을 방지하는 인식장치(2000년)음성인증관련 미국특허자동차 음성시스템용 선택화자인증(2001) 가중귀환을 사용한 화자인증(2002)음성관련 시장동향(1)국내시장 음성정보 기술개발, 음성정보 DB구축 등 국내 음성정보산업 신사업 육성을 통하여 2004년 3.5조원의 음성정보시장창출이 예상됨 세계음성정보시장의 약 5% 점유 최근 정보통신부 산하에 '음성정보처리 산업협의회', 산업자원부 산하에 '한국 음성정보기술 산업협회'등을 설립하여 지원(단위 :백만불)음성관련 시장동향(2)세계시장 2000년 :53억불, 2004년 750억불 연평균성장율 :90%계화자인식음성합성음성인식14.51,028,563890,519776,464679,994597,834S/W9019.7*************9265,41,6167*************71,80236,82221,49611,6234,899음성정보산업성장율(%)2*************012000연도(단위 :백만불){nameOfApplication=Show}

자연과학| 2004.12.14| 14페이지| 2,000원| 조회(836)

화자, 음성인식, 화자인식, 화자확인, 화자식별

미리보기

닫기
[음성인식] 음성인식/합성 기술의 현황 및 기술

음성인식/합성 기술의 현황 및 전망2003. 31. 개 요 2. 음성 인식 3. 음성 합성 4. 화자 인증 5. 응용 분야 6. 향후 전망 7. 솔루션 데모목 차● 음성기술 소개 음성인식 (Automatic Speech Recognition) 사람의 말을 알아 듣는 기술 음성합성 (Text To Speech) 문자정보를 음성으로 읽어주는 기술 화자인증 (Speaker Verification) - 누구의 말인지를 인증하는 기술 ● 기술의 중요성 MIT대학 : 21C 10대 기술로 선정 다보스포럼(WEF) : 미래 7대기술로 선정 관련산업 (핵심기술이면서 기반기술) 정보통신산업, 자동차산업 PC/Pocket-PC산업 가전산업, 게임산업 Robot, 동시통역 等1. 개 요전자공학 통신, 신호처리전산학 자연언어처리음성학 언어학통계학 음향물리학생리학 심리학음성정보기술음성합성음성인식화자인증기반 학문 분야1. 개 요오늘 받은 e-mail 보여줘 !오늘 받은 이메일 보여줘오늘 받은 이메일이 네 개 입니다. 첫번째 이메일의 내용은 ...음성 정보 시스템날씨 정보교통 정보전자 우편postPAR AVIONfast음성 전화 걸기오늘, 받다, e-mail, 보여주다신호처리음성 인식음성 이해음성합성음성 인식 / 합성 기술의 응용 예1. 개 요LungTracheaVocal tractVocal cordsSoft palateHard palateNasal cavityLipTeethOral cavityTongueSchematic diagram of the human vocal mechanismLPC Analysis1 A(Z)Exitation ModelVocal Tract ModelVocodervoicedunvoicedImpulse generatorWhite noise generator음성 발성 메커니즘 및 모델링1. 개 요SpectrogramtimeFrequencyEnergytimeWaveform주파수 스펙트럼pitch유성음 (voiced)무성음 (unvoiced)formant/팔//구//십/. 음성 인식패턴 비교의 예 (Waveform)2. 음성 인식패턴 비교의 예 (Spectrogram)우리집우리집학교: ● DTW (Dynamic Time Warping) - 시간 축상의 왜곡을 고려하며 test pattern과 reference pattern을 matching 하는 기법으로 주로 화자 종속 단어 인식기에 많이 사용함 - 시작점에서 끝점까지의 최선의 경로를 탐색2. 음성 인식음성 인식 기법Reference PatternsTest PatternsTest frameAlignment pathReference frame: local distance between two feature vectors우리집우리집, 학교, 사무실…12354a12a22a23a33a44a34a45음성 신호관측 심볼(특징벡터열)모 델b2(ot)b3(ot)b4(ot)2. 음성 인식음성 인식 기법● HMM (Hidden Markov Model) 음성 신호의 통계적인 확률값에 의해 matching 하는 기법으로 현재 가장 보편적으로 많이 사용하고 있음1234512345음성 신호팔 구 십음성인식 처리부단어 등록부Text 출력Text 입력인식 모델 구축불특정 다수의 음성 채록음소 Labeling음소 Modeling채록음성인식 모델단어 모델음소 모델음성 특징 추출음성의 시작/끝점 검출비교/근사치 계산전처리한국어 조음현상 처리음소 추출단어 모델 구축2. 음성 인식가변 어휘 인식기Spectral AnalysisWord ModelSubword ModelsLexiconGrammarSpeech InputFeature VectorWord-Level MatchingSentence-Level MatchingRecognized SentenceLanguage Model2. 음성 인식연속 음성 인식기3. 음성 합성기본 구조언어 처리부음성신호 처리부음성 DB 구축부구문 분석음운 변동 처리비한글 문자 처리형태소 분석최적의 음편열 생성음성 신호 합성운율 구현 (억양, 길이, 크기, 쉼 등)음성 녹음음성 Labelin이며 : 체언 + 대등적 연결어미 비가 : 체언 + 주격조사 올 : 용언 + 관형형 연결어미 확률은 : 체언 + 보조사 삼십 : 관형사 퍼센트이다 : 체언 + 종결어미여기는 서우리며 비가 올 황뉴른 삼십 퍼센트이다.절, 구, 휴지구간의 결정 여기는/ 서우리며// 비가| 올 황뉴른/ 삼십 퍼센트이다/// / : 구 혹은 쉼이 필요한 어절 // : 절 /// : 문장종료 | : 약간의 쉼이 필요한 구 또는 어절 지속시간(길이)의 결정 음소 단위 : 앞, 뒤에 오는 음소를 고려 음절 단위 : 어절 내 음절의 위치 어절 단위 : 어절 내 음절수 피치의 결정 문장, 절, 구, 어절, 음소 단위에서 단계적으로 결정 여기는/ 서우리며// 비가| 올 황뉴른/ 삼십 퍼센트이다///억양, 크기, 장단 등의 운율 형태를 생성한 후, 합성 단위를 조합함으로써 연속된 음성파형을 합성한다. 이 때 앞에서 추출한 운율 정보를 반영함으로써 자연스러운 음성을 합성해 낸다.3. 음성 합성운율 구현운율 생성 (억양, 길이, 크기, 쉼 등)합성 단위 선정 조건 결합부에서의 스펙트럼 불연속성을 최소화 시킬 수 있어야 한다. 적당량의 database 구축이 가능하여야 한다. 합성 단위의 예 Fixed Length Unit 단어(word), 음절(syllable), 음소(phoneme) demi-syllable, diphone, triphone, CV(Consonant-Vowel), VC, VCV, CVC, VCCV, etc. Variable Length Unit Corpus Based Unit Context Oriented Clustering (Using Decision Tree)3. 음성 합성합성 단위최적의 음편열 생성음소 모델Formant 합성 합성 단위의 formant 정보를 이용하여 음성을 합성 LPC 합성 음성 신호를 단구간(프레임) LPC 분석에 의해 각 프레임의 스펙트럼 정보를 추출 TD-PSOLA (Time Domain-Pitch Synchronous Overlap and Add) 음 (대용량)PC Package/ Windows App. (대/중용량)Embedded (중/소용량)자동차보안장난감IMT 2000금융/증권교통항공날씨PDA가전제품이동전화기교육법률보이스포털전자북UMSVAD전자상거래예매로봇의료게임5. 응용 분야Watch Phone The mobile phone with continuous speech recognition capabilities with TTS Includes a voice phone book with name dialing, digit dialing, command and control, voice calendaringSamSung Watch Phone5. 응용 분야Voice Xpress Dictation software Control web browser and Microsoft Office applications, including Excel, PowerPoint, Word, and more, all by voice Plug-in vocabularies for Business Finance, Technology, Leisure, and In The News Embedded specialist vocabularies and templates for healthcare, legal, and public safety professionalsDictation Software5. 응용 분야Internet portalWireless Internet portalVoice portalGive users voice-activated access to the internet from wireless, wireline, and even pay phonesVoice Portal5. 응용 분야Telematics Service ProviderGPSTelcoPersonalized ServiceInternetIntranetEmergency Navigation InformationTelematics Service5. 응용 분야『이미 미국시장에Robots / Toys5. 응용 분야American Airlines United Airlines US West Delta Express Continental Airlines Northwest Airlines유나이티드, 델타, 노스웨스트 등 세계적인 항공사에서는 음성기술을 도입, 고객에게 유/무선 전화로 음성인식 항공정보를 제공하고 있다. 어메리칸 항공의 비행 시간을 알고 싶은 사람들은 이제 교환원이 아닌 컴퓨터에 대고 말로 지시하면 된다.AirTran Airways Flightline 캐나다 Air Canada 영국 British Airways항공 예약 서비스5. 응용 분야Merrill Lynch Thomas Cook Global Financial Services E*TRADE Charles Schwab Ameritrade Inc Stocktrade DMG Partners Securities Fidelity Investments Institutional Brokerage Group TradeTalk, DLJdirect's telephone brokerage system GL Trade Multimedi@ Keppel Securities Lim Tan Securities NYLIFE Securities TD Waterhouse대만 MasterLink Securities 대만 Polaris Group 홍콩 hkstock.com 캐나다 TD Waterhouse 멕시코 Stock Exchange of Mexico 싱가폴 Stock Exchange of Singapore 호주 TD Waterhouse Australia 호주 Australian Stock Exchange 호주 Commonwealth Securities Limited (ComSec) 영국 SpeechTrade 영국 Sharepeople 프랑스 Trade Multimedia 이탈리아 Xelion 이탈리아 UniCredito Italiano 일본 Nomura Securities Co증권정보 서비스5. 응용 w}

자연과학| 2004.12.14| 32페이지| 2,000원| 조회(1,325)

화자, 음성, 음성인식, 음성합성, 화자인증

미리보기

닫기
[무선통신] 음성인식기술

음성인식기술우리가 컴퓨터를 사용할 때 불편한 점 중 하나는 명령을 키보드로 입력하는 것이다. 그래픽 인터페이스의 발달로마우스와 키보드를 병용함으로써 편의성이 많이 개선되었으나 사람끼리의 대화에 비하면 아직 불편하기 그지없다.음성인식기술은 이러한 휴먼 인터페이스가 편리하고 자연스럽도록 개선시켜 줄 핵심기술 중 하나다. 음성인식기술은음성구동 컴퓨터를 비롯해 무인전화번호 안내, 음성구동 주문형 비디오, 각종 음성안내시스템, 가전제품등이용영역이 광범위하다.현재 음성인식기술이 널리 사용되지 않은 것은 두가지 이유에 기인한다.첫째, 기술이 실용화하기에 충분한 수준으로 발전하지 못한 것이다. 응용분야에 따라 차이가 있으나 음성인식을 실용제품에 사용하려면 인식률이 약 95% 이상 되어야 한다. 그러나 사람이 자유롭게 말하는 것을 95% 이상 인식하는 것은현재로서는 불가능하다. 둘째로는 현재까지 개발한 기술을 실용시스템에 접목하는 기술이 부족하다는 점이다.응용분야별 음성인식 요구사항이무엇인지, 또 음성인식을 사용자 인터페이스로 사용할때 어떤 방식을 사용해야효과적인지 등의 연구가 부족하다.물론 컴퓨터의 성능과 음성인식기술이 발전함에 따라 상황이 변하고 있다.몇년 내 음성인식의 이용이 가속화하여 여러 분야의 휴먼 인터페이스에 적지않은 변화가 올 것으로 예견되고 있다.음성인식은 응용분야와 사용기술에 따라 여러가지 종류가 있다.우선 특정 사용자의 음성만을 인식하는 화자종속 음성인식과 여러사람의음성을 인식하는 화자독립 음성인식을 들 수있다. 화자종속 음성인식은 화자독립 음성인식에 비해 인식률이 높아 실용화하기에 유리하다. 스프린트가서비스하는보이스 폰카드는 30개까지의 이름을 저장해두고, 전화걸 때 사람이름만 이야기하면 그 사람의 전화번호를 찾아자동으로 전화를 걸어주는 것으로, 화자종속 음성인식의 대표적 예다.화자독립 음성인식의 예는 AT&T가 수신자부담 전화를 응용한 것으로 수신자부담 전화를 수신자가 받아들일 것인지여부의 대답을 인식하는 기능을 수행한다. 현재 인식률은 화자종속 음성인식이 95~98%, 화자독립 음성인식이90~97% 정도이다.또 음성인식의 단위에 따라 고립단어 및 연속음성인식으로 나눌 수 있다.고립단어인식은 짧은 음성명령이나 간단한 음성제어 등에 주로 사용된다.숫자음을 인식하여 음성버튼으로 사용하는 경우 「1」이라는 다이얼 버튼을 누르는 대신 「일」이라고 말을 하면된다. 고립단어인식은 인식률이 높고 구현하기 간단해 널리 이용되고 있으나 사용자가 이용하기 불편하다는 것이단점이다.연속음성인식은 문장을 인식하기 때문에 사용자가 단어 단위로 끊어 발음하지 않아도 된다. 이 시스템은 종전인식률이 95% 이하이고, 인식 어휘 수에도 제약이 많았다. 그러나 최근 알고리듬 개선, 인간공학기술 이용등으로1천~3천어휘에 95% 이상의 인식률을 보인다.수백어휘 이내의 단어를 인식하는 소어휘시스템은 인식률과 신뢰도가 높다. 그러나 어휘가 제한돼 특정 응용분야를지원하는 시스템으로만 개발되고있다. 대어휘 시스템의 경우 수만단어 어휘까지 인식 가능하지만 인식률이낮고 말할때 사용자가 발음에 주의를 기울여야 하는 불편이 있다.80년대까지는 사용자가 또박또박 발음해야 하는 낭독체 음성인식기술이 주로 개발됐다. 그러나 최근에는 사람과대화하듯이 자연스럽게 말하는 대화체음성인식에 많은 연구를 집중하고 있다. 현재 세계 수준은 2천~3천단어로이루어진 대화체의 인식률이 약 70% 정도 된다.음성인식에 필요한 어휘 수를 줄이기 위해 사용하는 단어부분(Word Spotting) 음성인식기술이 있는데 이 기술은 문장중 키워드만을 찾아내 인식하는것이다. 예컨대 전화안내시스템에 『저어, 총무과 좀 바꿔주세요』라는 문장이입력되면 「총무과」만을 인식해 전화번호를 알려주는 것이다. 이 기술을이용하면 적은 어휘로 다양한 문장을받아들일 수 있는 장점이 있다. 프레지어스포팅(Phrase Spotting) 음성인기술은 한 문장 내에서 연속단어 열을 찾아내는것으로 워드스포팅보다 더 잘 동작한다.음성인식시스템은 보통 마이크로입력된 음성신호를 보통 16KHz로 표본검출, 신호분석을 거친다. 이 신호분석시인간의 청각필터 특성을 감안하기도한다. 그 결과는 10msec간격으로 특징벡터라 불리는 숫자 열을 구성한다.특징벡터는 음향분석(Acoustic Analysis)을 거치게 되는데 이 때 두 가지의 음향모델(Acoustic Model)을 이용할 수 있다.한가지는 인식대상 단어, 음소등 어떤 특징벡터를 모델로 설정하고 이와 얼마나 유사한가 비교(Match)하는방법과 또다른 한가지는 상태열(State Sequence)을 비교대상으로 쓸 수가있다. 상태열은 복잡한 모델을 표시할 수 있어 간단한단어인식을 제외하고는 대부분 이를 이용한다. 음향모델로는 단어, 음절, 반음절, 음소 등 다양한 단위를 사용할 수있다.음향분석으로 구해진 프레임 스코어(Frame Score)를 DTW(Dynamic Time Warping)나 비터비 서치(Viterbi Search)를이용해 시간적 배열(Time alignment)을 하게 된다. 이는 앞단계에서 구한 프레임 스코어의 열로부터 각 상태열간 어떤관계가 있는가, 즉 음소 사이의 관계, 단어간 시간적 배열관계를 이용해 최종적으로 단어의 열을 찾아내는 것이다.이는 문맥분석 등 자연어처리에 의해 인식결과를 더욱 향상시킬 수도 있다.DTW는 Dynamic Programming 방법을 패턴매치에 이용하는 것으로 고립단어인식에 이용될 수 있다.HMM은 음의 상태가 한 상태에서 다음 상태로 바뀌는 것을 천이 확률로 표현한다. HMM은 음성의 시간적 특징을비교적 잘 반영하는 뛰어난 특성으로인해 음성인식에 가장 널리 이용되고 있다.HMM은 매우 유용하나 몇가지 단점을 갖고 있다. 우선 모든 확률이 현재 상태에만 의존한다는 가정(1st orderassumption)하에 처리한다는 점이다. 이는 조음효과(Coarticulation)를 충분히 모델링하기에 부족하다. 또 HMM은 이웃한입력 프레임이 서로 상관관계를 가지고 있음에도 이를 독립적으로 처리하는 단점이 있다. 이러한 단점은 HMM이문맥에 의존하는 음소모델을 사용하여야만 성능을 발휘할 수 있게 하고 이는 방대한 변수를 다루어야 하는 문제를야기한다.인공신경망은 입력과 출력사이의 비선형 함수관계를 학습하는 특성을 가지고 있으므로 HMM의 단점을 보강하는수단으로 많이 연구되고 있다. 그러나현재의 인공신경망이 가지고 있는 문제점은 시간적인 상관관계를 잘 학습하지못하는 점이다. 따라서 인공신경망과 HMM을 결합한 모델이 많이 이용된다.음성인식기술을 응용한 시스템은 많다. 우선 받아쓰기 시스템을 들 수 있는데 여기에는 특정양식의 받아쓰기와자유로운 받아쓰기의 두 종류가 있다.자유로운 받아쓰기는 편지, 원고 등 임의문장을 조용한 사무실에서 오퍼레이터용 마이크를 통해 수만단어 어휘를받아쓸 수 있다. 드래곤사, IBM, 크르츠웨일사가 이같은 시스템을 팔고 있다. 특정양식의 받아쓰기는 보험서식이나병원의 응급환자 보고서식과 같은 특정양식의 보고서를 작성하는 데 사용된다. 이 때는 문맥지식을 이용할 수있으므로 자유로운 받아쓰기보다 인식률이 높고 또박또박 발음하지 않아도 된다.음성 컴퓨터 인터페이스는 손과 눈을 쓰지 않고 입력할 수 있는 자유를 가져다 준다. 애플컴퓨터는 매킨토시에캐스퍼라는 음성인식시스템을 장착해판매하고 있다. 마이크로소프트도 윈도 OS에 곧 음성인식시스템을 포함할예정이다. 특히 PDA는 키보드를 쓸 수 없어 음성인식기능이 절실히 요구된다.애플은 뉴턴 PDA에 이를 이용하고 있으나 아직 인식률이 사용자의 요구 수준에 이르지 못하고 있다.음성만을 사용하는 전화이용서비스는 114 안내시스템처럼 항상 사람이 처리해야 한다. 그러나 이는 막대한 인건비가소요되므로 음성인식의 필요성이절실한 분야 중 하나이다. 실제 세계 각국의 전화회사가 가장 많이 음성인식연구에투자를 하고 있으며, 음성 다이얼링 등 많은 응용 분야가 실용화되고있다.이 밖에도 각종 분야의 시스템에 명령어 인식 또는 데이터 이용을 위해 음성인식 연구가 진행되고 있다.우리나라는 고유한 언어를 사용하고 온 국민이 국어에 대한 사랑이 각별하기 때문에 한국어 음성인식은 많은사람에게 관심사가 되어 왔다. 그러나 독자적인 언어체계를 유지 발전시키려면 지금보다 훨씬 더 많은 노력을기울여야 할 것이다.현재 국책연구로는 ETRI가 음성언어 번역연구의 일환으로 정보통신부의 지원을 받아 대화체 음성인식기술을연구하고 있다. ETRI는 이 연구에서 쌓은기술의 실용화를 위해 앞으로는 산업체 연구원의 파견을 받아들여 각업체의실용화를 돕는 연구를 수행할 계획이다. 삼성전자는 최근 음성명령어를 인식하는 PC를 발표한 바 있다.아직 초보적인 단계로 실용적인 수준은 아니지만 음성인식 컴퓨터에 대한일반인의 인식을 높이는 데 많은 기여를하고 있다. 한국통신은 전화로 주식시세 안내를 하는 시스템을 곧 실용화할 계획이다. 이 밖에 주요 전자회사들도자동차 내의 음성인식, 공장자동화를 위한 명령어인식 등 음성언어 연구에 힘을 기울이고 있다.지금까지 음성인식 연구는 대학을 중심으로 주로 실험실 내의 인식률을 높이는 데 주력해 왔다. 그러나 이제 어떻게실용화하느냐가 중요한 문제로 부각되고 있다. 실험에 의하면 사람의 음성인식률도 98%에 불과하다.따라서완벽하지 않은 인식률이 1백%가 되기까지 실용화를 미루기보다는 현재의 인식률을 어떻게 활용할 수있는가를 해결해야 한다. 응용분야의 적절한 선정및 인터페이스의 인간공학적인 설계 등의 방법이 해결책이 될 수있다. 물론현재 약 70% 정도인 대화체 인식률을 90% 이상으로 향상시키는 노력도 해결해야 할 과제이다.&lt출처 : 전자신문사>

자연과학| 2004.12.14| 5페이지| 1,000원| 조회(966)

인공신경망, 음성인식, 인식기술, 음성인식률

미리보기

닫기
[전자] Solder & Metal mask

Solder Metal mask ?납 [ lead ] 주기율표 제4B족에 속하는 탄소족원소. 원소기호 : Pb 원자번호 : 82 원자량 : 207.2g 녹는점 : 327.5℃ 끓는점 : 1744℃ BC 1500년경부터 인류가 사용해왔으며, 아시리아의 유적 등에서 발견되고 있다. 유럽에서는 옛날부터 납과 주석을 구별하지 않았으나, 후에는 납을 흑연(黑鉛), 주석을 백연(白鉛)이라 하였다는 기록이 있다. 또, 포에니 전쟁 당시 에스파냐에는 많은 납 광산이 있었는데, 이 광산들은 로마인(人)에게 정복되어, 로마에서는 수도관에 납을 사용하였다고 한다. 그리고 그리스·로마 시대부터 밀타승(密陀僧) PbO, 연단(鉛丹) Pb3O4, 또는 연백(鉛白) PbCO3, Pb(OH)2 등의 납화합물도 의약이나 안료로서 알려져 있었다. 고대 중국에서는 황금(금)·백금(은)·흑금(철)·적금(구리)·청금(납)의 5색금 중 하나로 여겼다.【성질】 은처럼 생긴 청백색의 무른 금속으로, 굳기 1.5, 열전도율이나 전기전도율은 모두 은의 약 8 %이다. 새로운 절단면은 금속광택을 가지지만, 공기 중에서는 녹슬어 둔탁한 빛깔이 된다. 그러나 그 녹은 표면만을 덮고 내부에는 미치지 못하므로 잘 부식하지 않는다. 할로겐·황·셀렌 등과도 직접 반응한다. 묽은 산에는 일반적으로 잘 침식되지 않지만 질산과 같이 산화력이 있는 산에는 녹는다. 뜨거운 진한 황산에 용해하면 황산 납이 되는데, 산소 존재 하에서는 아세트산과 같은 약산에도 녹는다. 알칼리에는 강하여 잘 침식되지 않는다. 보통의 금속 중에서 비중이 가장 크다. 【용도】금속재료로서는 녹는점이 낮고 무르므로 가공하기가 쉽다. 또한 마찰계수가 작고 내식성도 뛰어나기 때문에, 그 특성을 살려서 연판(鉛板)·연관(鉛管) 등으로 널리 사용된다. 이 밖에 합금재료로서 활자합금·이융합금(易融合金)·베어링합금·땜납 등으로 사용되며, 또 축전지의 전극으로도 중요하다. 납은 또한 원자번호가 크고 밀도가 커서 방사선을 차폐하는 작용이 크므로 방사선 방호재(防護材)로 금속의 세계적인 특허 기술로 제조 신뢰성이 가장 좋은 Sn-Ag-Cu계 합금 Flux의 내열성이 좋아 고온에서도 산화되지 않음사용 방식에 따른 SOLDER PASTE 구분ㆍ토출안정성 양호OZ63-410FK-53-10Ø1.0RAMULTI SPOT DISPENSINGㆍ급가열 대응ㆍ토출안정성 양호OZ63-440C-53-11Ø0.5RMADISPENSE 방식ㆍ맨하탄ㆍ미세 SOLDER BALL 대책ㆍ중간점도SSAT-333-M4RAㆍNi 도금ㆍ42ALLOY에 대하여 젖음성 양호SS63-290-L4RAㆍ개구부 0.2mm, 미세 SOLDER BALL 대책OZ63-333FV-43-9.5RAㆍ저잔사TYPE, 질소분위기 (산소농도 1000ppm이하)OZ63-713C-40-90.5RMAㆍBGA,CSP의 BUMP 형성용, 세정성 좋음OZ63-235C-42-9.5RMAㆍ개구부 0.18mmㆍ맨하탄 방지용OZ7053-221CM5-42-100.4RMAㆍ개구부 0.13mmㆍFINE PITCH 대응OZ63-381F5-9.5RAㆍ개구부 0.13mmㆍFINE PITCH 대응ㆍ맨하탄방지용OZ7053-221CM9-32-10RMAㆍ개구부 0.13mmㆍFINE PITCH 대응OZ63-221CM5-32-100.3RA인 쇄 방 식특징ㆍ용도품 명대응 PITCH (mm)FLUX Type사용방식DISPENSER는 토출 노즐의 내경(mm)을 표시함.대응 PITCH : QFPㆍSOP등의 LEAD PITCH(mm)를 표시함.FLUX 활성도 : RA=활성화(고작업성) RMA=약활성화(고신뢰성)인쇄용 SOLDER PASTE(SPARKLE OZ SERIES) SPARKLE PASTE(OZ SERIES)는 구형 POWDER와 화학적 안정성이 우수한 FLUX의 조합에 의해 폭넓은 분야에 이용하실 수 있는 SOLDER PASTE로 이루어져 있습니다.젖음성 향상 SOLDER PASTE(SS63-290-SERIES) 기기의 소형ㆍ고밀도 실장화와 프린트 기판의 KEY 접점화 등에 의해 기판에는 접점 신뢰성과 납땜성의 두기능이 요구되고에서 공정온도에 도달하면 순간적으로 녹습니다. CHIP 부품 양끝의 SOLDER PASTE의 용융시간이 달라지면 먼저 용융된 SOLDER의 표면장력에 의해 부품 전극이 끌려가게 되어 맨하탄 불량이 발생합니다.DISPENSE용 SOLDER PASTE 한 장의 프린트 기판상에 조성 및 특성을 달리하는 SOLDER의 공급 및 접착제 인쇄후의 부분적인 SOLDER PASTE의 도포 등이 필요한 경우에는 DISPENSER에 의해 SOLDER PASTE를 공급하는 방법을 써서 안정되고 양호한 공급이 가능합니다. 특징 FLUX의 분리와 경시변화를 억제한 DISPENSER용 SOLDER PASTE입니다. 0.1㎎ 단위까지 연속 미량 토출이 가능합니다. 40℃까지의 온도 조절이 가능합니다. 25℃에서 1개월 방치 후에도 거의 점도변화가 없습니다. 고 압력 토출시에도 안정된 토출성이 확보됩니다. (실린지내압 Max5.0㎏/㎠;실린지MAKER자료)MULTI SPOT DISPENSER용 SOLDER PASTE 표면실장 프린트 기판에 있어서 기능특성 및 COST외 기타의 이유로 부터 부분적인 LEAD 부품의 실장이 필요하게 되는 경우가 있습니다. 이 공정의 효율화, 자동화를 SUPPOT 하는 것이 MULTI SPOT DISPENSER/MULTI SPOT REFLOW SYSTEM입니다. 특징 MULTI SPOT DISPENSER에서 공급ㆍREFLOW하기 위하여 개발된 전용 SOLDER PASTE 입니다. 0.1㎎ 단위까지 연속 미량 토출이 가능합니다. PASTE 공급 후 24시간까지 부품삽입이 가능합니다. 또한 LEAD 삽입 시 PASTE의 이탈도 없습니다. 가열 시에 유동되지 않기 때문에 PIN HOLE의 발생도 없습니다 용도 및 사용방법에 따라 418F, 419F등의 특수한 형태도 갖춰 놓고 있습니다.FLUX Flux는, 납땜이 되는 금속표면의 산화막을 화학적으로 제거하여, 납땜이 용이하게 합니다. Flux는, 납땜에서는 빠뜨릴 수 없는 것으로, 프린트 배선판자의 땜 납부로부터 특후 별도의 사후 공정을 두어 개구부의 형성이 탁월 합니다.Metal Mask의 종류 1) Laser Mask Pitch 폭이 0.3mm ~ 0.5mm의 Fine Pitch QFP와 BGA, CSP 또는 1005 등의 작은 Chip의 실장에 대응 가능한 Mask로 정확하고 정밀한 치수 가공을 위해 Gerber Data를 이용한 Laser의 직접 가공으로 단납기 대응이 가능하며 독특한 후처리 공정으로 Sharp한 단면을 보다 정밀하게 가공합니다. 치수정밀, 0.3mm Fine Pitch 가공 Data 설계에 의한 직접가공으로 단납기 가능 Data에 의한 정확한 위치, 정밀한 Cutting으로 개구부 단면이 Sharp함 Etching에 비해 개구부 형성이 우수 대형 Size 가공이 가능 Turbo-cut을 채용한 New Yag Laser로 BGA 등 Hole 개구부 탁월 ☞ Laser Mask의 특징 신속성 : CAD/CAM Data에 의한 설계와 신속한 Laser 가공, 단납기 대응 가능 정확성 : Data에 의한 직접가공으로 치수가 정밀, 정확함 고품질 : 최적의 단면 형성으로 우수한 인쇄품질과 Solder Cream의 빠짐성Laser mask확대사진2) Photo Etching Photo Etching은 일반적으로 반도체 집적회로, CRT용 Shadow Mask, Lead Frame, Metal Mask, 초정밀 부품 등을 만들 때 사용되는 기술로 Photo 현상기술과 Etching 기술이 접목된 기술을 말한다. Photo 현상기술은 Pattern을 형성하기 위하여 SUS에 감광액을 도포하고, 노광 및 현상 후 Etching(식각)공정에서 원하는 부분만 선택적으로 가공한다. PCB와 Flim만으로 제작 가능 PCB나 COB Type의 메탈마스크도 제작 가능 Burr 현상이 발생하지 않으므로 개구부의 정밀도가 우수하다. 깊이와 크기를 자유롭게 변화시키는 Half Etching 가능 ☞ Photo Etching의 특징 경제성 : Laser보다 상대적으로 가격이 저ching 및 내벽의 거칠음이 없게함 빠짐성이 매우 좋아 Hole의 빠짐 체적이 95% 이상 가능 빠짐성이 좋은 관계로 Pattern 폭을 줄일 수 있음 Bridge 발생을 상당히 줄일 수 있음 COB, COF Mask 제작이 용이하다. 제작기간이 길어 단납기 대응이 어렵고 가격이 높다 6) PH Mask Pitch 폭이 0.3mm이하의 Fine Pitch QFP와 BGA, CSP 또는 0603 등의 미세 Chip 실장에도 대응 가능한 초정밀 실장용 마스크로 높은 가공 정밀도, 우수한 PCB 와의 밀착성, Solder Paste의 빠짐성이 아주 양호합니다. 0.3mm Fine Pitch QFP 대응이 가능 기판 두께와 개구부 측정 정밀도 ±0.07mm 평평하면서도 매끄러운 단면 형성 Solder Paste의 통과성이 양호7) COB(Chip On Board) Mask 부품이 이미 실장되어 있거나 표면에 굴곡이 있는 PCB 기판에 대응하기 위해 개발된 Mask로 COB Mask를 통해 기존과 동일한 인쇄방법으로 SMT 실장을 할 수 있으며 Additive 방식 특유의 우수한 인쇄성이 보장됩니다. 기존 SMT의 설비, 기술이 그대로 적용 가능 안정된 실장품질과 원가절감 효과 Additive 공법에 의한 일체형으로 제작해 내구성, 인쇄성이 우수 통신기기 분야의 경박단소화로 COF(Chip On Flexible Board), COG(Chip On Glass)와 같은 새로운 형태의 Package가 등장하면서 보다 정밀한 Mask가 필요함확대사진제품사진확대사진8) Excimer Mask 확대사진Metal Mask의 제작 공정도Metal Mask Cleaner의 개요 초음파세척이란 전기적 에너지를 세척액 중에서 물리적 에너지로 변환시켜 그때 발생하는 강력한 초음파 진동을 이용한 세척기술입니다. 초음파를 세척액 중에 가하게 되면 초음파의 큰 압력변화로 세척액 중에는 무수히 많은 Cavitation (진공에 가까운 공동화현상)이 생깁니다. Cavitation 현상이 연속적으로ow}

자연과학| 2004.12.14| 40페이지| 1,500원| 조회(1,544)

납, flux, 맨하탄현상, Metal Mask, SOLDER PASTE

미리보기

닫기
[음성신호처리] 음성과마음(음성신호처리)

의사소통1) 의사소통의 개념의사소통의 사전적 의미를 정의하자면 이렇다. 의사( 意思 )는 무엇을 하려고 하는 생각이나 마음이며, 소통( 疎通 )은 의사나 의견이 상대편에게 잘 통한다는 뜻이다. 한 마리로 정의하면 무엇을 하려는 생각이나 마음이 상대방에게 잘 전달된다는 것을 의미한다.대인간 의사소통은 어떤 사람이 타인에게 영향을 주고 타인을 이해하는 데 사용되는 모든 수단을 포함한다. 즉, 개인의 감정, 태도, 신념 및 사실을 전달하는 과정이다. 이때 언어가 일차적인 수단으로 사용될 수 있으나 얼굴표정, 몸짓, 눈짓, 혹은 침묵과 같은 비언어적 신호나 단서를 통해 서로 의미를 주고받을 수 있다.따라서 의사소통을 잘한다는 것은 말하는 사람이 정보를 정확히 잘 전달하며 듣는 사람이 말하는 사람의 말을 정확히 잘 듣는 것을 의미한다.2) 의사소통의 구성 요소모든 방법을 동원하여 서로간에 영향을 주고 서로를 이해해 나가는 과정인 의사소통은 다음의 4가지 요소가 작용하게 된다.⊙송신자: 생각, 감정, 정보 등의 메시지를 전달하는 사람송신자의 음성, 감정 상태 등으로 인해 메시지가 전달되는 과정에서 왜곡, 변형, 삭제 및 소멸 등의 현상이 나타나 정확한 내용의 전달을 어렵게 할 수 있다.⊙수신자: 송신자가 전달하는 메시지를 듣고 받아들이는 사람전달된 메시지의 종착점이라 할 수 있으며 정취, 이해, 기억, 반응의 요소가 포함된다.⊙피드백: 송신자와 수신자를 연결하여 송신자의 메시지가 수신자에게 제대로 전달되고 정확히 이해될 수 있게 한다. 송신자는 수신자의 피드백을 통해 자신의 의사소통 방법을 수정, 보완함으로써 메시지가 보다 정확하게 전달되도록 한다.⊙메시지의사소통 과정에서 주제가 되는 메시지는 언어적 혹은 비언어적 형태를 취할 뿐 아니라 내용과 관계라고 하는 두 가지 요소가 포함된다. 내용 요소는 전달하고자 하는 메시지의 주제를 가리키며, 관계 요소는 송신자의 수신자에 대한 관계, 즉 소속·통제·애정 들의 욕구가 내재된 형태를 의미한다.·친화형: 서로 좋아하고 친밀한 관 그렇게 행동하는 것이 나를 무시하는 것 같이 생각되어서 나의 감정을 불쾌하게 만들었기 때문이다. 나는 네가 시간 약속을 잘 지켜 주기를 바란다."(2) 적극적 경청경청: 의사소통의 기본적 과정으로서 상대방이 전달하고자 하는 메시지 내용에 주의를 기울이고 이해하려고 노력하는 행동- 소극적 경청 : 수동적으로 들어주는 형태로써 상대방의 이야기에 대해 질문하거나 반박하는 것과 같은 외현적 표현을 하지 않고 들어 주는 것- 적극적 경청 : 자신이 상대방의 이야기에 집중하고 있다는 것을 상대가 지각할 수 있도록 외현적인 표현을 하면서 듣는 형태이다.■ 반영반영하기는 의사소통 과정에서 상대방이 전달하고자 하는 내용에 대해 자신이 이해하고 있는 정도를 나타내 보이는 것이다. 대화중에 자신이 이해한 내용이 정확한지를 확인하는 과정은 상대방으로 하여금 자신이 전달하고자 한 내용이 관심을 받고 있으며 이해받고 있다는 느낌이 생기게 하여 대화과정에 참여하는 정도가 더욱 높아지게 된다.■ 공감상대방이 전달한 내용에 대한 사실적인 이해의 수준을 넘어 그의 주관적인 정서 상태에 대한 이해 수준을 공감이라고 한다. 공감하기는 매우 중요한 기술로서 다음과 같은 훈련을 통해 습득, 증진될 수 있다.첫째, 자기중심적인 시각이 아닌 상대방의 입장에서 보고, 듣고, 이해하려고 노력한다.둘째, 상대가 나타내는 단순한 말의 내용과 함께 그 내면에 있는 정서적인 의미를 간과하여 헤아려 보는 노력이 필요하다. 상대방이 느끼는 감정, 심리적 상태를 그의 입장에서 느껴 보려는 감정이입의 자세를 가져야 한다.셋째, 자신이 느낀 감정을 적절하게 표현하고 전달하려고 노력한다.■ 질문하기질문은 상대방에게 추가적 정보를 요청하고 상대의 감정, 의견, 태도를 확인하는 것으로 상대방에 대한 관심과 호기심의 표현이 될 수가 있으나 자칫 의사소통 과정을 통제하는 방법이 될 수 있으므로 적절한 시기와 내용에 대한 고려가 있어야 한다.■ 설명하기자신이 지니고 있는 정보를 상대방에게 정확하고 신속하게 그리고 충분하게 제공하는signalMFCCCepstral derivatives: first order. second order derivatives are not useful for speaker recognition purpose.Cepstral mean subtraction (CMS): Non-causal. Some systems use RASTA filtering.Speaker Models for Text-Independent TasksUnsupervised acoustic representationsDominant approachesAdapted Gaussian mixture models (GMM)Does not model individual sounds or sound classesSupervised Acoustic RepresentationsUse explicit segmentation, labeling and representations of underlying acoustic classesUtilize large vocabulary continuous speech recognizer, broad phonetic class recognizerScore Normalization/Microphone CompensationTo compensate channel variabilityZnorm/HnormHandset type mappingFusion SystemsCombine several scores7. 화자인식 성능 척도For Speaker Identificationerror rateE(ID)= n(err)/n(total)For Speaker VerificationMiss/False Alarmfalse alarm (Type I error): Imposter를 true speaker로 판정함.miss (Type II error, false rejection): True speaker를 imposter로 거절함.Equal error rate (EER)flase alarm과 fal28 words (including digits and commands) is recorded using a standard enumerated prompt. The second session is a simple unidirectional dialog (the caller answers prompted questions) where personal information is asked (name, age, etc.). In the third session, the speaker is asked to read a continuous passage of phonetically balanced text that resembles a short curriculum vitae.PolyVar (ELRA)PolyVar is a speaker verification corpus comprised of native and non-native speakers of French, mainly from Switzerland. It consists of read and spontaneous speech in Swiss and French amounting to 160 hours of speech. Thirty-one speakers called from 2 to 10 times and 41 speakers made more than 10 calls.POLYCOST (ELRA)The POLYCOST corpus was collected under the COST 250 European project [7] for speaker verification. Most of the speech is non-native English with some speech in speaker’s native tongue covering 13 European countries. The speech was collected digitally over international ISDN telephone lipecific college campuses in different parts of the US for each phase. Next we briefly describe some of the aspects of the different speaker recognition corpora derived from Switchboard.SPIDRE: This corpus is a 2-CD subset of the Switchboard-I collection selected for speaker ID research, and with special attention to telephone instrument variation. It contains training and testing data for experiments in closed- or open-set identification or verification [12]. Combining the two sides of the conversations also permits speaker change detection or speaker monitoring experiments.There are 45 "target" speakers; four conversations from each target are included, of which two are from the same handset. There are also 100 calls in which no target appears. Since all conversations are two-sided, this results in 180 target sides and 180 + 200 = 380 nontarget sides.NIST Evaluation Corpus 1996: This corpus was derived from the entire Switchboard-I corpus for speaker verification evaluations [2]. The

공학/기술| 2005.01.10| 20페이지| 1,500원| 조회(540)

의사소통, 화자인식, 음성신호처리, 음성과마음, 화자식별

미리보기

닫기