2024.05.18 (토)

  • 맑음속초25.6℃
  • 맑음21.5℃
  • 맑음철원20.4℃
  • 맑음동두천19.8℃
  • 맑음파주19.2℃
  • 맑음대관령17.9℃
  • 맑음춘천22.3℃
  • 맑음백령도15.4℃
  • 맑음북강릉23.8℃
  • 맑음강릉26.5℃
  • 맑음동해25.2℃
  • 맑음서울20.8℃
  • 맑음인천19.2℃
  • 맑음원주23.1℃
  • 맑음울릉도20.0℃
  • 맑음수원20.1℃
  • 맑음영월20.4℃
  • 맑음충주20.5℃
  • 맑음서산20.0℃
  • 맑음울진25.0℃
  • 맑음청주23.6℃
  • 맑음대전21.9℃
  • 맑음추풍령19.5℃
  • 맑음안동20.9℃
  • 맑음상주21.7℃
  • 맑음포항26.2℃
  • 맑음군산19.6℃
  • 맑음대구24.7℃
  • 맑음전주21.4℃
  • 맑음울산22.9℃
  • 맑음창원19.5℃
  • 맑음광주22.8℃
  • 맑음부산18.9℃
  • 구름조금통영18.1℃
  • 맑음목포21.1℃
  • 맑음여수19.7℃
  • 맑음흑산도16.4℃
  • 맑음완도17.6℃
  • 맑음고창
  • 맑음순천16.6℃
  • 맑음홍성(예)20.9℃
  • 맑음21.3℃
  • 맑음제주20.4℃
  • 맑음고산18.5℃
  • 맑음성산18.0℃
  • 맑음서귀포19.3℃
  • 맑음진주20.6℃
  • 맑음강화17.3℃
  • 맑음양평22.1℃
  • 맑음이천21.7℃
  • 맑음인제19.8℃
  • 맑음홍천21.1℃
  • 맑음태백18.9℃
  • 맑음정선군19.9℃
  • 맑음제천19.3℃
  • 맑음보은19.8℃
  • 맑음천안21.2℃
  • 맑음보령18.0℃
  • 맑음부여20.0℃
  • 맑음금산20.8℃
  • 맑음21.3℃
  • 맑음부안19.2℃
  • 맑음임실21.1℃
  • 맑음정읍20.2℃
  • 맑음남원22.5℃
  • 맑음장수17.9℃
  • 맑음고창군20.8℃
  • 맑음영광군20.2℃
  • 맑음김해시20.4℃
  • 맑음순창군22.3℃
  • 맑음북창원21.9℃
  • 맑음양산시21.1℃
  • 맑음보성군17.6℃
  • 맑음강진군19.7℃
  • 맑음장흥18.4℃
  • 맑음해남19.2℃
  • 맑음고흥17.7℃
  • 맑음의령군20.1℃
  • 맑음함양군20.0℃
  • 맑음광양시20.3℃
  • 맑음진도군19.1℃
  • 맑음봉화17.9℃
  • 맑음영주21.5℃
  • 맑음문경20.5℃
  • 맑음청송군17.2℃
  • 맑음영덕22.5℃
  • 맑음의성19.1℃
  • 맑음구미20.9℃
  • 맑음영천24.8℃
  • 맑음경주시22.9℃
  • 맑음거창19.7℃
  • 맑음합천22.6℃
  • 맑음밀양22.2℃
  • 맑음산청21.0℃
  • 맑음거제17.6℃
  • 맑음남해18.1℃
  • 맑음19.3℃
기상청 제공
표준뉴스 로고
ETRI, 24개 언어 이해하는 음성인식 기술 개발
  • 해당된 기사를 공유합니다

국내표준

ETRI, 24개 언어 이해하는 음성인식 기술 개발

글로벌 업체와 대등한 국내 최다언어, 최고성능 음성인식
30개어 연내 확보, 희소언어 확장에 걸림돌 해결할 것

17일-2.JPG
▲ 사진1 (출처: ETRI)


국내 연구진이 한국어와 영어, 중국어, 일본어뿐만 아니라 독일어, 프랑스어, 스페인어, 러시아어 등 세계 주요 24개 언어를 인식할 수 있는 음성인식 기술을 개발했다. 디지털 전환의 시대, 음성인식을 바탕으로 인공지능(AI) 비서, AI 튜터 등 다양한 AI 서비스 확산에 큰 도움이 될 전망이다.

 

한국전자통신연구원(ETRI)은 세계 주요 24개 언어를 음성으로 인식, 문자로 변환할 수 있는 『대화형 인공지능(Conversational AI) 기술』을 개발했다고 밝혔다. ETRI가 개발한 음성인식 기술의 성능은 구글(Google) 등 글로벌 업체와 비교해 한국어에서는 우위, 타 언어에서는 대등한 수준이다.

 

기존 음성인식 기술을 개발하기 위해서는 대규모 학습데이터가 필요해 다국어 확장과 음성인식 성능 확보가 쉽지 않았다. 연구진은 ▲자기 지도학습 ▲의사 레이블 적용 ▲대용량 다국어 사전 학습 모델 ▲음성 데이터의 오디오 데이터 생성(TTS) 증강 기술 등을 통해 언어 확장의 어려움을 해결했다.

 

또한, 연구진은 기존에 흔히 활용되던 종단형(End-to-End) 음성인식 기술의 단점을 개선해 활용성을 높였다.

 

느린 응답속도의 문제는 스트리밍 추론 기술을 개발, 실시간 처리가 가능하도록 개선했다.

 

아울러, 의료와 법률, 과학기술 등 특정한 도메인에 대한 음성인식 특화가 쉽도록 하이브리드 종단형 인식 기술도 개발해 적용했다.

 

ETRI는 지난 2020년 종단형 음성인식 기술을 개발한 후, 30여 개의 국내·외 기업에 음성인식 기술을 이전했다. 이를 통해 기업들은 ▲회의록 작성 ▲자막 통역 ▲키오스크 ▲의료·교육 ▲AI 컨택센터 등 다양한 AI 서비스에 ETRI의 음성인식 기술을 활용 중이다.

 

연구진은 이번 다국어 확대와 응답 속도 지연 해결 등 신기술 적용을 통해 음성인식 기술 활용 범위를 확대, 사업화를 추진할 예정이라고 밝혔다. 특히, 올해 안으로 지원 언어를 30여 개로 확대하고, 국내·외 전시 참여와 기업체 설명회를 통해 동남아와 남미, 아랍권 등을 대상으로 사업화를 적극 추진할 예정이다.

 

ETRI 복합지능연구실 김상훈 책임연구원은“국내기술로 글로벌 선도업체와 대등한 수준의 음성인식 기술을 개발했다는 데 의의가 있다. 본 기술이 우리나라 인공지능 분야의 글로벌 경쟁력을 높이고 기술자주권을 확보하는 데 큰 도움이 되길 바란다”고 말했다.

 

연구진은 본 기술이 지난 20여년 간 음성인식 기술 개발에 매진해온 결과라고 설명했다.

 

연구진은 그동안 2018 평창 동계 올림픽 공식 자동통역 서비스에 핵심 기술을 제공한 바 있다. 현재 ETRI에서는 공공인공지능 오픈 API·DATA 서비스 포털(https://aiopen.etri.re.kr/)을 통해 11개 언어의 음성인식 서비스를 제공하고 있다.

 

또한, 이번 연구성과를 기반으로 24개 언어로 음성인식 서비스를 확대해 중소·벤처기업, 학교, 개인 개발자 등 다양한 사용자들에게 다국어 음성인식 관련 사업 기회를 제공할 예정이다.

 

본 기술은 과학기술정보통신부 “자율성장형 복합인공지능 원천기술연구”사업의 일환으로 개발되었다.

 

지난 사업 기간동안 연구진은 국내·외 논문 17편, 특허 43건, 기술이전 20건과 19억원의 기술료 수입을 거뒀다.

 

 

17일-2-2.jpg
▲ 사진 2 (출처: ETRI)

 










포토

 
모바일 버전으로 보기