IT 정보통신

AI로 2억자 '승정원일기' 번역기간 27년 단축한다

허준 기자

파이낸셜뉴스

입력 2017.12.21 08:38

수정 2017.12.21 10:06

조선시대 최고의 기밀기록으로 지난 2001년 유네스코 세계기록유산으로 지정된 3243책, 2억4000만자에 달하는 방대한 '승정원일기' 번역 작업에 최첨단 인공지능(AI)이 활용된다. 이를 통해 번역완료 기간이 27년이나 앞당겨질 것으로 기대된다.

과학기술정보통신부와 한국정보화진흥원은 21일 'ICT기반 공공서비스 촉진사업'으로 AI 기반 고전문헌 자동번역시스템 구축 과제를 주관기관인 한국고전번역원을 통해 추진하고 있다고 밝혔다. 한국고전번역원은 자동번역시스템을 개발, '승정원일기' 원문을 번역하는 작업을 추진중이다.

'승정원일기'는 조선시대 왕명(王命)의 출납(出納)을 관장하던 승정원에서 매일 취급한 문서(文書)와 사건을 기록한 조선시대의 최고의 기밀기록이다. '승정원일기' 필사 원본은 3243책으로 약 2억 4000만여 자에 이를 정도로 방대하다.
이 때문에 한국고전번역원이 지난 1994년부터 번역을 시작했지만 20년이 지나도록 인조, 고종, 순종대의 번역만 완료하는데 그쳤다. 현재 영조대 번역을 진행중이지만 전체 번역률은 20% 수준에 그치고 있다.

승정원일기를 AI 기반 번역기로 번역한 결과, 정확도가 높은 것으로 나타났다.
승정원일기를 AI 기반 번역기로 번역한 결과, 정확도가 높은 것으로 나타났다.
고전번역원 관계자는 "단순히 자료의 방대함뿐만 아니라 한문 번역자 1명을 양성하는데 최대 10년이 소요되고, 번역자 1명이 승정원일기 번역서 1책(1800매)을 담당하고 있다"며 "승정원일기 번역사업은 시간, 예산과 인력이 많이 소요되는 거대한 고전문헌 정리사업"이라고 설명했다.

이를 해결하기 위해 AI가 구원투수로 투입됐다. 인공신경망 기계번역(NMT) 기술을 활용한 고전문헌 자동번역시스템을 구축한 것이다. NMT 기술은 최근 번역 서비스들이 모두 채택하고 있는 기술로 문맥을 이해하는 자연스런 번역을 가능하게 해주는 기술이다. 구글 번역, 네이버의 번역 서비스 파파고 등도 모두 이 NMT 기술을 활용하고 있다.

이렇게 개발된 고전문헌자동번역기로 번역한 결과물은 우수한 평가를 받았다. 한국고전번역원 역사문헌번역실 승정원일기 번역자에 의해 실시된 휴먼평가에서 평균 3.0점(5점 만점)을 획득했다.

이에 한국고전번역원은 승정원일기 번역 작업이 기존에는 2062년은 돼야 완료될 것으로 예상했지만, 이번 AI 기반 번역 도입으로 기간을 27년, 대폭 단축할 수 있을 것으로 기대하고 있다. 2035년에는 총 3243권의 승정원 일기 번역이 완료될 것으로 예상된다.


서병조 한국정보화진흥원 원장은 "향후 AI 자동번역기술이 고전문헌의 번역 기간을 대폭 앞당길 것으로 기대한다"며 "4차 산업혁명 시대 대응을 위해 AI 기술을 포함한 ICT 신기술을 공공분야에 선도적으로 도입해 개발·확산을 지속할 것"이라고 강조했다. jjoony@fnnews.com 허준 기자

fnSurvey