IT >

서치퍼트, 문서검색 포털 시대 연다

노범석 서치퍼트 대표, 6일 기자간담회
[파이낸셜뉴스] "PC에 데이터를 더 이상 보관할 필요 없이 문서와 관련된 모든 불편을 해소하는 통합 서비스가 되겠다."
노범석 서치퍼트 대표(사진)가 6일 서울 수표동에서 기자간담회를 열고 문서검색 포털서비스 '서치퍼트'의 목표를 이 같이 밝혔다.

서치퍼트는 약 7개월의 베타서비스 기간을 거쳐 지난달 16일 정식 출시됐다.

서치퍼트는 대법원, 감사원, 국세청 등 공공기관, 정부부처 214곳에 500만건(약 1억 5000만 페이지)의 문서를 제공하고 있다.

문서는 입법, 법무, 준법, 세무, 기업공시, 정책연구, 선거와 정당, 대통령위원회, 공정거래, 중소벤처 등 카테고리를 데이터 세트로 구분해 제공된다. 이를테면 입법정보는 16대 이후 국회에서 발행된 모든 문서를 포함하고 있고, 중앙정부는 각 부처에서 발행한 '최초일'부터 최근일까지 모든 문서를 제공한다.

서치퍼트가 제공하는 문서 데이터는 약 6테라바이트(TB) 규모로, 국내 최대 규모다.

노범석 서치퍼트 대표가 6일 서울 수표동 패스트파이브에서 기자간담회를 열고 있다. 서치퍼트 제공
노범석 서치퍼트 대표가 6일 서울 수표동 패스트파이브에서 기자간담회를 열고 있다. 서치퍼트 제공

서치퍼트는 또 연구 목적의 경우 보유한 문서 데이터를 무상으로 제공할 계획도 공개했다. 대학, 연구소 뿐만 아니라 상업용이 아니라 서비스 개발을 목적으로 하는 비정형 데이터 필요로 하는 기업에 제공하겠다는 것이다. 이를 통해 국내 인공지능(AI) 연구 활성화를 기대하고 있다.
박준 서치퍼트 연구소장은 "AI에서 가장 중요한 것은 데이터로, 문서 데이터를 통해 한국어 자연어처리 기반기술을 향상할 수 있을 것"이라면서 "또 검색기술, Q&A 챗봇, 고유명사 자동인식, 자연어 기반 문서 분류 등을 기대할 수 있다"고 설명했다.

향후 서치퍼트는 문서검색 외에도 문서 모니터링을 하는 와이드 워처, 내 문서를 검색하는 서치다큐, 절판 도서를 월 정액제로 마음껏 볼 수 있는 딥페이퍼 등 진화된 서비스를 내놓을 계획이다. 노 대표는 "문서 데이터의 양이 점점 방대해지면서 특정 문서의 경우 검색에 제한적일 수도 있다"면서 "서치퍼트는 일을 효율적으로 하고자 하는 전문가의 업무 능력을 획기적으로 향상시킬 수 있을 것"이라고 강조했다.

gogosing@fnnews.com 박소현 기자