삼육대에 따르면 송 교수는 인공지능 개발을 위해 지난해 1~6월 뉴스사이트, 블로그, 카페, SNS, 인터넷 게시판 등 237개 온라인 채널에서 언급된 코로나 관련 소셜 데이터 총 403만2883건을 수집했다.
송 교수는 수집된 데이터를 빅데이터 분석기법을 거쳐 코로나19 감정(위험·안전), 대상, 감염경로, 관련 바이러스, 증상, 대처, 예방활동, 이슈, 산업 등 10개 주제로 분류했다. 분류된 데이터들은 한 문서에서 특정 키워드가 나타난 빈도를 집계하는 '단어빈도'와 특정 키워드가 포함된 문서의 수를 집계하는 '문서빈도'로 나눠 분석했다.
송 교수는 "빅데이터 분석은 방대한 양의 데이터를 활용해 사회적 문제를 예측하고, 현상에 대한 복잡한 연관관계를 보다 정확하게 밝혀낼 수 있다"면서 "이 같은 인공지능 개발방법을 적용함으로써 코로나뿐만 아니라 다양한 사회적 위험요인을 사전에 예측하고, 대응체계를 마련할 수 있을 것으로 기대한다"고 말했다.
gloriakim@fnnews.com 김문희 기자
※ 저작권자 ⓒ 파이낸셜뉴스, 무단전재-재배포 금지