의학·과학 건강

[인터뷰] "의료빅데이터 신약개발 활용하려면 표준화되고 비식별화된 데이터부터 마련해야"

정명진 기자

파이낸셜뉴스

입력 2017.07.04 18:43

수정 2017.07.04 18:43

앤드류 카셀 메디데이터 데이터분석총괄
임상시험은 컨트롤 된 단계서 진행돼 실제 데이터와 차이있는 경우 많아
희귀병 경우엔 환자 모집도 힘들어
의료빅데이터 이용땐 제약사가 환자정보 먼저 확보 가능해 도움
"의료빅데이터를 신약개발에 사용하기 위해서는 데이터 표준화와 개인정보보호를 위한 비식별화가 가장 중요하다."

앤드류 카셀 메디데이터 데이터분석총괄은 4일 진행한 인터뷰에서 제4차 산업혁명에서 주요 아젠다인 빅데이터가 신약개발 현장에서 본격적으로 사용되면 굉장한 파급력을 가져올 것이라며

이같이 말했다. 하지만 이를 사용하기 위해서는 2가지 전제조건이 필요하다고 강조했다. 데이터 표준화와 비식별화된 데이터 제공이다.

메디데이터는 생명과학분야 임상연구를 위한 클라우드 기반 솔루션을 통해 임상시험 계획부터 설계, 관리, 분석, 보고를 아우르는 전 과정에서 비용절감과 데이터 품질 개선에 도움을 주고 있다.

신약개발에 의료빅데이터가 어떻게 사용되고 어떤 역할을 하는지 카셀 데이터분석총괄에게 들어봤다.


앤드류 카셀은 2002년 펜실베이니아 주립대 공학학사로 졸업한 후 액센츄어에서 10여 년 간 IT 및 경영 컨설턴트로 재직했다. 이 때 세계 유수 제약기업 R&D 부서와 협업하고, 임상개발 조직 및 기술을 최적화하는 작업을 도왔다. 지난 2011년 메디데이터에 입사한 이후에는 고객 및 분석 분야에서 다양한 역할을 맡아왔다. 카셀은 현재 메디데이터의 분석 부문 비즈니스를 이끌며, 조직의 전략과 솔루션을 개발하고 8개 제품 포트폴리오를 관리하는 업무를 책임지고 있다. 카셀의 팀은 메디데이터의 축적된 운영 및 임상 데이터 자산에 기반한
앤드류 카셀은 2002년 펜실베이니아 주립대 공학학사로 졸업한 후 액센츄어에서 10여 년 간 IT 및 경영 컨설턴트로 재직했다. 이 때 세계 유수 제약기업 R&D 부서와 협업하고, 임상개발 조직 및 기술을 최적화하는 작업을 도왔다. 지난 2011년 메디데이터에 입사한 이후에는 고객 및 분석 분야에서 다양한 역할을 맡아왔다. 카셀은 현재 메디데이터의 분석 부문 비즈니스를 이끌며, 조직의 전략과 솔루션을 개발하고 8개 제품 포트폴리오를 관리하는 업무를 책임지고 있다. 카셀의 팀은 메디데이터의 축적된 운영 및 임상 데이터 자산에 기반한 예측모델 기술을 통해 임상시험 결과를 최적화하는데 주력하고 있다. 초기 종양학 연구 분야에서 과거 임상시험에 참여했던 환자들을 현재 임상시험 참여 환자들과 대조해 비교하는 '합성대조군SCA' 개발을 진행했다. 또 임상 연구의 타당성 제고와 효율적인 연구기관 선정을 위해 실제 처방 근거 데이터, 대조 연구 기관과 연구자 결과 데이터를 활용하는 프로젝트 등을 수행했다. 사진=서동일 기자

―의료빅데이터가 언제부터 신약개발에 활용되고 있나.

▲의료빅데이터를 이용한 신약개발 컨설팅은 초기 단계라고 보면 된다. 메디데이터처럼 의료빅데이터를 신약개발에 적용하는 회사가 아직 없을 정도다. 새로운 개념이 신약개발에 들어온 것이다. 유전체 분석데이터도 마찬가지다. 실제 메디데이터에서 이전 임상시험 데이터 기반으로 합성대조군 구성해 신약개발을 진행하는 연구는 4건이 있다. 아직 컨설팅이 종료된 것은 없다.

―이전에 메디데이터는 제약사와 어떤 일을 진행했나.

▲글로벌 톱 제약사 25개 중 18개가 우리 고객이다. 메디데이터는 1999년 설립돼 임상연구 솔루션을 제공하고 있다. 이 때문에 의료빅데이터 컨설팅으로 자연스럽게 이어진 것이다.

―기존 임상 디자인과 메디데이터 솔루션을 활용한 임상 디자인은 어떤 차이가 있나.

▲메디데이터 솔루션을 활용하면 좀 더 빠르게 임상을 진행할 수 있다. 수치로 보여주면 △환자등록률 미달 연구기관수 31% 감소 △임상시험 등록률 40% 향상 △근거문서확인(SDV) 범위 34% 감소 △프로토콜 복잡성 49% 감소 △eCRF(전자증례기록서) 설계 기간 33% 단축 △eCRF 재사용 61% 증가 △피험자 방문시 수집된 정보에서 발생한 쿼리 해결 시간 53% 감소 △연구기관 모니터링 방문 연간 평균 7일 단축 등으로 확인됐다. 이 솔루션과 의료빅데이터를 결합하면 좀 더 신약개발 기간을 줄이는데 도움이 된다.

―신약개발에 의료 빅데이터 실제 사례는.

▲기존 임상연구에서 나온 데이터를 재활용하는 것이다. 예를 들어 한 고객사의 경우는 급성 골수성 백혈병 치료제를 개발하기 위해 임상 1b상을 진행하고 있었다. 이 임상시험을 2상 이상으로 진행시킬 것인가에 대해서 고민중이었다. 하지만 그 결정을 내리는 데 근거가 될만한 데이터가 많지 않았다. 즉, 대조군이 되는 데이터가 없었던 것이다. 급성 골수성 백혈병 환자의 경우 숫자가 많지 않아 충분한 데이터가 없었기 때문이다. 하지만 메디데이터가 합성대조군에 대한 데이터를 비식별화된 방식으로 제공할 수 있었다. 이를 통해 2상으로 진행하겠다라는 결정을 내렸다. 이 내용은 최근 개최된 '2017 미국임상종양학회(ASCO)'에서 발표됐다. 당시 MD앤더슨암센터에서는 대량의 환자 데이터에서 추출된 합성대조군이 임상 개발 과정 초기 단계에서 새로운 통찰을 제공할 수 있는 가능성을 제시했다고 평가한 바 있다.

역시 아스코에서 발표한 것으로 미국국립보건원(NIH)에 암 게놈으로 등록된 540개 유방암 관련된 유전자를 삼중음성유방암 치료제 개발에 적용한 사례도 있다.

―의료 빅데이터는 어떻게 활용되고 있나.

▲임상시험 연구를 설계하는 과정 보면 실제 데이터와 차이가 있는 경우가 있다. 특히 유효성 검사결과는 차이가 나는 경우가 많다. 임상시험은 컨트롤된 환경에서 진행하기 때문이다. 이 때문에 데이터에서 많은 정보를 얻고 있다. 임상 설계하는 과정에서 타겟을 잡는 등의 설계에 도움이 된다. 또 임상시험을 할 때 적합한 환자를 찾는 게 중요하다. 의료빅데이터를 이용하면 제약사에서 환자정보를 먼저 확보하는 방법으로 변경될 수 있다. 특히 희귀병의 경우 환자 모집이 어렵기 때문에 이를 활용하는 게 도움이 될 수 있다.

―의료데이터는 어떻게 수집했나.

▲다른 제약사가 과거에 진행한 임상연구에서 데이터 얻었다. 현재 시판중인 약물에 대한 데이터들이다. 이 데이터들은 고객사에서 제공해준다. 하지만 모든 고객사가 다 데이터를 제공해주지 않는다는 한계가 있다.

―의료빅데이터 수집에서 가장 중요한 것은 어떤 것인가.

▲임상에 참여하는 환자들의 개인정보를 보호하는 것이다. 이를 위해서는 데이터 표준화와 비식별화 데이터를 만드는 것이 중요하다. 메디데이터의 경우 데이터 사이언스팀 절반 정도의 인원인 30여명 정도가 풀타임으로 데이터 표준화 작업에 매달리고 있다. 아무리 많은 데이터가 있더라도 이를 사용할 수 있도록 각 데이터를 조건에 맞게 표준화해야 한다. 최근에는 데이터 표준화를 자동화하는 프로그램도 사용하고 있다. 이를 통해 예측 모델링 등을 뽑아내는 것이다. 또 개인정보보호의 경우에는 비식별화된 방식으로 제공한다. 예를 들어 환자의 전화번호 등 개인정보를 제공하는 게 아니라 몇 세, 몸무게 등 디코딩된 정보를 환자1, 환자 2 이런 식으로 만드는 것이다. 이는 기존 임상데이터와는 다르다고 보면 된다.

―빅데이터 수집하는 정책들이 각국마다 다르다. 미국의 경우는 어떤가.

▲각 국에서는 임상연구에 참여하는 환자의 프라이버시 보호가 주요 정책이라고 할 수 있다. 하지만 규제환경이 변화하는 것은 업계에서 이를 활용하기 위해 논의를 하고 있기 때문이다. 예를 들어 로슈, 사노피, 글락소 스미스클라인(GSK) 등 주요 다국적 제약사 10곳이 설립한 트랜스셀러레이트(TransCelerate)의 경우 임상시험 기준의 간소화.표준화를 통해 신약개발을 가속화하는 데 목적을 둔 비영리 단체가 있다. 이들은 미국 식품의약국(FDA)에도 임상연구에 관련된 데이터를 어떻게 활용할 수 있는가에 대해서 제안한다. 또 메디데이터도 FDA뿐만 아니라 미국 외 규제조직과 논의를 하고 있다. 신약개발에 사용되는 합성대조군이라는 개념도 승인을 받기 위해 어떻게 할 것인가에 대해서도 논의중이다.

―빅데이터를 공유하는 클라우드는 어떻게 사용하고 있나.

▲메디데이터가 창립된 후 제공하는 모든 솔루션은 클라우드 상에서 존재해왔다. 따라서 클라우드 기반 솔루션으로서 SAS(Software As Service)의 초기 얼리어답터라고 할 수 있다. 고객 입장에서 상호작용하는 모든 툴은 클라우드 상에서 이뤄진다. 그래서 추가적 업로드 필요치 않다. 그래서 솔루션 활용해서 데이터 입력할 경우 그것이 클라우드 상에서 자동적으로 기록되기 때문이다. 이를 위해서 자체 솔루션을 활용한다던지 아니면 프라이빗 호스팅 센터를 통해서 데이터를 안전하게 저장하는 작업하고 있다. 데이터를 취급하고 안전하게 저장하는 것은 중요한 부분이기 때문이다. 이 팀을 이끄는 리더는 과거에 미국 정부에서 데이터 프라이버시 관련해서 활동한 경력을 가지고 있다.

―한국의 경우 개인정보보호를 강하게 하기 때문에 의료데이터를 클라우드에 올리는데 규제가 있다. 다른 나라는 어떤가.

▲유럽도 강력한 개인정보보호 환경을 갖고 있었다. 하지만 프라이버시에 대처하는 방식도 익명화된 데이터, 비식별 데이터를 통해서 공유하는 식으로 진화했다. 또 진화는 지속적으로 진행중이다. 미국도 정부 차원에선 개인정보보호에 대해 상당히 엄격한 규제 갖고 있다. 하지만 동시에 의뢰사를 대신해서 데이터를 어떻게 공유하고 데이터를 클라우드 상에서 어떻게 저장하는 지에 대해서 정부가 의지를 가지고 논의 중이다.

한국의 경우 비슷한 상황을 이미 경험한 다른 국가를 통해 교훈을 얻을 수 있을 것이다. 유럽은 데이터 프라이버시에서 성숙한 나라로 성장을 했다. 미국도 마찬가지다. 이들 국가를 참조한다면 한국도 빠르게 성장을 할 수 있을 것이다. 지금 규제는 모든 데이터에 한해 이뤄지는 게 아니라 타겟화 돼서 이뤄지고 있다. 예를 들어 전자적인 의무기록이라든지 아니면 유전자 데이터에 타겟돼서 규제가 많이 이뤄지고 있는 상황이다. 이런 상황에서 제약사들은 데이터를 어떻게 운영할 것인가, 규제당국과 어떻게 협조할 것인가에 대해서 생각해볼 필요 있다. 그리고 민간기업과 규제당국 간 많은 대화가 필요하다. 대화를 해야 규제당국이 내놓는 규제가 합당한 규제로 변화될 것이라고 생각한다.

메디데이터의 경우 각 국의 개인정보보호를 파악하는 부서도 있다. 이 부서에서 CPO(chief privacy officer)라는 직책을 가진 사람이 각 국의 프라이버시 규제 환경을 이해하고 해석하는 데 할애를 하고 있다. 그래서 데이터 핸들링 방법, 핸들링 프로세스, 관련 기술이 전세계 개인정보호법을 준수하는지에 대해서 지속적으로 노력 중이다.

―메디데이터에서 환자 전자정보를 갖고 있나.

▲환자 데이터는 의뢰사를 통해 접근하고 있다. 현재 역학 데이터 상당히 많은데 이 데이터는 구매가 가능하다. 규모가 큰 의뢰사의 경우에는 연간 1000만~3000만 달러 들여서 환자 데이터를 구매하고 있다. 이 데이터를 제공하면 메디데이터 시스템에서 분석 목적으로 사용하게 된다.

―한국 제약사의 신약개발 수준은 어느 정도라고 생각하나.

▲최근 여러 글로벌 제약사에서 한국의 신약개발에 대해 많은 관심을 보이고 있다. 이는 한국 신약개발 시장이 성숙했다는 증거다. 특히 한국 병원이 세계적인 수준이고 규제도 잘 이뤄지는 등 임상 인프라가 잘 갖춰져 있다는 것도 고무적이다. 메디데이터도 한국의 신약개발이 주목을 받기 시작함에 따라 6월 중순 서울오피스를 개소했다. 다른 글로벌 제약사에서도 이같은 움직임이 있을 것으로 본다. 또 한국은 몇 년전부터 국제의약품규제조화위원회(ICH) 회원국으로 활동하고 있다. 신약개발에 대한 관심이 점점 높아지고 있는 것이다.


또 마켓 인텔리전스 보고서에 따르면 한국이 신약개발을 할 때 한국에서 지출하는 비용보다 해외에서 지출하는 비용이 더 많다고 한다. 즉, 한국 제약사들이 임상시험을 한국 뿐만 아니라 외국에서도 많이 한다는 것이다.
이 부분에 메디데이터의 플랫폼이 도움이 될 것 같다.

pompom@fnnews.com 정명진 의학전문기자

fnSurvey