IT 정보통신

오라클, MySQL 히트웨이브에 머신러닝 기능 추가

김만기 기자

파이낸셜뉴스

입력 2022.04.05 11:08

수정 2022.04.05 11:08

니푼 아가르왈 오라클 수석부사장 "아마존 레드시프트 머신러닝 대비 1% 비용으로 25배 빠른 성능 제공"
니푼 아가르왈 오라클 수석부사장
니푼 아가르왈 오라클 수석부사장


[파이낸셜뉴스] 오라클이 클라우드 인프라스트럭처(OCI) 상에서 MySQL 데이터베이스 서비스를 지원하는 인메모리 쿼리 가속기인 '오라클 MySQL 히트웨이브'의 데이터베이스 내에 머신러닝(ML) 기능을 추가했다.

니푼 아가르왈 오라클 수석부사장은 5일 온라인 간담회를 통해 "기존 트랜잭션 프로세싱과 분석에 이번 출시한 머신러닝 기능을 추가하며 MySQL 클라우드 데이터베이스 서비스 중 해당 기능을 제공하는 유일한 업체가 됐다"고 밝혔다.

MySQL 히트웨이브 머신러닝은 머신러닝의 수명 주기를 완전 자동화하고 학습된 모델 모두를 MySQL 내에 저장해, 외부의 머신러닝 도구나 서비스로 데이터와 모델을 이동하지 않아도 된다. 즉 '추출, 변환 및 적재(ETL)' 절차가 사라지며 애플리케이션 복잡성과 비용이 감소하고 머신러닝 모델과 데이터의 보안성이 개선됐다.

니푼 수석부사장은 데이터 세트를 비롯해 분류 및 회귀 분석 작업을 위해 일반에 공개된 다양한 머신러닝 데이터의 벤치마크를 공개했다. 그는 "가장 작은 클러스터로 구성된 머신러닝 모델의 경우 히트웨이브 ML은 아마존 레드시프트 ML 대비 평균 1%의 비용으로 25배 빠른 학습이 가능하다"고 말했다.
또한, 더 큰 규모의 히트웨이브 클러스터에서 학습할 경우, 레드시프트 ML 대비 성능 향상폭은 더욱 증가했다고 설명했다.

또한 니푼 수석부사장에 따르면, 히트웨이브 ML은 모델을 생성하는 모든 개별 단계가 완전히 자동화돼 개발자의 개입이 필요 없다. 이는 별도의 수작업 없이도 완료되는 훈련 프로세스와 더욱 정확한 결과를 얻을 수 있도록 잘 훈련된 모델로 이어진다. 아마존 레드시프트와 같은 여타 클라우드 데이터베이스 서비스의 경우 데이터베이스 서비스에 머신러닝 통합 기능이 포함되지 않으며 머신러닝 학습 과정에서 개발자의 광범위한 수작업이 필요하다고 설명했다.

이와함께 히트웨이브 ML은 모델과 함께 설명이 제공돼 개발자가 머신러닝 모델의 행동을 이해할 수 있도록 돕는다. 뿐만아니라 히트웨이브 ML은 초매개변수를 조정하기 위해 경사탐색 기반의 새로운 환산 알고리즘을 구현한다. 이는 모델의 정확도를 훼손하지 않으면서도 초매개변수의 병렬 탐색이 가능하다.

오라클은 머신러닝 기능 외에도 MySQL 히트웨이브 서비스를 위한 혁신 기능을 공개했다. 실시간 탄력성은 히트웨이브 고객이 노드 숫자에 상관없이 클러스터의 크기를 확대, 축소할 수 있도록 한다. 이 과정에서 시스템 운영이나 쓰기 작업이 중단되지 않으며 클러스터의 리밸런싱도 불필요하다.
또한 데이터 압축 기능은 고객의 노드당 데이터 처리량을 2배로 늘리고 비용은 50% 가까이 줄이면서도 가격 대비 성능을 동일하게 유지한다. 비용 절감을 위해 고객이 히트웨이브를 잠시 중지할 수 있는 일시 정지 및 재가동 기능도 새롭게 추가됐다.
재가동 시에는 MySQL 오토파일럿에 필요한 데이터와 통계가 히트웨이브에 자동으로 로드된다.

monarch@fnnews.com 김만기 기자

fnSurvey