IT IT일반

'속도 2.5배↑ 비용 절반' 스퀴즈비츠, 생성형 AI API 서비스 '예터' 출시

구자윤 기자

파이낸셜뉴스

입력 2025.09.26 23:17

수정 2025.09.26 23:17

생성형 AI API 서비스 예터. 스퀴즈비츠 제공
생성형 AI API 서비스 예터. 스퀴즈비츠 제공

AI 최적화 전문 스타트업 스퀴즈비츠가 독자적인 추론 엔진 기술과 다양한 하드웨어 지원을 기반으로 한 생성형 인공지능(AI) API 서비스 ‘예터(Yetter)’를 출시했다고 26일 밝혔다.

예터는 생성형 AI를 경량화해 제공하는 API 서비스로, 빠르고 저렴한 장점을 갖고 있다는 게 회사 측 설명이다. 또한 별도의 인프라 구축 없이 API 형태로 제공돼 고객이 이미지, 영상 생성 등 AI 추론 기능을 손쉽게 서비스에 적용할 수 있다. 스퀴즈비츠에 따르면 예터는 기존 글로벌 경쟁사의 생성형 AI API 서비스 대비 평균 속도는 약 2.5배 빠르고 비용은 최대 절반 수준으로 절감된다. 또한 최적화 과정에서의 품질 저하가 없어 업계 최고 수준의 품질과 속도를 자랑한다.



유사한 글로벌 서비스 대비 가장 큰 차별점은 스퀴즈비츠가 그동안 축적해온 모델 최적화 기술과 하드웨어 가속 노하우를 결합해 최고의 효율을 구현한다는 점이다. 독자적으로 개발한 추론 엔진을 통해 모델 경량화와 성능 최적화를 동시에 달성해 기존 대비 한층 높은 성능과 비용 효율성을 제공한다. 또한 다양한 AI 반도체 환경을 폭넓게 지원한다는 점도 타사와 차별된다. GPU는 물론 최신 NPU에서도 동일한 API 환경을 제공해, 고객사가 특정 하드웨어에 얽매이지 않고 최적의 성능을 활용할 수 있도록 했다.

현재 예터에서는 텍스트 기반 이미지 생성(Text-to-Image) 모델을 시작으로 구글 나노 바나나와 같은 이미지 편집 모델 (image-to-image), 텍스트/이미지 기반 비디오 생성(Text/Image-to-Video)까지 가능하다. 추후 대형 언어 모델(LLM) 기반 텍스트 생성(Text-to-Text) 등 다양한 고도화된 생성형 AI 기능을 순차적으로 지원할 계획이다. 단일 API 호출만으로 모델 배포와 최적화 과정을 거치지 않고도 고품질 결과물을 얻을 수 있어 자체 인프라 구축없이도 AI 서비스를 만드는 기업 혹은 개인이 쉽게 사용할 수 있다. 궁극적으로 최적화 기술 기반과 다양한 하드웨어 공급망을 통해 서비스 안정성을 확보하고 특정 공급자에 대한 위험을 분산할 수 있다.

스퀴즈비츠는 지난 2022년 설립 이후 AI 모델 경량화 및 추론 최적화 기술을 중심으로 성장해 왔다. 글로벌 시장에서도 경쟁력있는 연구 역량과 인텔, 리벨리온 등 글로벌 하드웨어 기업들과의 협력을 통해 기술 경쟁력을 확보했으며, 현재는 더 많은 기업이 효율적으로 AI를 활용할 수 있도록 지원하는 것을 목표로 하고 있다.


스퀴즈비츠 김형준 대표는 "이번에 출시되는 예터는 그동안 우리가 쌓아온 AI 경량화 최적화 기술 뿐만 아니라 다양한 하드웨어에 대한 이해도를 담은 제품"이라며 "AI 기술이 가진 잠재력을 최대한 끌어내면서도 현실적인 비용 효율성을 확보할 수 있도록 돕는 것이 우리의 목표"라고 말했다.

solidkjy@fnnews.com 구자윤 기자