
인텔은 IBM 클라우드가 클라우드 서비스 제공사로는 처음으로 인텔 가우디 3 인공지능(AI) 가속기 기반 상용서비스를 제공한다고 8일 밝혔다. 이로써 클라우드 서비스 고객들이 고성능 인공지능 역량을 보다 쉽게 활용할 수 있도록 지원하고 AI 특화 하드웨어의 높은 비용 장벽을 낮출 수 있을 전망이다.
이번 IBM 클라우드 상용화는 가우디3의 첫 대규모 상업 배포로, 인텔에는 시장에 AI 가속기의 새로운 선택지를 제공한다는 점에서 의미 있는 이정표다. 양사는 IBM 클라우드에서 인텔 가우디3을 활용해 고객이 합리적인 비용으로 생성형 AI를 테스트·혁신·배포하도록 돕는 것을 목표로 하고 있다.
많은 기업들이 생성형 AI와 같은 도구가 자동화·워크 플로우 개선·혁신 촉진 등에 분명한 이점이 있다는 것을 알고 있으나, AI 애플리케이션 구축에는 막대한 연산 능력이 필요하고 대개의 경우 고가의 특화된 프로세서를 요구하기 때문에 많은 기업들은 AI 혜택을 누리지 못하고 있다.
인텔 가우디 3 AI 가속기는 개방형 개발 프레임워크를 지원하면서 생성형 AI·대규모 모델 추론·파인튜닝 등에 대한 폭발적인 수요를 충족하도록 설계됐으며 멀티모달 대규모언어모델(LLM)과 검색 증강 생성(RAG) 워크로드에 최적화돼 있다.
인텔 사우라브 쿨카니(Saurabh Kulkarni) 데이터센터 AI 전략 담당은 “인텔 가우디 3 AI 가속기가 IBM 클라우드에 도입되며 기업 고객들에게 추론 및 파인 튜닝을 위해 최적화된 성능으로 생성형 AI 워크로드를 확장할 수 있도록 지원하게 됐다”며 “이번 협력은 전세계 기업이 AI를 더 쉽게, 비용효율적으로 구현할 수 있도록 지원하려는 양사의 공동 노력의 일환”이라고 말했다.
IBM 클라우드는 다양한 기업 고객, 특히 금융 서비스, 의료 및 생명 과학, 공공 부문 등 규제 산업에 종사하는 고객에게 서비스를 제공한다.
현재 가우디 3은 독일 프랑크푸르트, 미국 워싱턴 D.C., 택사스 댈러스의 IBM 클라우드 리전에 적용돼 사용할 수 있다.
가우디 3은 IBM의 광범위한 AI 인프라스트럭처 제품에도 통합되고 있다. 고객들은 현재 IBM 가상 프라이빗 클라우드(VPC)의 IBM 클라우드 가상 서버를 통해 가우디 3을 사용할 수 있으며, 2025년 하반기부터 다양한 아키텍처에 배포할 수 있다. 레드햇 오픈시프트와 IBM 왓슨엑스 AI 플랫폼에 대한 지원은 이번 분기 내 가능해질 예정이다.
사틴더 세티 IBM 클라우드 인프라스트럭처 서비스 총괄은 “더 많은 데이터 처리 능력과 더 높은 성능 구현은 전 세계 고객의 AI 도입을 촉진할 것”이라며 “인텔 가우디 3는 고객에게 AI의 하드웨어에 대한 더 많은 선택권과 더 많은 자유, 더 비용 효율적인 플랫폼을 제공해준다”고 말했다.
solidkjy@fnnews.com 구자윤 기자
※ 저작권자 ⓒ 파이낸셜뉴스, 무단전재-재배포 금지