엔비디아, 추론 전용 칩·새 CPU 공개… "내년까지 AI칩 매출 1조弗"
파이낸셜뉴스
2026.03.17 18:24
수정 : 2026.03.17 18:24기사원문
그록3 LPU, 베라 루빈에 통합
AI 에이전트 시대 본격 시동
엔비디아가 추론 전용 칩과 신규 중앙처리장치(CPU)를 공개하며 인공지능(AI) 에이전트 시대를 겨냥한 연산·지휘 인프라 구축에 본격 착수했다. 젠슨 황 엔비디아 최고경영자(CEO)는 "추론의 변곡점이 도래했다"며 AI 패러다임 전환을 선언했다.
황 CEO는 16일(현지시간) 미국 캘리포니아주 새너제이 SAP센터에서 열린 연례개발자회의 'GTC 2026' 기조연설에서 그록3 언어처리장치(LPU)를 차세대 AI 슈퍼컴퓨터 베라 루빈에 통합한다고 밝혔다.
이번 구조는 그래픽처리장치(GPU)와 LPU의 역할을 분리한 것이 핵심이다. 대규모 데이터 연산은 GPU가 담당하고, 초저지연 처리는 LPU가 맡아 AI 응답 속도를 극대화한다. 이를 통해 조 단위 매개변수를 갖는 초거대 AI 모델의 추론 처리량을 최대 35배까지 향상시킬 수 있다는 설명이다.
CPU 부문에서도 변화가 이어졌다. 엔비디아는 기존 x86 기반 CPU 대비 성능을 1.5배, 에너지 효율을 2배 개선한 신규 CPU 베라를 공개했다. 베라 CPU에는 자체 설계한 올림퍼스 코어가 적용돼 메모리 대역폭이 기존 대비 3배 수준으로 향상됐다.
이 같은 기술 전략은 AI 에이전트 시대를 준비한 것으로 해석된다. GPU는 데이터 처리, LPU는 추론 실행, CPU는 전체 시스템 조율 및 권한 관리 역할을 담당하는 구조다. 단순 챗봇을 넘어 복합 작업을 수행하는 AI 에이전트에는 속도뿐 아니라 통합적인 지휘 능력이 필수적이라는 판단이다.
황 CEO는 "AI 에이전트 등장 이후 추론량이 초기 챗GPT 대비 1만배 증가했고, 사용량까지 고려하면 연산 수요는 100만배 확대됐다"고 전했다. 그는 이를 '추론의 변곡점'으로 규정하며 "엔비디아 칩이 비용 대비 성능 측면에서 가장 효율적인 '토큰 왕'"이라고 강조했다.
차세대 제품 로드맵도 공개됐다. 베라 루빈의 후속 GPU 파인만은 신규 CPU 로자와 함께 작동하며 LP40 LPU를 탑재할 예정이다. 황 CEO는 "내년까지 AI 칩 시장 기회가 최소 1조달러(약 1493조원)에 달할 것"이라고 전망했다.
km@fnnews.com 김경민 기자
※ 저작권자 ⓒ 파이낸셜뉴스, 무단전재-재배포 금지