IT 정보통신

엔비디아, 신형 AI 칩 공개.. "GB200, H100보다 추론 성능 30배"

구자윤 기자

파이낸셜뉴스

입력 2024.03.19 09:27

수정 2024.03.19 09:27

엔비디아 차세대 AI 칩 B200(왼쪽). 엔비디아 제공
엔비디아 차세대 AI 칩 B200(왼쪽). 엔비디아 제공

인공지능(AI) 반도체 선두 주자 미국 엔비디아가 18일(현지시간) 차세대 AI 칩과 가속기를 선보였다.

엔비디아는 이날 미국 캘리포니아주 새너제이 SAP 센터에서 개발자 콘퍼런스 'GTC(GPU Technology Conference) 2024'를 열고 차세대 AI 칩 블랙웰 'B200'와 AI 가속기 'GB200'을 공개했다.

블랙웰은 게임 이론과 통계학을 전공한 수학자이자 흑인으로는 최초로 미국국립과학원에 입회한 데이비드 헤롤드 블랙웰을 기리기 위해 붙여진 이름이다. 블랙웰 B200은 2080억개의 트랜지스터를 탑재했으며 5세대 NV링크는 GPU당 획기적인 초당 1.8테라바이트의 양방향 처리량을 제공한다.

젠슨 황 CEO는 "1.8조 파라미터 모델을 학습하려면 기존엔 8000개의 호퍼 GPU와 15메가와트가 필요했다면 이제는 2000개의 블랙웰 GPU가 4메가와트만 소비하면서 할 수 있다"고 말했다.

엔비디아 AI 가속기 GB200. 엔비디아 제공
엔비디아 AI 가속기 GB200. 엔비디아 제공

AI 가속기인 GB200은 'B200' 두 개와 하나의 그레이스 중앙처리장치(CPU)로 구성돼 있다.

GB200은 H100 대비 최대 30배의 거대언어모델(LLM) 추론 성능 향상을 제공하며 비용과 에너지 소비는 최대 25분의 1 수준이라고 엔비디아는 설명했다. 또한 GB200는 1750억개의 파라미터로 GPT-3 거대언어모델(LLM) 벤치마크(성능실험)를 한 결과 기존 H100보다 성능이 7배 이상이며 학습 속도도 4배 이상 빠르다고 전했다.


특히 엔비디아는 각 뉴런마다 8비트가 아닌 4비트를 사용해 컴퓨팅, 대역폭, 모델 크기를 2배로 늘렸다는 점을 강조했다.

solidkjy@fnnews.com 구자윤 기자

fnSurvey