HyperAI초신경

황교의 연설은 140분간 이어졌고, GTC의 3대 주요 발표는 업계에 충격을 안겼다.

5년 전
정보
Dao Wei
特色图像

GTC(GPU Technology Conference) China 2019가 12월 16일 수저우에서 개최되었습니다. 오늘 NVIDIA 창립자 겸 CEO인 젠슨 황은 2시간 이상 진행된 기조연설을 통해 여러 신제품 출시를 발표했으며, 연설 내용은 유용한 정보로 가득했습니다. GTC 2019의 흥분을 공유하기 위해 TensorRT 7, DRIVE, Isaac을 포함한 주요 릴리스를 편집했습니다.

NVIDIA GTC China 2019는 12월 16일부터 19일까지 수저우 진지호 국제컨벤션센터에서 개최되었습니다.

이 기술 컨퍼런스는 2009년 캘리포니아주 샌호세에서 시작되었습니다. 처음에는 컴퓨팅 과제를 해결하는 GPU의 잠재력에 초점을 맞췄습니다. 10년 후, 이 행사는 AI와 딥러닝 분야의 주요 행사로 자리 잡았으며, AI 관련 주제에 대한 강의가 100개에 가까워졌습니다.

2019년 미국 외에서 열린 유일한 GTC인 GTC China 2019에는 수천 명의 업계 관계자가 참석했습니다.

올해의 컨퍼런스 주제에는 AI 프레임워크, 개발 도구, 가속 데이터 과학, 클라우드 컴퓨팅, 실시간 렌더링, 레이 트레이싱, 5G 및 기타 측면이 수평적으로 다루어지고, 자율 주행, 스마트 머신, 의료 및 금융, 설계 및 엔지니어링 제조와 같은 가장 인기 있는 분야도 수직적으로 다루어집니다.

아침에는 NVIDIA 창립자 겸 CEO인 젠슨 황이 2시간 이상 기조연설을 했는데, TensorRT 7, DRIVE, Isaac 등 여러 가지 신제품 출시에 대해 다루었습니다. 

속보 1: TensorRT 7이 출시되었습니다.

NVIDIA는 다양한 유형의 RNN, Transformer, CNN을 지원하는 TensorRT 7(약칭 TRT 7)을 공식 출시했습니다.

TRT 7 정식 출시

TRT 7은 수평 및 수직 연산을 융합하고, 개발자가 설계한 다양한 RNN 구성에 대한 코드를 자동으로 생성하고, 여러 시간 단계에 걸쳐 LSTM 단위를 지점별로 융합하고, 가능한 경우 자동으로 저정밀도 추론을 수행합니다.

TRT 5가 30가지 변형만 지원하는 반면 TRT 7은 1000개 이상의 다양한 계산 변환 및 최적화. 황은 "TRT 7은 우리가 이룬 가장 큰 도약입니다."라고 말했습니다. 

TRT 7의 강력한 기능: 대화형 AI 지원 

대화형 AI는 TensorRT 7의 힘을 보여주는 대표적인 사례입니다. 음성 및 자연어 이해 분야의 AI 혁신으로 대화형 AI가 가능해졌지만, 대화는 상호작용적이고 반응성이 뛰어나며 낮은 지연 시간이 중요합니다. 엔드투엔드 프로세스는 CNN, RNN, 변환기, 자연 인코딩, MLP를 포함한 다양한 모델 구조를 사용하는 20~30개의 모델로 구성될 수 있습니다.

모델 프레임워크의 개략도

CPU 추론을 사용하면 이 프로세스의 지연은 3초입니다. 이제 TRT 7을 사용하면 모든 모델을 NVIDIA GPU에서 실행하도록 컴파일할 수 있으며 T4 GPU에서 대화형 AI 추론이 가능합니다.  단 0.3초만 걸립니다

빅뉴스 2: NVIDIA DRIVE 출시

DRIVE는엔드투엔드 플랫폼운송 회사가 자율주행 자동차를 생산할 수 있도록 지원합니다.

황 씨가 NVIDIA DRIVE를 소개합니다. 

첫째, AI와 AV의 개발 프로세스와 기본 프레임워크를 채택합니다. 둘째, 개방적이고 완전 자율 주행이 가능한 컴퓨터와 지능형 조종석이 탑재되어 있습니다. 또한 자동차 제조업체가 개선할 수 있는 사전 훈련된 고품질 AI 모델을 사용합니다.

DRIVE AV 플랫폼은 소프트웨어로 정의됩니다.고정 기능 칩이 아닌. 이를 통해 다수의 개발자가 지속적인 통합 및 지속적인 배포 개발 방식으로 협업할 수 있으며, R&D 투자는 여러 세대의 제품에 반영될 수 있습니다. 

NGC에서 사용 가능한 NVIDIA DRIVE 사전 학습 모델 

제대로 기능하는 안전한 자율주행 기술을 구축하려면 많은 AI 모델이 필요하며, 그 알고리즘은 다양하고 중복적입니다. NVIDIA는 감지, 분류, 추적 및 궤적 예측을 위한 최첨단 인식 모델을 개발했습니다. 하지만 인식, 현지화, 계획 및 지도 작성에도 사용됩니다. 사전 학습된 모델은 NGC에서 등록하고 다운로드할 수 있습니다. 

DRIVE 전이 학습 

NVIDIA는 TensorRT를 사용하여 재교육 및 재최적화할 수 있는 전이 학습 도구를 제공합니다. 여러 조직과 회사가 데이터를 이동하거나 공유하지 않고도 협업할 수 있는 연합 학습 시스템도 있습니다. NVIDIA는 사전 훈련된 모델을 다양한 파트너에게 배포합니다. 각 파트너는 자체 데이터로 모델을 훈련하고 일관된 표준에 따라 레이블을 지정합니다. 파트너는 새로운 모델을 만드는 데 사용된 패스만 공유하면 되며, 이 패스는 참여하는 모든 파트너와 공유됩니다.

 NVIDIA DRIVE AGX ORIN: 소프트웨어 정의 AV 플랫폼

NVIDIA DRIVE용L2에서 L5 레벨까지고성능이고 소프트웨어 정의형 아키텍처입니다.
황런쉰은 오린이 엔비디아의 차세대 로봇 프로세서 SOC이며 "엄청난 도약"이라고 말했습니다. 오린의 매개변수는 정말 뛰어납니다.

최대 170억 개의 트랜지스터, 8코어 64비트 CPU, 200 TOPS(초당 테라 연산)의 딥러닝 컴퓨팅 성능. 황샤오밍은 오린이 계획되어 있다고 밝혔습니다. 2022년 생산 시작 예정.

자율주행을 위한 차세대 프로세서, 오린

그는 또한 NVIDIA DRIVE가 글로벌 생태계를 구축하고 있다고 말했습니다. 

빅 뉴스 3: NVIDIA Isaac 출시

황 씨는 자율주행 버스 외에도 엔비디아가 차선이나 표지판 없이 구조화되지 않은 방식으로 이동할 수 있고 운영의 자유도가 더 높은 로봇을 개발하고 있다고 밝혔습니다.

실내 물류 참조 애플리케이션에 사용 가능

Isaac은 DRIVE와 마찬가지로 엔드투엔드 플랫폼입니다.이를 통해 전 세계 로봇 커뮤니티가 대규모로 운영 가능한 로봇을 만들 수 있게 되며, 여기에는 개발 인프라, 소프트웨어 스택을 갖춘 로봇 컴퓨팅 플랫폼, 완벽하게 작동하는 애플리케이션, NVIDIA 전이 학습 및 연합 학습 도구를 활용할 수 있는 사전 학습된 모델이 포함됩니다.

AV와 달리 로봇은 자유도가 더 높습니다. 수동으로 수집하고 레이블을 지정한 데이터는 지각 및 계획 유형 AI를 훈련하는 데 사용할 수 없습니다. "로봇이 무한한 수의 가능한 시나리오로부터 학습하는 데 있어서 시뮬레이션이 중요합니다."

아이작 SDK  객체 감지, 픽셀 분할, 2D 포즈, 3D 포즈를 훈련하기 위해 랜덤 머신 도메인을 사용하여 6D 포즈 이미지를 생성하는 Training-in-Sim 워크플로가 포함되어 있습니다.

연설이 끝날 무렵, Huang Renxun은 로봇 DEMO: LEONARDO도 시연했습니다. 로봇은 물체를 감지하고 조작하며, 물체를 배열하고 정리할 수 있어 청중으로부터 환호와 박수갈채를 받았습니다. 이러한 모든 기능은 NVIDIA가 출시한 Isaac 로봇 SDK를 통해 구현됩니다.

LEONARDO가 블록을 쌓는다

위에 나열된 내용은 GTC China 2019의 주요 릴리스 내용입니다. 천천히 살펴보시기 바랍니다. 차오 센징은 또한 여러분이 이 컨퍼런스에 계속 주의를 기울이고 가능한 한 빨리 가장 흥미로운 콘텐츠를 제공할 수 있도록 이끌 것입니다.

-- 위에--