2022년 10월 26일~27일 오후 2:00 - 5:00
온라인 세미나
AI 기술은 다양한 분야에서 성공적으로 진화하고 비즈니스 모델이 증가하고 있으며, 이러한 수요를 충족하고 더 쉽게 구현할 수 있도록 MLOps, 보안, Low code 등 다양한 솔루션들이 제공되고 있습니다. 인텔에서는 개발자들을 위해 다양한 하드웨어를 하나의 툴로 통합 지원하는 oneAPI가 있습니다.
xPU 아키텍처(CPU, GPU, FPGA 및 기타 가속기)에서 컴퓨팅 가속화를 위해 AI, oneAPI 및 SYCL에 초점을 맞춘 oneAPI 개발자 서밋을 개최합니다. 이번 온라인 세미나에서 혁신적인 크로스 플랫폼, 멀티벤더 아키텍처인 oneAPI에 대해 연구하고 있는 업계 및 학계 주요 전문가들로부터 배울 수 있습니다.
인텔은 소프트웨어를 최우선으로 생각하며 소프트웨어 개발자는 글로벌 소프트웨어 생태계 전반에 걸친 혁신의 핵심입니다. 고성능, 데이터 기반, 연결된 워크로드는 다양한 가속화 인프라를 주도해 왔으며 개발자와 사용자는 솔루션 배포의 용이성과 선택의 폭을 넓힐 것을 요구하고 있습니다. 이번 세션에서는 개방적이고 가속화된 컴퓨팅 에코시스템을 통해 사용자 요구를 충족시키기 위한 기회와 진전을 이야기 하겠습니다.
심층 신경망 DNN의 광범위한 채택은 종단 장치에서 클라우드 및 슈퍼컴퓨터에 이르는 시스템을 대상으로 강력하고 전문화된 하드웨어 기술을 설계하고 제조하는 동기로 작용했습니다.
소프트웨어 관점에서 볼 때 이러한 장치의 메탈 퍼포먼스에 근접한 성능을 효율적으로 일치시키기 위해 제공되는 여러 AI 프레임워크(TensorFlow, Pytorch, ONNXRuntime, MXNet 등)와 라이브러리가 있습니다. 개발자의 관점에서 볼 때, 개발 스택과 배포 하드웨어 간의 종속성이 증가함에 따라 이러한 거대한 다양성은 곧 부담이 됩니다. 이러한 종속성으로 인해 응용프로그램의 이동성이 차단되어 다른 함수 서명으로 동일한 작업을 여러 번 반복하게 됩니다.
또한 DNN 프레임워크에 대해 새로운 하드웨어를 타겟팅하려면 해당 하드웨어에 대한 각 운영자의 최적화된 버전을 (재)구현/통합하기 위한 상당한 노력이 필요합니다. 따라서 플랫폼 간 이동성은 여전히 어려운 과제입니다.
SYCL은 개방형 표준, C++ 기반 단일 소스 프로그래밍 패러다임입니다. SYCL 프로그래밍 모델을 사용하면 사용자가 완전히 표준 ISO C++를 사용하여 이기종 프로그램을 작성할 수 있으므로 개발자는 템플릿 메타프로그래밍, 람다 표현식 또는 보다 현대적인 기능과 같은 모든 네이티브 언어 기능을 활용할 수 있습니다. SYCL 메모리 모델을 사용하면 여러 하드웨어 플랫폼에서 광범위한 지원을 보장하는 여러 형태의 가속기와 데이터를 공유할 수 있습니다. SYCL은 AI와 HPC 커뮤니티에서 널리 지원되며, 최근에는 인텔의 커뮤니티에서 지원됩니다. 인텔, 엔비디아, AMD 및 RISC-V에서 SYCL을 지원하는 Codeplay Software의 Acoran 플랫폼과 R-CAR와 같은 다양한 DSP 공급업체를 포함하여 주요 HPC 및 AI 하드웨어 공급업체에서 SYCL을 지원할 수 있도록 지원하는 API 이니셔티브입니다. 이러한 지원을 통해 여러 공급업체에서 SYCL 애플리케이션의 이동성의 길을 닦습니다.
이번 세션에서는 SYCL-DNN, SYCL-BLAS 및 oneDNN과 같은 SYCL 에코 시스템의 방대한 오픈 소스 라이브러리를 사용하여 ONNX런타임의 SYCL 백엔드를 제안하고, oneAPI DPC++를 사용하여 백엔드의 성능 이동성을 여러 아키텍처에서 분석합니다.
다양한 이기종 컴퓨팅 플랫폼에서 실행할 수 있는 표준 및 통합 언어에 대한 필요성은 XPU 장치의 붐과 함께 증가하고 있습니다. 인텔 oneAPI 툴킷은 SYCL을 기반으로 한 공통 언어와 라이브러리 API 집합을 제공하여 다양한 XPU에서 같은 코드를 실행할 수 있도록 합니다. 파트너와 고객이 최신 인텔 하드웨어 플랫폼과 최첨단 개발 툴을 사용할 수 있도록, QCT oneAPI DevCloud는 사용자가 애플리케이션을 개발하고 코드를 oneAPI로 마이그레이션할 수 있도록 지원합니다.
oneAPI 베이스 및 HPC 툴킷으로 사용자는 XPU에서 최대의 잠재력을 발휘하여 코드를 프로파일링하고 최적화할 수 있습니다. 개발자는 oneAPI DevCloud를 통해 QCT와 함께 작업할 수 있습니다. 최신 컴퓨팅 플랫폼을 사기 전에 애플리케이션을 설계 및 평가하고 새로운 HPC의 전원을 켜기 전에 프로덕션 준비를 마칩니다. 아키텍처 간에 원활하게 실행할 수 있는 간소화된 표준 프로그래밍 모델은 개발자에게 코드 재사용을 통해 더 나은 성능, 생산성 향상 및 소유 비용 절감을 제공하고 재프로그래밍 시간을 단축합니다.
유전체학 분야에서는 전체 게놈 시퀀싱이 핵심이지만 계산을 수행하는 데 시간이 오래 걸리기 때문에 이를 가속하기 위해서는 CPU를 이용한 병렬화와 GPU를 이용한 오프로딩을 적용합니다.
가장 널리 사용되는 GATK(Genome Analysis Tool Kit)는 Java로 작성되어 있으므로 FPGA로 이식하기 위해 oneAPI를 직접 적용하는 것은 불가능하지만, 이전 단계인 정렬/대응은 SYCL을 사용하여 C/C++, BWA-MEM 및 드래그 맵으로 작성됩니다. 그러면 FPGA로 이식할 수 있습니다.
특히 GATK와 함께 사용해야 하고 CPU 작업도 필수적이기 때문에 FPGA를 단독으로 사용하기보다는 서버에 설치된 PAC(Programmable Acceleration Card) 형태로 사용하는 것이 경제적이고 편리합니다.
SYCL은 PAC에서 사용하기 위해 가속화 스택을 사용하여 편리하게 이식되었으며 병렬화 및 파이프라이닝을 적용하여 실행 속도가 향상되었습니다.
삼성 헬스케어와 인텔의 프로젝트에서의 협력
- SWBF : 아키텍처를 선택하고 하드웨어 비용을 절감할 수 있도록 DPC++ 호환성 툴을 사용하여 기존 CUDA를 SYCL로 마이그레이션했습니다. 인텔 GPU와 CPU를 모두 활용하였습니다.
- Shearwave : Shearwave 기능을 최적화하기 위해 인텔 VTune 프로파일러를 사용했습니다. 핫 스팟과 병목 현상을 분석하고 최적화하는 데 도움이 되었습니다.
OX, 객관식 등 쉽게 참여할 수 있는 퀴즈를 통해 oneAPI와 세션 내용을 알아보는 시간입니다. 즐겁게 참여하고, 푸짐한 경품의 주인공이 되어보세요!
인텔은 혁신이 개방형 생태계에서 번성하고, 선택을 가능하게 하며, 모든 사람이 동등하게 접근할 수 있다고 믿습니다. oneAPI 프로젝트와 그 구성 요소는 개방형 사양을 특징으로 하는 활성 생태계에 대한 이러한 헌신을 반영합니다. 이러한 믿음으로, 수많은 다양한 컴퓨팅 아키텍처에 대한 지원을 발전시킵니다. 이 대규모 생태계를 지원하기 위해 인텔은 SYCLomatic 및 SYCL을 도입합니다.
SYCLomatic은 개발자가 다른 프로그래밍 언어로 작성된 기존 코드를 SYCL 이기종 프로그래밍 모델로 마이그레이션할 수 있도록 지원합니다. SYCL은 인텔 및 엔비디아 하드웨어에서 각각 컴파일하여 실행할 수 있도록 합니다. CUDA를 SYCL로 마이그레이션 및 컴파일하고 엔비디아 GPU에서 실행하는 방법에 대한 데모를 보여드립니다.
AI 기술은 다양한 분야에서 성공적으로 진화하고 비즈니스 모델도 구축되고 있습니다. 인텔에서는 인공지능 추론을 위해 최적화된 OpenVINO 툴킷과 더불어 학습에서도 보안을 강화하기 위한 Federated Learning 및 SGX 솔루션을 제공하고 있으며, Genome 분석을 위한 AlphaFold 2 솔루션도 제공하고 있습니다.
인공지능 딥러닝은 데이터 센터와 엣지에서 다양하게 이루어지기 때문에 다양한 제품 포트폴리오가 필요하며 인텔에서는 저전력 VPU에서 부터, CPU, GPU 그리고 전용 가속기인 Habana를 제공하고 있습니다.
oneAPI AI Analytics Toolkit 핸즈-온 데모를 통해 AI 학습 및 추론 과정을 쉽게 하는 방법을 자세히 알 수 있는 기회를 제공합니다.
Monica Livingston은 Intel Corporation에서 AI 및 그래픽 기술 지원을 이끌고 있으며, AI 솔루션 실행 및 배포, 데이터센터 그래픽을 위한 워크로드를 지원하고 있습니다. 이전에 Tier 1 고객 지원, 현장 애플리케이션 엔지니어링 및 하드웨어 설계를 담당했습니다. 또한 기술, STEM 교육 및 경력 개발에 열정적입니다. Monica는 Florida 대학에서 전기 공학 석사 학위를, 채플 힐에 있는 North Carolina 대학에서 MBA를 취득했습니다.
세계적인 유행병으로 인해 다양한 의료 분야에서 의료 인공 지능의 필요성이 증가하고 있습니다. 특히 의료 여건이 열악한 국가의 경우 의료 인력이 부족해 의료 인공 지능의 도움이 절실합니다. 하지만 이들 국가는 인터넷과 클라우드 서비스 환경 등 기반 시설이 제대로 갖춰지지 않아 활용에 어려움을 겪고 있습니다. 이 문제를 해결하기 위해 OpenVINO를 활용하여 의료 AI 알고리즘을 노트북이나 미니 PC에 통합하여 IT 기반 시설이 부족한 국가에서 편리하게 사용할 수 있습니다. 본 발표에서는 허혈성 뇌졸중, 출혈성 뇌졸중, 치매, 결핵, 폐렴 등 뇌와 폐의 여러 질환을 분석하기 위해 CT, MRI, X-Ray 등 다양한 의료 영상에 적용한 당사의 인공 지능 분석 기술에 관해 설명합니다.
Deeping Source는 중소기업에 적합한 4채널 실시간 비전 분석이 가능한 AI 플랫폼을 찾고자 했습니다. dGPU 서버가 첫 번째 검토 대상이었지만 반도체 공급 부족, 대형 폼 팩터, 가격 상승 등의 이유로 적용할 수 없었습니다.
한편, 인텔 NUC는 소형 폼 팩터 내에 강력한 프로세서를 탑재한 적합한 장치였습니다.
첫 번째 비전 모델은 i5 NUC에서 프레임당 21ms가 걸렸습니다. 2차 비전 모델로는 4채널 입력을 지원하기에 충분하지 않았습니다. 다행히 OpenVINO는 사전 교육을 받은 모델을 위한 모델 옵티마이저를 제공했습니다. Deeping Source는 16비트의 정밀도와 추가 최적화 기술을 사용하여 모델을 최적화했습니다. 이를 통해 8ms의 인퍼런스 시간을 달성했고, 4채널 실시간 비전 분석을 성공적으로 지원했습니다.
한국형 인공지능 개방형 데이터셋인 해상 객체를 인텔 Habana Gaudi AI 칩 기반 서버로 학습하고, 학습될 모델을 OpenVINO로 추론하여 인식되는 결과를 선박 자율운항에 활용하는 연구에 대한 경험과 노하우를 소개합니다. (시스템 구성, 모델학습, 효율성)
DEEP:PHI는 “No Coding/Low Coding AI” 연구개발 플랫폼으로 다양한 종류의 연구개발을 수행하고 학습한 모델에 대한 인퍼런스 어플리케이션을 다운받는 것이 가능합니다. 인퍼런스 어플리케이션의 경우 일반 사용자들의 개인환경에서 실행이 가능하도록 “호환성”과 “경량화”가 요구되는데, 일반적인 모델에 대해서 크로스-아키텍처를 고려한 빌드과정은 쉽지 않습니다. 이번 발표에서는 OneAPI 및 OpenVINO적용을 통해 인퍼런스 성능 향상과 동시에 호환성 및 경량화 문제를 해결한 과정을 소개하고, DEEP:PHI를 사용해 연구개발한 다양한 프로젝트들에 대해서 TensorFlow와 OpenVINO를 비교한 결과를 공유합니다.
객체 감지, 시멘틱 세그멘테이션(semantic segmentation), 이미지 분류 및 자연어 처리를 포함한 워크로드에 사용되는 AI와 특히 딥 러닝(DL)은 기업 내의 애플리케이션에서 점점 더 중요해지고 있습니다. 제조업에서부터 의료, 자동차, 전자 상거래에 이르기까지 거의 모든 산업 부문에 걸쳐 사용되고 있습니다.
AI 중심 데이터 처리의 급증으로 DL용 가속기가 개발되었습니다.
인텔 자회사인 Habana Labs는 DL 트레이닝 및 인퍼런스 효율성을 높이기 위해 특별히 설계된 솔루션을 개발했습니다.
이 프레젠테이션에서는 다음의 2세대 DL 프로세서인 DL 가속을 한 단계 높이는 Habana®Gaudi®2 트레이닝 및 Habana® Greco™ 인퍼런스 프로세서에 초점을 맞출 것입니다.
이 세션에서는 AI 업계에서 가장 관심 받는 주제 중 하나인 연합 학습에 대해 배우게 될 것입니다. 연합 학습 기술은 여러 회사와 조직이 AI 트레이닝에 대해 협업할 수 있도록 하며, 이럴 때 항상 우려되는 사항인 데이터 개인 정보 보호 문제를 해결합니다. 또한 연합 학습 분야에서 인텔의 역량이 소개됩니다.
인텔 알파폴드2는 구글의 알파폴드2를 복제하여 인텔 Xeon 서버 플랫폼에서 우수한 성능을 제공합니다. 강의에서는 인텔 플랫폼 기술과 oneAPI 툴을 사용하여 인텔 알파폴드2의 최적화 과정에서 채택된 Best-Know-Methods에 대해 공유합니다.
인텔 최적화된 TensorFlow로 딥 러닝을 가속화하고 차세대 CPU를 소개합니다.
주요 내용:
영업 및 마케팅 그룹 부사장 겸 한국 지사장
인텔코리아
수석 부사장 겸 인텔 최고 기술 책임자(CTO) 및 소프트웨어 및 고급 기술 그룹 총괄
Intel
R&D 부분 부사장
Codeplay Software Ltd.
HPC/AI 솔루션 설계자
QCT
oneAPI 인증 강사
Moasys
수석 엔지니어
삼성 헬스케어
기술지원 스페셜리스트
인텔코리아
기술 컨설팅 엔지니어
인텔코리아
소프트웨어 기술 컨설팅 엔지니어
인텔코리아
Channel Scale & partner
인텔코리아
DCAI Sales Dir. AI 및 GPU 기술지원 담당
Intel SMG
CEO
㈜제이엘케이
CEO 및 공동 창업자
(주)딥핑소스
R&D 소장
KMCP
R&D 팀
딥노이드
인공 지능 담당 이사
Intel GTM
AI+ 비주얼 컴퓨팅 기술 솔루션 스페셜리스트
Intel
AI+ 비주얼 컴퓨팅 기술 솔루션 스페셜리스트
Intel
기술 자문 엔지니어
Intel
10월 26일, 1일차 세션에서는 이기종 프로그래밍을 위한 SYCL 및 oneAPI를 소개합니다. C++ 또는 GPU 프로그래머라면 꼭 참여하세요!
10월 27일, 2일차 세션에서는 인텔의 AI 워크로드 및 AI 솔루션에 대해 소개합니다. AI 개발자, AI 에반젤리스트, Python 프로그래머 또는 데이터 과학자라면 이번 세션을 놓치지 마세요!