본문 바로가기

과학 칼럼/과학 뉴스레터

반도체의 미래 (3) AI 반도체

300x250

사이언스 리포트 (표지)

 

전 포스팅에서는 반도체의 직접도를 높여 연산과 저장 기능을 향상시키는 여러가지 방법에 대해서 알아보았다. 최근에는 AI 반도체가 아주 화제가 되고 있다. 이번 포스팅에서는 AI 반도체가 무엇인지, 종류는 무엇이 있고, 반도체의 전망 등을 조사한 내용을 적어보려고 한다.

 

현재 AI 기술의 수준을 결정짓는 것은 얼마나 많은 데이터를 얼마나 빠르게 학습시킬 수 있느냐다. AI 모델의 발전 못지않게 이를 구동할 하드웨어, 그중에서도 중앙처리장치(CPU)그래픽처리장치(GPU) 등 시스템반도체의 성능이 중요해지고 있다.

 

현재 대부분의 AI 모델에서는 병렬연산에 효율적인 GPU가 사용된다. 그러나 AI에 사용되는 GPU는 1개의 가격이 최대 수천만원에 이르고, 연산 효율도 나날이 높아져가는 AI 모델을 충분히 구현하기에는 아직 부족하다. 따라서 AI 알고리즘을 가속할 수 있는 전용 반도체가 필요하다.

 

신경망처리장치 (Neural Processing Unit, NPU)

단순히 생산 공정에서 집적도를 높이는 방법으로는 AI에 필요한 수준의 전력 효율을 달성하는 데 한계가 있다. 현재 가장 널리 사용되는 방법은 AI 알고리즘의 핵심 연산을 하드웨어적으로 구현하는 것이다. 예를 들어 심층신경망(DNN), 합성곱신경망(CNN) 같은 알고리즘 연산에 적합한 형태로 반도체를 설계하는 것이다. NPU는 기존 CPU와 GPU에 비해서 에너지를 효율적으로 쓸 수있고, 빠른 속도로 행렬 곱셉 연산이 가능하다.

 

*참고* CPU는 복잡한 연산을 처리할 수 있지만, 직렬 연산으로 정보를 처리한다. GPU는 CPU보다 상대적으로 간단한 연산을 병렬로 처리한다. 그래서 수백만 개 가량의 픽셀(pixcel)로 이루어진 컴퓨터 이미지를 GPU가 더 효율적이고 빠르게 처리할 수 있는 것이다.

 

예를 들어 대규모 DNN의 경우, 가중치(Weight)의 수가 매우 많아 외부의 대용량 DRAM에 저장된 가중치를 필요할 때마다 읽어와 프로세서로 가져와야 한다. 다시말해 엄청나게 많은 가중치 데이터를 필요할 때마다 불러오느라 에너지와 시간이 낭비된다는 뜻이다.

 

그래서 한번에 같은 가중치를 여러번 사용할 수 있도록 DRAM이 장착된 프로세서를 병렬로 구성하고 이를 서로 연결해서 데이터를 분산 저장하고 재사용하는 방식을 고안한 것이 AI 반도체이다.

 

이를 구현하는 대표적인 기술로 필드프로그래머블게이트어레이(FPGA)주문형반도체(ASIC, 에이식) 등이 있다.

 

FPGA

사용자가 자체적으로 프로그래밍을 할 수 있는 소자. 내부 회로의 변경이 어려운 일반 반도체와 달리 각각의 모델에 적합한 형태로 변경할 수 있는 게 특징이다.

GPU의 경우에는 동일한 제품을 사용하더라도 적용되는 알고리즘의 종류와 방식에 따라 나타낼 수 있는 성능의 편차가 크다. 기존 시스템반도체 시장을 선도하고 있는 인텔ARM이 이 방식을 사용하고 있다.

 

ASIC

특정 용도에 맞춰 제작된다. FPGA와 달리 설계 단계에서부터 용도가 정해지는 만큼 범용성은 상대적으로 낮지만, 전력 효율이 높고 면적을 적게 차지한다는 점이 장점이다. 구글이나 페이스북, 아마존 등이 이 기술에 적합한 반도체를 내놓고 있다.

이 가운데 구글의 ASIC 방식 AI 반도체인 TPU(Tensor Processing Unit)는 2016년 이세돌과의 대국에서 승리한 알파고에 최초로 사용되었다. 초기 버전의 알파고에는 1000여 개의 CPU와 100여개의 GPU가 사용됐는데, 이세돌 9단과의 대국에서는 48개의 TPU가 이를 대체했다.

 

PIM

최근 가장 큰 주목을 받는 AI 반도체는 지능형메모리 반도체(PIM, Processing In Memory)이다. 메모리반도체와 시스템반도체를 하나의 칩 안에 구현한다는 발상이다. PIM이 차세대 AI반도체로 주목받는 이유는 시스템반도체와 메모리반도체가 물리적으로 구분되는 구조인 폰 노이만 구조’의 한계를 극복할 수 있는 방식이기 때문이다.

 

PIM은 하나의 칩 안에 데이터를 저장하는 회로와 연산하는 회로를 모두 설계해서 연산 효율을 높이고 데이터 전송에 필요한 전력도 크게 아낄 수 있다. 다만 아직 PIM을 제대로 구현하는 경우는 많지 않다. 왜냐하면 시스템반도체와 메모리 반도체의 설계 방법과 공정이 너무 달라 기술적으로 하나의 칩 안에 두 반도체를 넣는 것이 쉽지 않기 때문이다. 그래서 최근에는 메모리반도체와 시스템반도체를 최대한 가까이 배치하고, 둘 사이에 연결점을 늘려 데이터 전송 속도를 높이는 방식의 PIM이 개발되고 있다.


사설

 

이러한 반도체는 앞으로 다가올 ‘엣지 컴퓨팅 시대에 매우 핵심적인 역할을 할 것으로 보인다. 엣지 컴퓨팅이란 중앙 서버에서 모든 데이터를 수집하고 분석하는 클라우드 환경과 달리 각각의 개별 장치에서 데이터를 처리하는 방식을 말한다. 예를 들어 자율주행차 같은 경우 자율주행에 필요한 도로상황, 차선의 위치, 신호등의 색 같은 이미지 데이터를 중앙 서버로 보내 연산하지 않고 중간단계에 있는 엣지 클라우드에 보내 연산하게 하는 것이다. 이렇게 되면 데이터를 자체적으로 처리하여 데이터 양을 줄여 처리 속도와 전력을 효율적으로 사용할 수 있다. 자율주행차 뿐이겠는가, 미레에 우리 일상에 놓여질 수많은 가전제품들을 비롯한 첨단 기기들은 기본적으로 AI가 탑재될 가능성이 많다.

 

AI 반도체는 사실상 직접도에 있어서는 더이상의 발전이 불필요해 보인다. 이미 3nm, 5nm 반도체가 생산되고 있는 상황이니 말이다. 다행히 메모리에만 집중하고 있던 삼성전자나 SK하이닉스도 이러한 트렌드를 인식하고 시스템반도체에도 많은 투자와 연구를 하고 있다는 소식을 들으니 마음이 놓인다.

 

출처:

(1) 네이버 지식백과, 용어로 보는 IT, <인공지능반도체>, 김영우, 2011

(2) SK 하이닉스 뉴스룸, AI 기술의 다양한 응용 분야_AI 반도체의 현황과 미래전망, 정덕균 교수, 2022

(3) 동아사이언스, <반도체 세대교체> 기사

 

 

반도체의 미래 (1) 메모리 반도체와 시스템 반도체

🛠️ 반도체는 지금 레드오션이다. 50년 전 무어가 예측한 반도체의 직접도가 2년마다 2배로 증가한다는 '무어의 법칙'이 지금까지 유지되고 있다. 2010년 삼성전자가 20nm급 반도체를 생산했고,

thelandofthe.tistory.com

 

 

반도체의 미래 (2) 초고직접 반도체

반도체의 집적도는 기업의 생산성과 직결되는 중요한 문제이다. 전 세계 반도체 파운드리 기업들은 앞다투어 반도체의 직접도를 올리려고 새로운 기술을 개발한다. 2021년 대만의 TSMC가 1nm급 미

thelandofthe.tistory.com

 

300x250