본문 바로가기
카테고리 없음

초저전력 AI 반도체로 온디바이스 AI

by 곰it수다 2024. 4. 14.
728x90

한국과학기술원(KAIST)의 연구팀이 세계 최초로 초저전력을 사용하는 뉴로모픽(neuromorphic) AI 반도체를 개발하였다. 이 반도체는 엔비디아의 A100 GPU와 비교할 때 전력 소모량이 1/625에 불과하며, 칩의 크기도 1/41로 대폭 줄였다.

neuromorphic AI chip이미지(DALLE 제공)
neuromorphic AI chip이미지(DALLE 제공)

전 세계적으로 AI 기술의 중요성이 커지고 있으며, 특히 모바일과 IoT 기기에서 AI 연산 수요가 급증하고 있다. 이에 따라, 기기 내에서 직접 데이터를 처리하고 AI 연산을 수행할 수 있는 온디바이스 AI(On-device AI)의 필요성이 대두되고 있다. 하지만 기존 AI 처리 방식은 높은 전력 소모와 큰 칩 크기로 인해 소형 기기에 적용하는 데 한계가 있었다. 이러한 문제를 해결하기 위해 KAIST 연구팀은 인간의 뇌 구조를 모방한 뉴로모픽 기술을 도입하여 기술의 단점을 극복하고자 하였다.

 

KAIST 연구팀이 개발한 AI 반도체는 인간의 뇌를 모방한 집적회로 기술을 바탕으로, 높은 에너지 효율과 작은 크기를 실현하였다. 전력소모를 최소화하면서도 초고속으로 대규모 언어 모델을 처리할 수 있는 인공지능 반도체 핵심 기술인 ‘상보형 트랜스포머(Complementary-Transformer)’를 세계 최초로 개발하였다.

 

트랜스포머(Transformer)는 문장 속 단어와 같은 데이터 내부의 관계를 추적해 맥락과 의미를 학습하는 신경망으로, 챗 GPT의 원천 기술이다. 초저전력과 초소형화를 가능하게 한 건 두 가지 인공지능 방식을 장착하고 각각의 장점을 취하도록 만든 덕분이다.

 

입력된 데이터가 큰 경우 연산 정확도가 높은 기존 AI 방식인 ‘심층 인공신경망’(DNN:Deep Neural Network, 시각적 데이터 처리에 사용되는 딥러닝 모델)이 활약하고 연산량이 적으면 전력 효율이 우수한 ‘스파이킹 뉴럴 네트워크’(SNN:Spiking Neural Networks, 뇌의 뉴런이 스파이크라는 시간에 따른 신호를 사용해 정보를 처리하는 방식)가 데이터를 처리해 두 기술이 상보적으로 작용하도록 하였다.

 

이 칩은 단 400 밀리와트의 초저전력으로 대규모 언어 모델인 GPT-2를 처리할 수 있으며, 이는 모바일 기기나 IoT 장비에서도 고성능 AI 연산을 가능하게 한다. 특히, 연구팀은 이 칩을 삼성전자의 최신 스마트폰 모델인 Galaxy S24에 장착하여 실시간 번역, 고도화된 카메라 기능 등을 구현하였다. 이는 외부 서버에 의존하지 않고 기기 내에서 모든 처리가 가능함을 의미한다.

 

온디바이스 AI는 데이터를 외부로 전송하지 않고 기기 내에서 처리함으로써, 데이터 보안과 프라이버시를 강화하는 중요한 기술이다. 또한, 인터넷 연결이 불안정하거나 없는 환경에서도 AI 기능을 유지할 수 있으며, 응답 속도를 향상시키는 장점이 있다. 이러한 특성으로 인해 스마트폰, 웨어러블 기기, 자동차, 스마트 홈 장비 등 다양한 분야에서 그 활용도가 확장될 것으로 보인다.

 

KAIST 연구팀의 이번 성과는 AI 기술이 점점 더 일상화되는 현 사회에서, 에너지 효율적이면서도 고성능인 AI 솔루션의 필요성을 충족시키는 중요한 진전이다. 향후 연구팀은 이 반도체 기술을 더욱 발전시켜, 다양한 산업 분야에 적용 가능한 AI 플랫폼을 개발하는 것을 목표로 하고 있다. 또한, 이 기술은 에너지 소비를 크게 줄이면서도 높은 연산 능력을 유지할 수 있어, 지속 가능한 기술 발전에 기여할 것으로 기대된다.

 

이처럼 KAIST의 연구 성과는 단순한 기술적 진보를 넘어, 사회적, 산업적 변화를 이끌 혁신적인 발전으로 평가받고 있으며, 앞으로의 연구가 더욱 주목받고 있다.

 

고이수(goesu4@daum.net)