Efficient SIMD Implementation of Binarized Convolutional Neural Network
Journal of the Institute of Electronics and Information Engineers2018Vol. 55(1), pp. 49–56
Abstract
본 논문에서는 이진화된 컨벌루션 신경망 (Convolutional Neural Network; CNN)의 효율적인 구현을 제시한다. 이진화된 CNN은 기존 CNN에 이진화 과정을 추가하여 각각의 파라미터와 컨벌루션의 입력이 단일 비트로 표현될 수 있도록 변형한 것이다. 제안하는 구현에서는, 다수의 이진화된 파라미터들과 컨벌루션의 입력들을 하나의 워드로 묶어서 저장하고, CNN에서 연산 량 대부분을 차지하는 기존 컨벌루션을 이진화된 컨벌루션으로 대체하여, Bitwise XNOR-Bitcount으로 구현하였다. 이러한 SIMD 처리 방식의 구현은 CNN의 전체적인 메모리 요구량과 연산 량을 크게 감소시킬 수 있다. 실제로 LeNet-5와 ResNet-18을 대상으로 제안하는 구현은 분석 성능에서 기존의 결과와 비교하여 대등한 수준을 유지하면서도, 수행 시간을 기존 구현의 결과 대비 최대 89% 단축하고, 메모리 요구량은 기존 구현의 결과 대비 최대 95% 축소한다.
Related Papers
- → New 4-transistor XOR and XNOR designs(2002)63 cited
- → A novel proposal for all-optical compact and fast XOR/XNOR gate based on photonic crystal(2019)16 cited
- → Design of low power high speed full adder cell with XOR/XNOR logic gates(2016)8 cited
- → New energy recovery CMOS XNOR/XOR gates(2007)5 cited
- → Multi-input volistor logic XNOR gates(2019)