画像認識に使われる人工知能(AI)技術は人間の視覚と脳ニューロンを模倣した構造をしています。視覚及び脳ニューロン部分の計算と計算に使われるデータを削減する三つの手法の最適な適用割合を自動的に発見するアルゴリズムを開発しました。AIの消費電力削減や半導体の小型化につながります。
空港での入国審査における顔認証や自動運転における物体認識などでは、人間の視覚をモデルにした「畳み込みニューラルネットワーク」(CNN)と呼ばれる人工知能(AI)の計算手法が用いられています。CNNは畳み込み演算部分と全結合演算部分から構成され、前者が人間の視覚に、後者が視覚情報から画像の種類を推論する脳の働きに相当します。CNNについては、視覚の部分、脳ニューロンの部分の計算をバランス良く削減してより小さな構成とし、計算に使われるデータの精度(ビット数)も限界まで削減することで、元のCNNと同一の認識率を実現できることが知られています。これにより、計算量を減らし、それを実現するハードウェアをコンパクトにできます。
このような削減手法として、視覚部分を削減するNetwork Slimming(NS)、脳ニューロンの部分を削減するDeep Compression(DC)、ビット数を削減するInteger Quantization(IQ)の三つのが知られていますが、それらの手法の適用順序や適用の程度については明確な指標がありませんでした。
本研究では、これら三種類の手法を適用する最適な順序はIQ→NS→DCであることを解明し、各適用割合を自動的に決定できるアルゴリズムを開発しました。これまでは総当たりの試行錯誤で最適解を探していましたが、このアルゴリズムを使えば、CNNを28倍も小さく圧縮できる三つの手法の削減割合を、従来よりも76倍も速く発見することが可能です。
本研究成果は、広く普及していく画像認識のAI技術において、計算量を劇的に下げ、消費電力量の減少やAI向け半導体デバイスの小型化を実現する新技術となることが期待されます。
PDF資料
プレスリリース
研究代表者
筑波大学システム情報系
山際 伸一 准教授
掲載論文
【題名】 Heuristic Compression Method for CNN Model applying Quantization to a Combination of Structured and Unstructured Pruning Techniques
(構造化、および非構造化プルーニング手法の組合わせに量子化を適用した CNN モデルの発見的圧縮手法) 【掲載誌】 IEEE Access 【DOI】 10.1109/ACCESS.2024.3399541