図形認識システムの構築

久原 賢士


 コンピュータ技術の発達により、巷にはペットロボット等が商品として売り出 され、ほんの数十年前までは夢のような話であったことが現実味を帯びてきた。 ロボットをより人間に近づけるために、いくつかの技術的要素が考えられるがそ の一つに画像認識技術がある。そこで本研究では、画像認識の仕組みについて理 解し、実際に図形を認識するためのシステムの構築を試みた。
 コンピュータに人間の画像認識機能をエミュレートさせることが大変困難であ ることは昔から知られており、この分野では現在も多くの研究者の手によって研 究が続けられている。その上で研究成果の一部である画像処理・認識の各要素技 術のアルゴリズムの一部を実際に試作し、コンピュータ上での画像データの処理 過程やアルゴリズムの相違による認識率の違い等を議論した。
研究を進めるにあたって、画像認識の基礎的技術である2値画像認識についての 理解を深めることとし、本学卒業論文「図形認識の研究」を先行研究として参考 にした。またその中では用いられていない手法についても今回取り入れ、どの程 度認識率が改善されるかを比較検討した。
 また、図形認識システムを構築するにあたり、解析対象となる入力画像を2値 画像だけに制限せずに自然画像などのカラー画像、もしくは多階調画像への応用 も考え、本研究では解析対象をXPM画像とすることにした。前処理、特徴抽出の 段階で細線化とラプラシアンフィルタリングを行い、パターンマッチングの段階 では画像の逐次処理において現在よく使われるピラミッド探索法を用い、段階的 テンプレートマッチングにより解析を行った。また途中、階調値ごとに図形の切 り出しを行うことで画像の意味内容での分類に役立つのではないかと考えた。
 結果として、認識率の向上はそれほど顕著ではないことが分かった。認識課程 の前処理段階で、階調画像からラプラシアンフィルタを用いて図形のエッジ検出 を行った際に図形が寸断されてしまい、この画像をもとにピラミッド探索法の階 層構造を形成するため、途切れがより顕著になり本来の図形の形状特徴が失われ てしまうことが大きな原因と考えられる。また、テンプレートマッチングにおい て標準テンプレートに認識が依存してしまう問題点が出てきた。さらに、階調数 の指定やマッチングにおけるしきい値の設定、ピラミッド探索法の階層数の指定 等、使用する人間の判断によるところが大きく、考慮すべき課題も多いように思 われる。
 また、実用性の上から認識率を向上させるといった点に着目すると前処理、特 徴抽出、識別等の各段階において人工知能による学習・推論に基づいた判断が必 要になってくると思われる。