音声認識による図形描画システム

小原 明子
   現在、一般家庭にもパソコンが広く普及し、パソコンを使って絵や図形を描く機会が 増えてきている。また、そのためのグラフィックスソフトが数多く存在している。グ ラフィックスソフトは2次元を扱う2D系と3次元を扱う3D系の2種類に分けられる。 2D系は更に、ペイント系、ドロー系の2種類に大別され、柔軟な操作でグラフィッ クスを作成することができる。また、3Dグラフィックスソフトは、モデリングの機 能やレンダリングの種類、アニメーション機能の充実度などにより、目的に応じて幅 広い選択ができる。これらの多くは、ペンではなく、マウスやキーボードを利用し、 パソコンのウィンドウ上に絵や図形を描くことができ、修正も容易に行えるのが特徴 である。
 しかしながら、これらのソフトを使って絵や図形を描画するには、図形作成のため の基本的な概念、ソフトの使用方法などが分からなければ、簡単な図形といえど、初 心者にとって使用するのは難しい。また、拡大、縮小、消去等の様々な機能が備わっ ているが、それぞれマウス、キーボードの操作方法が異なる。2Dグラフィックスソ フトでさえ、機能は多岐に渡っているが、3Dともなれば更に操作は複雑化する。こ ういったソフトに慣れていない者であれば、ウィンドウを前にして、描きたいものが 決まっていても、まずは図形描画のための使い方からマスターしなければならない し、マウスやキーボードを利用できない体の不自由な人にとっては図形を描画するこ とすら困難である。
 そこで本研究では、描画する図形を3次元に限定し、グラフィックスの標準的なラ イブラリであるOpenGLと音声認識エンジンを使用して音声認識による3次元図形描画 システムを作成した。誰でも容易に3次元図形を描画できるように、描きたい図形を 文章で表現しシステムがそれを理解し図形を描画するシステムを構築する。本システ ムでは、描画できる図形を4つ用意し、それぞれの図形に対してグループ化、移動、 消去、回転、拡大、保存の各機能を付け加えた。基本操作は、音声による文章入力と マウスによるボタンクリックで行われる。グラフィックスツールにおける入力操作に 音声入力を付け加えることによって操作性の簡単化を図った。
 しかし、本システムで用意している図形、機能だけでは、実際のグラフィックスソ フトの機能をカバーしきれないために、実用性に乏しい。ただし、描画可能な図形は 同様な方法で4つ以上用意することもできるので容易に拡張できる。そこで、ユーザ の望む任意の図形に対する処理ができ、更に多くの機能を追加すれば、ユーザにとっ て使いやすいシステムになると思われる。また、本システムは、完全に音声のみの命 令でシステムを操作することができないために、マウスを使った操作も必須となって いる。今後の発展としては、グラフィックソフトにおける操作を完全に音声認識化す ることができれば、からだの不自由な人にも容易に利用できるシステムになると考え られる。