科研費成果報告用ページ(2007年度版)


平成19年度状況
種別 テーマ名 補助金額
基盤研究C 情景中に存在する文字情報の電子化支援システムの開発 1,430,000

助成による研究成果一覧
口頭発表【7件】
森家康文,松尾賢一:“情景画像中の看板存在確認”,電子情報通信学会2008年総合大会講演論文集,D-12-108,(2008/3/18)
中久保佳幸,松尾賢一:“形状特徴を用いた非文字除去処理による文字列領域抽出の高精度化 II”,電子情報通信学会2007年総合大会講演論文集,D-12-69,(2008/3/21)
Damdinsuren Chuluunsuren,松尾賢一:“重ね書き採点記号の分離抽出処理の改善”,電子情報通信学会関西支部学生会 第13回学生会研究発表講演会 講演論文集,D4-8,(2008/3/8)
原田光,松尾賢一:“採点記号に対する認識処理の高精度化”,電子情報通信学会関西支部学生会 第13回学生会研究発表講演会 講演論文集,D4-7,(2008/3/8)
中久保佳幸,松尾賢一:“非文字領域除去処理による文字列領域候補抽出処理の改良”,電子情報通信学会関西支部学生会 第13回学生会研究発表講演会 講演論文集,D4-6,(2008/3/8)
寺脇温晃,松尾賢一:“情景画像中の単純背景と文字配置に着目した文字列存在領域候補の特定”,電子情報通信学会関西支部学生会 第13回学生会研究発表講演会 講演論文集,D4-4,(2008/3/8)
森家康文,松尾賢一:“情景画像中に存在する看板領域検出の一考察”,電子情報通信学会関西支部学生会 第13回学生会研究発表講演会 講演論文集,D3-2,(2008/3/8)

実績報告
本研究では,情景に存在する様々な文字情報に対して,OCR【光学式文字読み取り装置】の適用を可能とする手法の提案と,OCRと人間が対話形式で協調しあうことで,OCRの認識結果を参照した文字情報の誤り箇所発見や,認識結果に対して人間が容易に認識結果を修正できる,情景に存在する文字情報の電子化支援システムの開発を目的としている.平成19年度では,文書レベルにおける文字情報の電子化を支援する手法の提案と有効性の検証として,答案採点作業の負荷に伴う教官の未採点や採点誤りを自動的にチェックし,人間に採点結果の再確認を促す『答案採点支援システム』の実現するために必要な要素技術の研究を実施した.
ここで,得られた研究実績として,「文書レベルにおけるOCRの適用が困難な文書データの一つである答案用紙に対して,イメージスキャナを用いて実験用の重ね書き文書画像データベースを作成」,「既に開発済みの重ね書き文字の分離抽出手法,実際の文書データに対して適用し,正確に重ね書き文字の分離抽出精度を向上させる改善方法の提案」,「分離抽出された文字候補に対する既存の活字専用OCRおよび独自の認識処理による精度調査の実施」,「情景中の文字情報が存在する位置特定に関する手法の提案と提案手法の有効性に対する調査」,があげられる. 上記の成果の一部分については,7件の学会発表を実施した.また,これらの成果によって,情景に存在する様々な文字情報に対して,OCRの適用を可能とする文字情報の電子化支援システムの実現への可能性を高めたといえる.

研究目的
 オフライン文字認識の基本技術は,パターン理解・認識・文書画像処理の分野に属し,様々な研究結果が国内外で報告されている.実際に,FA(Factory Automation )やOCRが実用レベルに達している状況から見ても,オンライン文字認識同様に文字認識の基本技術を応用された汎用製品例は数多い.しかしながら,それらの汎用製品例では,文字認識技術が対象としている文字パターンは,文書や電子基盤上の活字文字や制約手書き文字のレベルに限定されていることが多い.
 この制約を緩和するために,対象とする文字パターンを自由手書き文字や情景中の文字や文字列に拡張した文字認識の研究が行われている【文献1,2】.特に,自由手書き文字認識についても,高い認識率が得られるようになったが,これはあくまで学習パターンに対してであり,未知パターンに対しては,大幅に認識率が低下する.また,辞書パターン以外の文字が入力パターンであっても,それを棄却する方法についても未解決であるため,辞書パターンから何らかの認識パターンを出力してしまう問題が残る【文献3】.
 また,情景画像中の文字を対象とした文字認識技術の適用に関する研究については,車両のナンバープレート番号,道路標識の制限速度等の定型で,かつ,書式の定まっている文字以外に殆ど見られない.つまり,情景では,文字が取り巻く周りの環境の影響を多分受けることや,情景中のどこに文字が存在するかの事前知識がないため,そもそも文字が存在する場所の特定自体が困難である.この文字が存在する場所を,従来の文字認識技術を用いた検出手法を導入するにしても,未知パターンに対しても高い認識精度が得られる認識器を用意しなければ,正確な位置検出や文字候補領域を見つけ出すのは困難といえる.さらに,認識を前提にすると,情景そのものを高解像度でディジタル化しなければ,情景で見掛け上遠方にある文字パターンを高精度に認識するだけの解像度がディジタル画像から得られない【文献4】.

 以上のことから,情景中の文字が存在する場所の特定するために,文字認識技術をベースとするならば,文字パターンの解像度に左右されず,あらやる文字に対して高い認識精度が得られる文字認識技術の開発が不可欠となる.しかしながら,現状の文字認識技術の動向を見る限り,早々に解決される課題ではないことは明らかである.そこで,現状の文字認識技術を,情景中の文字に適用を可能とする手法の提案が必要【文献5,6】との着想に至った.この着想を具現化するには,文字認識処理以前の前処理部となる,情景中の文字の存在位置の検出(文字スポッティング),文字情報の抽出おしくは分離抽出【文献7,8】,文字切り出しという3つの技術の開発が必要となる.
 
本研究は,上記の前処理部を実現するために重点的に研究するものである.つまり,OCR(既存の文字認識技術)の適用範囲を拡張する上で必要な知見を提供するものであり,学術的にみても推進すべき重要な研究課題といえる.

 本研究では,情景に存在する様々な文字情報に対して,OCR【Optical Character Reader:光学式文字読み取り】の適用を可能とする手法の提案と,OCRと人間が対話形式で協調しあうことで,OCRの認識結果を参照した文字情報の誤り箇所発見や,認識結果に対して人間が容易に認識結果を修正できる,情景に存在する文字情報の電子化支援システムの開発を目的とする.この目的に対して,2年の研究期間において,以下の5つの内容について研究を推進する.
  1. 情景に存在する文字情報の電子化支援システムを完成する.
  2. 情景から文字情報を検出(文字スポッティング)し,背景部から文字パターンを高精度に,分離,切り出し,抽出させる方式を開発する.
  3. OCRを用いて得られた認識結果から最適な認識結果を選択する方法を開発する.
  4. 1.分離,切り出し,抽出処理過程に対して,Aの認識結果を利用したフィードバック処理を導入することによって,@の処理の高精度化を図る.
  5. 2.3.の処理が困難である文字情報に対して,コンピュータとの対話形式で協調しながら文字情報の電子化を支援する方式の開発とその有効性を明らかにする.
 本研究の特色,独創的な点及び予想される結果と意義については,OCRの認識率の向上,あるいは,文字認識に関する技術に関する方式については取り扱わず,現状のOCRと文字認識技術を用いて,人間との対話形式で協調し合いながら認識処理と修正作業を行うことで,現状の文書レベルでのOCRの適用範囲を,情景レベルの様々な画像中の文字情報にまで拡張させることにある.
 これによって,キーボード入力に頼っていた情景中の様々な文字情報の電子化への支援,文字情報の電子化作業における労力の低減が図れる.これ以外に,手書き入力で見られた決められた書式内に記入しなければならないという制限を緩和できる可能性も示すことができる.また,情景の文字を認識できれば,ロボット制御等において,形状情報だけでは取得できない対象物の意味情報を取得することが可能となるため,文字情報駆動型ロボットの開発へと研究対象を拡張することも可能である.
 このように,本研究で得られる成果の波及効果は広く,テキストデータにしてもまだディジタル化されていない文字情報が数多く存在するため,文字情報のディジタル化という側面から見ても,我々社会生活に非常に貢献するものである.さらに,我々が情報を得るために,あらゆるシーンから文字情報を探し出して,次の行動への足がかりにするプロセスの実現も達成することができる.

参考文献 
  1. 美濃:“文書画像処理の現状と動向”,信学誌,Vol.76,No.5,pp.502-509 (1993)
  2. 中野康明:“文字認識・文書理解の最新動向[T]〜[Y]”,電子情報通信学会誌,Vol.83 No.2,pp.143-148(2000)
  3. Michio UMEDA “Advances in Recogniion Methods for Handwritten Kanji Characters”,IEICE Transactions on Information and Systems,Vol.E79-D.No.5,pp.401-410(1996)
  4. 小川:“パターン認識・理解の新たな展開”,電子情報通信学会 (1994)
  5. J.Ohya,A.Shio,S.Aakamatsu:“Recognizing character in scene images”,IEEE transactions on pattern analysis and machine intelligence,Vol.16,No2,pp.214-220(1994)
  6. 後藤,阿曽:“様々な画像に適応できる文字パターン抽出手法について〜サーベイおよび一構成例〜”,信学技報,PRMU99-234,pp.23-30 (2000)
  7. 劉,山村,大西,杉江:“シーン内の文字列領域の抽出について”,信学論,Vol.J81-DU, No.4,pp.641-650 (1998)
  8. 松尾,上田,梅田:“適応しきい値法を用いた情景画像からの看板文字列領域の抽出”,信学論,Vol.J80-DU,No.6,pp.1617-1626 (1997)

〒639-1080 大和郡山市矢田町22
奈良工業高等専門学校 情報工学科 
准教授  松尾 賢一
TEL:0743-55-6139 FAX:0743-55-6149
E-mail:matsuo□info.nara-k.ac.jp
(巡回ロボット対策のため,□を@に変えています)