科研費成果報告用ページ(2008年度版)


平成20年度状況
種別 テーマ名 補助金額
基盤研究C 情景中に存在する文字情報の電子化支援システムの開発 2,278,000

助成による研究成果一覧
口頭発表【2件】
松尾賢一,原田光,Damdinsuren Chuluunsuren:“答案採点支援システム実現に向けた基礎実験”,電子情報通信学会2009年総合大会(講演予定)
寺脇温晃,松尾賢一:“文字の配置特徴を用いた文字列領域候補特定手法の検討”,電子情報通信学会2009年総合大会(講演予定)
学術雑誌(紀要も含む)【計1本】
松尾賢一,Damdinsuren Chuluunsuren,原田光:“採点記号の分離抽出と認識処理の高精度化”,奈良高専研究紀要,第44号(投稿中)

研究目的
本研究は,情景に存在する様々な文字情報に対して,OCR【Optical Character Reader:光学式文字読み取り】の適用を可能とする手法の提案と,OCRと人間が対話形式で協調しあうことで,OCRの認識結果を参照した文字情報の誤り箇所発見や,認識結果に対して人間が容易に認識結果を修正できる,情景に存在する文字情報の電子化支援システムの開発が目的である.この目的に対して,2年の研究期間において,以下の5つの内容について研究を推進する.

  1. 情景に存在する文字情報の電子化支援システムを完成する.
  2. 情景から文字情報を検出(文字スポッティング)し,背景部から文字パターンを高精度に,分離,切り出し,抽出させる方式を開発する.
  3. OCRを用いて得られた認識結果から最適な認識結果を選択する方法を開発する.
  4. 1.の分離,切り出し,抽出処理過程に対して,Aの認識結果を利用したフィードバック処理を導入することによって,@の処理の高精度化を図る.
  5. 2.,3.の処理が困難である文字情報に対して,コンピュータとの対話形式で協調しながら文字情報の電子化を支援する方式の開発とその有効性を明らかにする.
本年度の研究実施計画
平成20年度では,情景に存在する文字情報の電子化とそれを支援するためのシステム開発について研究する.
平成19年度の研究の文書レベルで,文字情報をOCRとの対話形式で協調し合いながら電子化する知見に基づいて,
情景レベルにおける文字情報の電子化を支援するシステムへと拡張を試みる.

以下に平成20年度の計画・方法を示す.
  1. 本研究経費で購入予定のディジタルカメラを用いて,文字情報を含んだ様々な情景を撮影し,実験用情景画像データベースを作成する.
  2. 既に開発済みの情景画像からの文字情報の検出・抽出手法を適用し,情景画像から文字候補を得る.そして,得られた文字候補に対して,昨年度の研究同様にOCRによる認識処理を行う.
  3. 情景画像は,文書画像と異なり,画質や解像度が低下しているために,文字パターンの品質が劣化することが予想されるため,文書画像の文字パターンの認識結果との文字認識精度についての調査を行い,どの程度人間が認識結果に対する関与が必要であるかを明らかにする.
  4. 誤認識結果に対して,人間が対話形式で正しい認識結果に修正する処理部の開発する.また,昨年までの文書処理とは異なり,情景を対象とすると,処理に対する計算量が増えるために,システム開発においては,高スペックのコンピュータが必要であるため,高速な計算速度で,記憶容量が大きいパーソナルコンピュータを本研究経費で購入する.
[研究協力者]
奈良工業高等専門学校 情報工学科 松尾研究室 専攻科生および本科生:システムの開発補助
大阪電気通信大学 情報工学部 情報工学科 梅田研究室:技術支援とアドバイス 

〒639-1080 大和郡山市矢田町22
奈良工業高等専門学校 情報工学科 
准教授  松尾 賢一
TEL:0743-55-6139 FAX:0743-55-6149
E-mail:matsuo□info.nara-k.ac.jp
(巡回ロボット対策のため,□を@に変えています)