Recognition type document filing device and control method thereof



PURPOSE: To perform accurate identification calculation later by preserving a feature vector for a character whose recognized result is doubtful. CONSTITUTION: Document images read by an image scanner 3 are stored in a RAM 4, the characters are segmented and the feature vectors are extracted. For the extracted feature vectors, an Euclidean distance with an average feature vector is calculated, the prescribed pieces of candidate character groups are obtained in an ascending order and they are stored in a large classification part 11. Thereafter, the respective candidates, pseudo Bayesian identification formulas for respective formats are computed and the upper prescribed pieces of the candidates are outputted. Then, a difference between the value of the pseudo Bayes identification formula of a first candidate among them and the value of a second candidate is decided, it is decided that the first candidate is correct when it is more than a fixed value and it is decided that the first candidate is uncertain when it is not. For the character judged as uncertain, the feature vector relating to the character is stored. COPYRIGHT: (C)1996,JPO
(57)【要約】 【目的】 認識結果が疑わしい文字については特徴ベク トルが保存することで、後で精度のよい識別計算を行え るようにする。 【構成】 イメージスキャナ3で読み取った文書画像は RAM4に格納され、文字の切り出し、特徴ベクトルの 抽出が行われる。抽出された特徴ベクトルは平均特徴ベ クトルとのユークリッド距離を計算し、近い順に所定個 の候補文字群を得、それを大分類部11に格納する。 この後、各候補につき、書体毎の疑似ベイズ識別式を演 算し、各候補の上位の所定個を出力する。そして、その 中の第1の候補の疑似ベイズ識別式の値と、第2候補の 値との差を判定し、それが所定以上ある場合には、第1 候補は正しいものとして判定し、そうでなければ不確か であるとして判定する。不確かであると判定された文字 については、その文字に関する特徴ベクトルを記憶す る。




