書類電子化の目的の一つ、電子書類を正確に瞬時に検索をご提供するサービスです。
OCRのデータを解析し基本データとマッチングします。
※ocr化で生成されるデータは →こちらを参照して下さい
送付頂いた紙媒体を電子化 ( OCR化 ) して1枚1枚に適切なファイル名を付けて検索ソフトと一緒にお納めします。
用紙サイズ:A4
※ある会社の例ですが
令和1年9月から12月の4ヶ月間で40万枚弱を電子化しました。
重さ約30kgの箱、80個に相当します。
専有していた場所が空になり、スッキリしました。
帳票が詰め込まれています。
「より高度な書類電子化代行サービス」で
検索キーで高速、正確に帳票を参照できるようになります。
- 目次
1.大量帳票を書類電子化する問題点
2.プログラムでファイル名を自動生成
3.検索ソフトは曖昧はなく正確で瞬時
4.導入メリット
- 1.大量帳票を書類電子化する時の問題点
①ファイル名付けのボトルネック
操作者がスキャンされた帳票を1つ1つにファイル名付けするのは大変時間・コストがかかり、誤ったファイル名付けするケースが生じます。
人間による作業はどうしてもボトルネックになり効率が上がりません。
②OCR化は誤った文字列を生成する
●日本は罫線まみれの票が多い。
●微妙な印刷位置で認識されないケースがあります。
●利用者の情報がプライバシー保護で塗りつぶされている。
●同姓同名の人がいる。
●2枚セットの帳票で1枚目にしか名前が記載されていない。
●帳票にマーカーで色付け、手書き文字が記入されている。
上記の帳票をOCR化しますと文字列は文字化けします。誤った内容となります。
結果、全文検索では該当がヒットしない、複数候補が抽出され目的の帳票にたどり着くまで時間がかかるといった問題が生じます。- 2.プログラムでファイル名を自動生成
★前提条件として帳票の根拠となるデータが必要です
❏具体的な工程は
①ホッチキス部分のカット
②折れ曲がった用紙を伸ばし1日以上プレス スキャナに通した時の紙詰まりを防止するため。
③スキャンと同時にイメージと文字列を格納 認識率を上げるため不要文字の除去します。
④文字列からプログラムでファイル名を自動生成 文字列を解析して根拠のデータに合致する検索キーを割り当てます。
特定する情報が多いほど認識率が上がります。
氏名、生年月日、住所、固有番号等
罫線が多い帳票は文字化けがひどくプログラムを調整して認識率を上げていきます。
同姓同名、同一生年月日等のあやふやなデータはエラーとします。
成功率は経験から約85%くらい
⑤エラー帳票の手作業によるファイル名付 1つ1つPDFを開きいろいろな条件から検索できるプログラムでファイル名付けします。時には1つ前のPDFを開き特定します。
⑥ファイル名付けされたPDFを所定のフォルダに格納し検索キーをデータベースに登録します。- 3.検索ソフトは曖昧はなく正確で瞬時
検索キー例えば氏名入力で該当のデータを瞬時に一覧表示します。
該当データをクリックしますとPDFが参照できます。
経験から1つのフォルダに50万件のPDFがあるとしても瞬時に参照できます。
※検索キーはお客様の要望でカスタマイズ承ります。
- 4.導入メリット
①コスト削減
1件1件手作業によるファイル名付けはコスト高(非常に手間がかかります。)
②正確性 ・信頼性の担保
人間がかかわる部分を少なくすることで実現
③探す手間の削減
1枚あたりの単価は帳票、データを調査してからお見積りさせて頂きます。
分からないこと、御社に適用できるのか他、お気軽にお問い合わせ下さい。
お問い合わせ
サービスのご質問・要望は下記まで連絡ください。
株式会社ネットウェーブ
電話:072-773-8123 担当:阿部 聡
FAX:072-773-8122
メール:info@netwave.cage.to