ブログ一覧

書類電子化サービス

書類電子化とは書類をスキャンしてpdf形式等のデータにすることです。

 

 


     


  

【 目次 】

 

1.書類電子化すると

①保管場所が不要となります。

机の上に山積みになっている書類が無くなります。
又、廃棄できずほとんど見たこともない書類が書棚から無くなります。


②必要書類を見つけるのが楽になります。

人の記憶は時間と共に薄れて行きますので、○○について記載された書類を
見つけるとなると、記憶と感で確かこのあたりかな、一度で見つけられれば
良いのですが、ヘタすれば全てを見ることになり大変です。



③ブッキングの手間がなくなります。

なぜブッキングしなくてよいかは後述します。
   

④書類の移動が不要です。

私が経験したことですが、会社の引越し時一番やっかいなのが書類の移動でした。
とにかく重く、廃棄した方が良いのか迷うくらいです、その時は廃棄するかの判断を
する時間が無いので、とにかく移動しましたが大変でした。

⑤地震、水没などの自然災害リスクの備えになります。

水に濡れた書類はインクが滲んだり、紙がくっついたりして大変な事になります。
火災で焼失した書類が会社にとって大切な物であれば相当の痛手になります。

2.書類電子化には2種類の方法があります

①画像として保存する方法

書類をイメージとして保存します。そのデータを開いて文字列をクリックしてもすべてが選択されます。文字は認識されません。


②文字列を含んだ文章として保存する方法

見た目は書類のイメージ通りですが中は文字列として保存されています。
そのデータを開いて文字列をクリックすると選択できます。

但し、画数の多い漢字、手書き文字、線と重なった文字はうまく認識されません。
文字化しますので処理に時間を要します。


3.電子化されたデータのタイトル

①スキャナが読み取った用紙の内容から自動で生成


②読み取った日付で生成


③任意のタイトルを指定


3パターンがあります。「任意のタイトルを指定」は操作員の工数が生じます。


4.書類電子化する単位は

例えば厚さ5cmのバインダ分を1つのデータにするのか、内容によって細分するか単位を決める必要があります。


1つのデータにするとページ送りが大変です、内容によってデータ分けする方がタイトル分けされ見やすくなります。

5.電子化されたデータの検索

正確にそして早く検索できるかが重要です。  

①画像として保存されたデータ   

検索方法は保存されたフォルダ、タイトル、作成日時だけです。

フォルダ分け、タイトルが重要になります。
   

②文字列を含んだ文章として保存されたデータ

中に文字列が埋め込まれていますので文字列検索できるソフトを使えば該当する書類を抽出できます。

縦書き文章の文字列を検索するソフトは難しいのかあまり見ません。

しかし文字列検索は検索補助ですのでフォルダ分け、タイトルは重要です。


1.の③ブッキングの手間がなくなりますの説明

例えば氏名でブッキングする書類ならブッキングする事無く、氏名で検索キーにして
該当書類を抽出できるからです。


6.検索結果のサムネイル表示

書類電子化以外でも有効なのですが、検索結果データの1枚目のイメージを表示してもらえれば可視的に分かりやすくなります。

エクスプローラで「表示」を「アイコン」にすると1枚目がイメージとして表示されますが拡張子がjpg、png等に限られpdf、エクセル、ワードは、そのソフトのアイコンが表示されるだけです。

この機能をサムネイル表示といいます。

pdf、エクセル、ワードをサムネイル表示させるには別に仕組みを施す必要があります。



2018年12月20日

VPN

img000a1

外出先から社内のIT機器のデータが必要な場合がありませんか?

スマホやパソコンで標準機能であるVPN接続を使用して安全に社内のネットワークに入ることができます


社内に直接ネットワーク接続しているのに比べると通信速度は劣りますが、外出先でも社内のIT機器の操作ができるようになります。

コンビニや飲食店などの無料Wi-Fiスポットや宿泊施設の公衆向けインターネット接続サービスでも安全に利用できます。




 


VPN接続の場合、手持ちのネットワーク対応機器と社内の環境との接続は暗号化されていますので、公衆向け無料接続サービスを利用しても悪意ある第三者に介入されるリスクをへらすことができます。

2019年01月11日

面会について

私事ですが
私は伊丹市で仕事、両親は離れた丹波市で暮らしていました。

父は平成17年、母は平成20年に亡くなりましたが、父は認知症で母が面倒を観ていたのですが平成16年に母が転倒骨折して入院となり、私に面倒を観ることが出来ない父も入院となりました。父は面会に行っても私のことすら分からない状態でした。

母は病院→老健→特養→病院(脳内皮質基核変形症の診断・治療で三田市の病院)→特養と
施設を移り変わりました。面白いのが「今度はどこに行くのや」言ってピクニック気分で
言っていたのが懐かしいです。


前置きはさておいて、面会についてですが

特養ソフトの仕事をしていましたので施設の方から

「毎週来られる方がおられる」(偉いな、自分も見習おう)
「面会に1回も来ずに亡くなったら遺産で押しかけてくる」(情けない)
「半分ぐらいがほとんど来ない」(そんなものなのか)
とかお聞きして状況は分かっていました。


自分に恥じない思いで4年間、毎週、面会に行きました。
雪で行けなかったのが1回はありましたが

本来なら面倒を観なければいけない、

寂しい想いをしているのでは、

何か欲しいものがないか、

育ててもらった恩に報いる、

状態が変わっていないか、

母の生きてきた(戦闘当時)ことの興味、

毎週行くことで職員によく世話してもらえるのではないか

などの理由でした。

面会に行くことで、その施設の雰囲気がよく分かりました。

「明るいのか」、「暗いのか」

「良くしてもらっているのか」、「そうでないのか」

だんだん病気が進行していく様が辛くもありましたが致し方ない事、
又、親が達者な頃は互いに忙しく、照れもあり話す時間がなかったが、

面会で色々話せたことが良かったと思います。

 

亡くなってから後悔として、

もっと聞いておくことがあったのでは
と思いました。

これから親の面倒を観なければならない世代の人に、

時間の許す限り「面会」に行かれることをお薦めします。

2019年03月13日

Access処理速度を早くする4つの方法 ~フォーム編~

 
実際に開発する過程で「困った事」、「悩んだ事」、「苦しんだ事」の対処方法です。
 
一般的ではないかもしれませんが弊社お客様で問題なく稼働している内容ですので参考にして下さい。

 



目次

 


 

Ⅰ.新規MDBを作成時に気を付けること

「名前の自動修正オプション」をオフにする。
 新規作成時はチェックされています。


これがチェックされていますとフォームを開く時、極端に遅くなります。

【 チェックを外す方法 】

①ファィルのオプションを選択


②既存のデータベースを選択


③下段に名前の自動修正オプションの項がありますのでチェックをはずします。



Ⅱ.コンボボックスの「値集合ソース」の初期値を空にする

フォームを開く時に値集合ソースを表示しようとしますので遅くなります。

そのコンボボックスの「フォーカス取得時」にセットします。

【 やり方 】

①値集合ソースを空にする。

②フォーカス取得時にセットします。




Ⅲ.Dlookup、Dcout、Dsum関数は遅いので使用しない

DLookupやDCount、DSumなどの関数は「定義域集計関数」と呼ばれ、一般的には低速な関数といわれています。
少ないデータ件数なら気になりませんが多くなってくると影響しますので使用すべきではありません。

【 対処 】

それぞれの目的のモジュールを書く事をお薦めします。
Ⅳ.フォームのレコードソースの抽出条件は1行にする

レコードソース(クエリー)の抽出条件を2行以上記述すると遅くなります。


【 対処 】

下記のように1行に記述します。



 





今回はフォームについてのみで思い出す範囲で記載しています。

遅い、早いはレコードの抽出に依存しますので次回はその点について述べます。


2019年03月14日

■現在のAI(人口知能)について

最近、AI搭載の電気製品や、AIを使った等を、よく目にし、聞かれます。

過去に人工知能ブームは2回あり、1960年代と1980年代で「人工知能はもうすぐできる」の言葉に期待は大きかったですが結果としてブームで終わりました。

今のAI(人工知能)の定義は「 ビッグデータを学習して予測などができることを目指したもの 」で、それにディープラーニング(機械学習)の技術が使われています。

ディープラーニングとは、人間や動物の脳神経回路をモデルとしたアルゴリズム(計算方法)で、データからパターン・特徴を抽出する学習をディープ(多層構造)で行うことです。

入力データ→計算→出力データを1回として、求めた出力データを入力データとして多層繰り返すことで、より良い結果が得られます。
そして大量のデータが有るほど精度が上がります。


実例としてタクシーの需要予測で説明しますと タクシー待ちの写真や、通信キャリアならスマホの位置情報から人数を、場所、時間毎に天気、気温、近辺のイベントなどの情報と合わせてコンピュータに読み込ませます。 蓄えられた膨大なデータを学習してタクシー待ちが多い場所を予測します。

センサー、画像処理技術、コンピュータ性能の向上、Webの大量なデータなどにより、いろいろな分野で応用され、今回はブームで終わらず浸透していくものと思われます。

2019年03月29日

■ディープラーニングについて

簡単に言いますと「データの入力、正解の出力を決めて、その間を自動補間する技術」です。

例えば猫の画像(入力)を入れて、これは猫(出力)と教えておくと、その間で勝手にコンピュータが特徴量を見出し、次から正解を出してくれる技術です。


この技術が開発される前は、人間が条件式を記述して、例えば、猫の画像なら「耳がとがっているなら猫」、「ヒゲが長ければ猫」...といったように無数の条件式をコンピュータに教える仕組みでした。
人間が入力するので条件式に限界があり、又、正解率も限界がありました。


ボトルネックになっていた部分をコンピュータにさせることで、いろいろ分野で応用できるようになりました。

2019年03月29日

■ディープラーニングのしくみについて

ディープラーニングとは人の脳の神経回路を模した「ニューラルネットワーク」の層を「ディープ(深く)」重ねた機械学習法。

脳に多くある神経細胞ニューロンは、他のニューロンからの電気的刺激を受けて、刺激の合計がある一定値を超えると自分も興奮して電気的刺激を他のニューロンに伝えるふるまいをします。

その仕組みを人工的に作成したものをニューラルネットワークといいます。
人工ニューロン同士を接続する経路はリンクと呼ばれ、リンクにはそれぞれ重み(数値)が与えられます。


~ニューラルネットワークを理解する方法は、うわさ話です。

AさんとBさんという友達がいたとします。Aさんはある映画を「面白かった」と言い、Bさんは「イマイチだった」と言いました。

それを聞いたCさんがいざ映画を見に行くと、確かにイマイチでした。

それで、CさんからAさんへの信頼度(重み)が下がり、次にAさんが「この漫画おもしろいよ」と勧めてきても、CさんはAさんのいうことだから信用できないな、考えます。

ところがBさんも「この漫画、そこそこおもしろいよ」とAさんの勧めてきた漫画と同じ漫画を勧めてきました。
CさんはBさんもAさんも面白いというなら、もしかして、と思ってその漫画を読んだところ、大変な傑作で驚いて、他の人にもこの漫画を勧めたくなりました。

Aさん、Bさん、Cさんはそれぞれニューロンです。 そして、CさんはAさんからのリンク、Bさんからのリンクそれぞれについて、”重み”を持っています。Aさんからの情報は話半分くらい、Bさんからの情報はふつうに信用できると判断しています。

~ 「よくわかる人工知能」清水 亮 著より引用

 CさんのAさんからのリンク、Bさんからのリンクの重み”を、出力結果と正解との差(ロス)を求め、重み付けを段階的に減らしていき出力結果がましになるように学習させます。

2019年03月29日

Windows Update (November 2019 Update)でのAccess動作バグ

2019年11月12日のWindows Update を適用すると MS Access を用いたプログラムを操作中に

実行時エラーが発生することを確認。

 

・Security Update for Microsoft Office2010(KB4484127)32-BitEditon

・Security Update for Microsoft Office2016(KB4484128)32-BitEditon

・Security Update for Microsoft Office2016(KB4484113)32-BitEditon

 

弊社ではAccess 2010 および Access2016の両方を使用しているため、

上記3種類をプログラムの追加と削除から削除することで正常に動作するようになった。

 

 

2019年11月14日

■OCR化で生成される文字列

書類電子化は「画像化」、「OCR化」の2つの方法がありますが、
OCR化について解析後の文字列をもとに詳しくご説明します。


 

目次

1.OCR化とは

2.変換された文字列(ほぼ成功例)

3.誤解析された文字列

4.まとめ

1.OCR化とは

光学文字認識のこと。

画像データ上にある文字と思われる部分を解析し、コンピューター上で扱える文字(テキスト)データに変換すること。

文字列は画像(PDF)に保存されています。
2.変換された文字列(ほぼ成功例)


OCR化した文字列



PDF内に保存されている文字列をメモ帳で開いた状態です。
説明のため改行していますが本当は右側に続いてします。

ほぼ正しく解析されています。

但し
①「サカモトリヨウマブリガナ」は「フリガナサカモトリヨウマ」では、

又、「性別性別・女33年11月30」あたりから微妙な文字列となっています。

②メモ帳の最後1111となっていますが実際は有りません。

③人間の感覚では上から順ではないのかと思いますが異なります。

3.誤解析された文字列



線に囲まれた番号12345678は全く認識されていません。

氏名は認識されていますが罫線、下線との関係で文字化けする時があります。

4.まとめ

帳票によって認識率が左右されます。

ご認識する要素として 以下が考えられます

①「シワ」、「折れ」、「変色」等の帳票劣化。

②文字の書体、大きさ、太さ

③文字のかすれ

④原稿が斜めになっている

⑤文字間隔が詰まっている

⑥FAXで送付された用紙

⑦罫線で囲まれている

⑧下線、横線にひっいている

⑨縦書きと横書きの混在




使い物にならないか?

いいえ、検索用途によると思います。

OCR文字列を全文検索すれば時間は要しますが条件文字に相当するPDFは抽出されます。

条件文字の追加の機能(AND)があれば 、 ある程度絞り込めます。

検索結果を1枚1枚開いて確認する時間と忍耐があれば使えます。





 

 



2020年02月05日

■スキャナーが付けるファイル名


スキャナーが付けるファイル名についてご説明します。

 


目次

1.原稿に含まれる文字列で自動生成

2.スキャンした日時で自動生成

3.名前を指定入力

4.まとめ
1.原稿に含まれる文字列で自動生成

原稿に含まれる文字列

付けられた名前は 19581130_○口△申請書.pdf

重複しない番号19581130_と ○口△申請書 でした。

なぜ様式第15号でないのか不明です。

2.スキャンした日時で自動生成

付けられた名前は 20200206112227.pdf

20200206は2020年2月6日

112227は11時22分27秒

1秒に複数枚スキャンした場合は
20200206112227_001.pdf、
20200206112227_002.pdfとなります。
3.名前を指定入力

任意の名前を指定します。

重複する場合は自動で3桁の連番が付加されます。

例えば ○□△申請書.pdf ○□△申請書_001.pdf ○□△申請書_002.pdf

他に先頭からの文字列を指定する方法もあります。

4.まとめ

同一形式の帳票をスキャンする時は便利です。


但し、誤認識した場合は、その項目名となります。


複数の形式の帳票を大量にスキャンしたい場合は不向きです。

 

 

 


2020年02月06日