2018-11-01から1日間の記事一覧
nginx をつかってブラウザにリファラをおもらししないように命令する 社内のファイルサーバーのリファラURLが漏れると恥ずい。いやまずい。 何がまずいかというとファイル名が漏れてしまったり、アクセス元のURLとして晒されたり、検索インデックスに追加さ…
tesseract を使ってPDFをOCRする https://pypi.org/project/pypdfocr/ というツールを見つけたので、使ってみる 残念なお知らせです。 python 3 系ではシンタックスエラーで動きません。 インストールのログがこちら。 takuya@deskew$ pip install pypdfocr …