置いてけぼり日記

はてなRSSに追加Add to GoogleMy Yahoo!に追加RSS Feed
2006/7/31
OCRソフト(紙媒体の文字を読み取って、テキスト化するソフトウェア)で取り込んだ文書をクリーニングしてたときのこと。

 「触手柄スーツなどよく着るので」

ええっと……?
ペイズリー(ゾウリムシ)というものがあったし、今は触手柄というデザインがあるのかな?
それとも、クトゥルーのごとく触手生えてて満員列車の中であんなことやこんなことがっ!!(答え:つり革を総取り)

──などとと思いつつ、原本を見ると、

 「仕事柄スーツなどよく着るので」

はいはいはいはい、陣痛陣痛。

上司の人がデータマイニングの仕事を取ってきたんだが、クライアントから渡されたデータはなぜか印刷された紙データというありさまだったので、仕方なくOCRを使って変換させていたんだけど……。
しかしなんだ、えらくナイスな誤認識をしてくれたものだ。侮れないぜエプソン。

検索キーワードTOP20