┏━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━┓
┃ 高度を目指す一日一題宿題メールマガジン .&&&& **** %%%%. ┃
┃ &&&&&&******%%%%%% ┃
┃ 発行 斎藤末広 suehiro3721p@gmail.com @は半角 '&┃&''*┃*''%┃%' ┃
┗━━━━━━━━━━━━━━━━━━━━━━━━━━┻━━┻━━┻━━┛
宿題メールトラブル/問題訂正
https://twitter.com/HomeWorkMail HmWk240422
========================================================================
2024年4月22日
旧暦 弥生(やよい,3月) 14日
4/19 穀雨(こくう) → 5/5 立夏(りっか)
強化したい分野の問題を毎日1問 挑戦しよう
このメールの下部の部分に解答欄があります。返信してください。
======================================================================
☆宿題メールCM 買い物・出張ホテル予約は 楽天
http://tiny.cc/r2w6wz
☆ 携帯/常時接続は、楽天モバイル(特典あり)
https://r10.to/hNhqLt
------------------------------------------------------------------------
# コラム 『かじる Python』 その9 OCR 後処理
文字を扱うことは、Python の得意分野の一つです。プログラムをさっと
作れて、すぐに実行できます。
昨日の試験問題を、OCR 処理をして、そのあとの読み取りエラーの訂正を
します。
先ず、ウェブから、Googleドライブを開き、そこに PDF ファイルを保管します。
次に、そのファイルを、Google ドキュメントで開きます。
そうすると、自動的に、OCR 処理されます。
Google Colabo で、次の処理をします。
情報処理技術者試験のOCR 処理の経験から、いくつか間違いパターンを見つけています。
その修正を適用します。
(OCR済み問題文) のところは、OCR 処理されたテキストをコピー&貼り付けしてください。
```
# その9 OCR 後処理
msg = '''(OCR済み問題文)'''
msg = msg.replace(', ', ',', 100000) #句点を揃える
msg = msg.replace(',', ',', 100000)
msg = msg.replace('、', ',', 100000)
msg = msg.replace('“', ' "', 100000) #引用符を""に揃える"
msg = msg.replace('”', '" ', 100000)
msg = msg.replace('ア ', ' ア ', 100000) #選択肢の記号前後のスペースを揃える
msg = msg.replace('イ ', ' イ ', 100000)
msg = msg.replace('ウ ', ' ウ ', 100000)
この記事は約
NaN 分で読めます(
NaN 文字 / 画像
NaN
枚)