見出し画像

【Python】置換 重複文字を1文字に短縮 改行コードでスプリットまで

関数化、クラス化前の置換と重複文字をまとめるプログラム。

txt = record[0].getText().replace('\u3000', '')
txt = txt.replace('[#ページの左右中央]', '')
txt = txt.replace('[#改丁]', '')
txt = txt.replace('。', '。\n')
txt = '\n'.join(txt.split())
splist = txt.split('\n')
splist

関数化まで。辞書型で置換プログラム。
最終的に、改行コードでスプリットしています。

今後、再度スプリットしたものを条件分岐で再加工して、またリスト化。

def text_replace(record_get,word_list):
   for k, v in word_list.items():
       print(k, v)
       record_get = record_get.replace(k, v)
   txt = '\n'.join(record_get.split())
   splist = txt.split('\n')
   return splist

word_list = {'\u3000': '', '[#ページの左右中央]': '', '[#改丁]': '', '。': '\n'}
record_get = record[0].getText()
splist = text_replace(record_get,word_list)
splist

いつもお読みいただき、ありがとうございます。 書くだけでなく読みたいので、コメント欄で記事名入れてもらうと見に行きます。