見出し画像

PythonでテキストファイルをWord形式に変換1

以前PDF→txtデータにテキストを抽出→CSV変換というのをしました。今回は同じテキストを使ってワードデータにしてみたいと思います。

なんでワード?

仕事でそういう依頼がきたからになります。忘れないための備忘録も兼ねております。

使うテキスト

前回テキストデータをCSVに変換したときのデータを使おうと思います。

整理番号:322636940
日付:令和2年4月15日
平成:30年5月 2日
提出人:544506015206
参考人:青しそ大葉様
提出日:昭和16年2月 29日
提出番号:PYT/MQL4827/793784
通知番号:通知256488

これを使いたいと思います。

最終的な形

ワード形式(docx)にして開いた時にこんな感じになればなと思います。

【整理番号】 322636940
【日付】   令和2年4月15日
【平成】   30年5月 2日
【提出人】  544506015206
【参考人】  青しそ大葉様
【提出日】  昭和16年2月 29日
【提出番号】 PYT/MQL4827/793784
【通知番号】 通知256488

あくまで理想です。なればいいなーという具合です。

ライブラリのインストール

python-docxというライブラリを使います。

# pip install python-docx

インストールされた場所がわからない場合は

pip show python-docx

でインストールされた場所がわかります。pyenvを使っている場合は

[macan@localhost ~]$ pip show python-docx
Name: python-docx
Version: 0.8.10
Summary: Create and update Microsoft Word .docx files.
Home-page: https://github.com/python-openxml/python-docx
Author: Steve Canny
Author-email: python-docx@googlegroups.com
License: The MIT License (MIT)
Location: /usr/local/pyenv/versions/3.6.10/lib/python3.6/site-packages
Requires: lxml
Required-by:

こんな感じででます。Python3.6.10を使っているのでその中に入っていました。pyenvの場合はバージョンによってインストールされる場所が少し異なります。

宣伝

「Pythonの環境を簡単に構築できるスクリプトってないのかな?」って思った方、答えは「あります!」Buildreeにはpyenvを使った環境を構築できます。是非使ってください。

ファイル構成

/home/macan/word.py
         └ /python_docx-0.8.10-py3.6.egg-info

となります。ライブラリは同じ階層にいれないと意味が無いので気をつけてください。

準備が終わったので次回からPythonを使ってワードデータに変換していきたいと思います。

お役に立ちましたか?

投げ銭をいただけるともっと頑張れます!
・note
・仮想通貨(bitflyer)
キャッシュ
のどれでも構いません
ビットコインアドレスは以下になります
3LHnADwZwUbic2L45EnVJEykiG6KfbqrwS

この記事が気に入ったらサポートをしてみませんか?