マガジンのカバー画像

Pythonはじめました

28
Pythonを使って業務効率の向上を進めています。
運営しているクリエイター

記事一覧

怪しいデータを見逃すな!2

大きな病院の外来は土日や祝日は閉まってますよね。 それにも関わらず、これらの日付の検査日…

かわだ
4か月前

怪しいデータを見逃すな!

データの仕事をしていると、時々 「このデータ怪しいんじゃない?」 という場面に遭遇します。…

かわだ
4か月前
3

PythonでPDF結合

先日の仕事の後日談です。 しかし・・・ 終わったと思ったら、どうやら上司からまた追加で面…

かわだ
5か月前

PythonでWordをPDFに変換

これは実話です・・・ みんな無言でパソコンに向かっている姿は神々しくもありました。 単純…

かわだ
5か月前
3

PythonでExcelファイルの結合

大量のExcelファイルをとりあえず縦結合したい、ということがあります。 これも手作業だと大変…

かわだ
5か月前
1

PythonでPath操作(pathlib)

PythonでPath情報やファイル名を取ったり、名前を変えたりするのっていろんな方法があります。…

かわだ
5か月前
2

Pythonで一括ダウンロード

WebサイトからExcelなどをダウンロードするときに、数が多いと「1つずつクリックして、保存場所を指定して」という作業が面倒な時があります。そんな仕事はPythonにやってもらいましょう。 厚生労働省のNDBオープンデータから精神疾患にかかっている保険点数のファイルを年度ごとにダウンロードします。 まずは試しに2014年のファイルをダウンロードします。 今回は、requestsというライブラリを用いました。 import requestsfrom pathlib im

テキストマイニングの前処理まとめ

これまでやってきたテキストマイニングの前処理のまとめをします。 基本これまでの記事を1つの…

かわだ
6か月前
1

StemmingとLemmatization

テキストマイニングする前の処理として、これまで正規化、トークン化を行ってきました。この2…

かわだ
6か月前
2

Pythonでトークン化

私はいままでテキストマイニングにはKH Coderを使っていたのですが、スピードと自由度を求めて…

かわだ
6か月前

Pythonで正規表現

正規表現を制するものはPythonを制する、とまではいかないですが、奥の深い正規表現を扱ってみ…

かわだ
7か月前
1

Pythonでワードクラウド

ちょっとテキストマイニングのまねごとをしてみます。 サンプルデータはこのようなものです。 …

かわだ
7か月前
1

PythonでPDF注釈を取り出す(PyMuPDF)

文書レビューをお願いするときに、元の文書をいじってもらいたくない場合があります。そんな時…

かわだ
7か月前
2

PythonとPDF(PyPDF2編 ファイル操作)

PythonでPDFを操作してみます。まずはPyPDF2を使ってみます。 PDFを読み込む以下のようにしてPDFファイルを読み込みます。 import PyPDF2#PyPDF2で読み込める形でPDFファイルの読み込み#2行でファイルを読み込むfile=open("ICHGCP_R3.pdf","rb")#Binary fileをreadするという意味reader=PyPDF2.PdfFileReader(file) ページ数を見てみます。 reader.numPag