見出し画像

備忘録:Python書いたことない人がcolaboratory使ってみてコケた話

colaboratory使ってテキストマイニングしようとして、⇩をやろうとしたらハマったアホほど初歩的なところ。

120%自分用のメモだよ

データの読み込みはちょっと面倒くさい

データよみこむのに、いきなりpd.read_csvつかったらこけた。

いっかいファイルをアップしないといけないらしい。

from google.colab import files
uploaded = files.upload()

janomeがインストールできない問題

$pip installだとダメ。!pip installでcolaboratory上でインストールできる。


Tokenオブジェクトで何がとれるのか

こればただのPythonの話。いきなりコードいっぱい書いてあって、なにが何のデータか分からないレベルのド素人だったので整理。

surface (表層形)
part_of_speech (品詞)
infl_type (活用型)
infl_form (活用形)
base_form (基本形)
reading (読み)
phonetic (発音)
node_type

そもそもPythonちゃんと勉強してない件

pythonはインデントを綺麗にしとかないとうごかない…これ一番ひっかかった…

ネットからコピペとかしてきて、こねこねいじくってるとインデントよく分からなくなるんだもん…returnのインデントちょっとずれただけじゃんかちくしょう……

この記事が参加している募集

やってみた