Pythonライブラリに変な名前のものが多い理由
私は2月24日(土)に
Pythonエンジニア認定データ分析試験
を受験する予定です。
試験内容はライブラリと呼ばれるPythonに関する便利な関数を集めたツールの使い方に関する問題が主なものです。具体的には
Numpy
Pandas
Matplotlib
scikit-learn
などについて出題されます。
これらのライブラリに関する知識は機械学習を学んだり、データ分析コンペティションに参加したりする上でも必須の知識になります。
しかし、です。初学者にとってはこれらのライブラリは馴染みがなくそもそもこれはなんて読むんだろう?という疑問がありますよね。
Numpy
読み方は『ナムパイ』または『ナンパイ』と読みます。
NumberとPythonの合成語のようですね。
Numpyは配列や行列を効率よく扱えるようになっています。
配列と行列はどのように違うのか
dot関数、@演算子、inner関数
といったことをしっかり理解して、線形代数の深い理解につなげていこうと思います。この資格を土台にして、統計検定準1級の学習につなげていきます。
Pandas
読み方は『パンダス』です。Pandasと聞いて、思い出すのはやっぱり
パンダ
です 笑
なぜこんな名前なのか?Pandasの名前の由来は
Pan(el)-da(ta)-s
だそうです。Pnes Dataとは何だろうか?となりますよね。
Pandasは、データ解析を容易にする機能を提供するPythonのデータ解析ライブラリです。
データフレーム(DataFrame)などの独自のデータ構造が提供されており、様々な処理が可能です。
pandasは一冊本を買いましたが、去年は全く手つかず 笑
今年はしっかり取り組もうと思います。
Matplotlib
読み方は『マットプロットリブ』です。
MATLABという数値解析ソフトと同様のことをpythonで使えるようにしたライブラリ。
Mat は Matrix(行列)がもともとの語のようです。 plotは「グラフを描く」という英単語です。
scikit-learn
機械学習を行うためのライブラリですが、正しくは『サイキットラーン』と発音します。間違えて『サーキットラーン』と発音する人が多いですね。
しかし、まあ、何でこんな変な名前なんでしょうか?
こちらのライブラリが機械学習をする上で中心的なライブラリです。
こちらの書籍でしっかりと基本を身に付けようと思います。
Pythonのライブラリは読み方が難しいこともとっつきにくく感じる理由の一つかもしれませんね。
先入観を持たず、楽しみながらマスターしていきたいものです。
よろしければサポートをお願いします。 経済の記事を書くための資料購入する際に使わせていただきます。