見出し画像

Pythonライブラリに変な名前のものが多い理由

私は2月24日(土)に

Pythonエンジニア認定データ分析試験

を受験する予定です。

試験内容はライブラリと呼ばれるPythonに関する便利な関数を集めたツールの使い方に関する問題が主なものです。具体的には

  • Numpy

  • Pandas

  • Matplotlib

  • scikit-learn

などについて出題されます。
これらのライブラリに関する知識は機械学習を学んだり、データ分析コンペティションに参加したりする上でも必須の知識になります。

しかし、です。初学者にとってはこれらのライブラリは馴染みがなくそもそもこれはなんて読むんだろう?という疑問がありますよね。

Numpy

読み方は『ナムパイ』または『ナンパイ』と読みます。
NumberとPythonの合成語のようですね。
Numpyは配列や行列を効率よく扱えるようになっています。

  • 配列と行列はどのように違うのか

  • dot関数、@演算子、inner関数

といったことをしっかり理解して、線形代数の深い理解につなげていこうと思います。この資格を土台にして、統計検定準1級の学習につなげていきます。

Pandas

読み方は『パンダス』です。Pandasと聞いて、思い出すのはやっぱり

パンダ

です 笑
なぜこんな名前なのか?Pandasの名前の由来は

Pan(el)-da(ta)-s

だそうです。Pnes Dataとは何だろうか?となりますよね。

: panel data)とは、時系列データとクロスセクションデータを合わせたデータであり、同時に多数の個人、地域、事業所などを観察する一方で、複数の観察時点では同一の観察対象を維持するものである。自然科学のみならず、社会学経済学等の社会科学における統計的な分析にも使用される。

Wikipediaより引用

Pandasは、データ解析を容易にする機能を提供するPythonのデータ解析ライブラリです。

データフレーム(DataFrame)などの独自のデータ構造が提供されており、様々な処理が可能です。

pandasは一冊本を買いましたが、去年は全く手つかず 笑
今年はしっかり取り組もうと思います。

Matplotlib

読み方は『マットプロットリブ』です。

MATLABという数値解析ソフトと同様のことをpythonで使えるようにしたライブラリ。

Mat は Matrix(行列)がもともとの語のようです。 plotは「グラフを描く」という英単語です。

scikit-learn

機械学習を行うためのライブラリですが、正しくは『サイキットラーン』と発音します。間違えて『サーキットラーン』と発音する人が多いですね。

しかし、まあ、何でこんな変な名前なんでしょうか?

Scikit-learnの名前の由来は?

Scikit-learnプロジェクトは David Cournapeau によるGoogle Summer of Codeプロジェクト、scikits.learnとして始まった。 名前は「Scikit」 (SciPy Toolkit) つまり独立して開発・配布されるScipyのサードパーティ拡張であることを示している

Wikipediaより

こちらのライブラリが機械学習をする上で中心的なライブラリです。
こちらの書籍でしっかりと基本を身に付けようと思います。


Pythonのライブラリは読み方が難しいこともとっつきにくく感じる理由の一つかもしれませんね。

先入観を持たず、楽しみながらマスターしていきたいものです。


よろしければサポートをお願いします。 経済の記事を書くための資料購入する際に使わせていただきます。