R.I

データサイエンティストにキャリアチェンジするため日々奮闘中。できることはpython, SQL, Linux。興味あることは英語学習と筋トレです。

機械学習でAirbnbのデータを分析してみた

はじめに

今回はAirbnbのデータをPython・機械学習を用いて分析してみようと思います。元ネタはMediumにあった英語の記事となります。

データ取得先

Inside Airbnbというサイトにデータセットがありました。こちら、Airbnbが管理しているサイトではなく、ある個人の方が独自にAirbnbからデータを集めてアップしているとのことです。

本来なら一番イメージがつきやすい日本

もっとみる

PythonでSpotify2017年トップ100を分析してみた後編

はじめに

今回は音楽配信サービスとして世界的にも有名なSpotifyのデータセットを使用し、2017年のトップ100を分析してみました。今回はKaggleにあった内容をRからPythonに読み換えて、写経してみました。

学習内容

・Top100にランクインした曲、アーティストを分析する
・決定木の可視化に使用したdtreevizの使い方

使用するライブラリ

以下、使用するライブラリとなり

もっとみる

PythonでSpotify2017年トップ100を分析してみた前編

はじめに

今回は音楽配信サービスとして世界的にも有名なSpotifyのデータセットを使用し、2017年のトップ100を分析してみました。

経緯

Kaggleを見ていたところ、今回する使用するデータセットが見つかったからです。

学習内容

・foliumの使い方を知る
・2017年の曲別再生数やアーティスト別再生数などの結果を知る

使用するライブラリ

以下、使用するライブラリとなります。

もっとみる

PythonでPairsに登録されている写真にラベル付けをしてみた

今回のテーマ

前に記事にもしたこちらを参照し、今回はPairsに登録されている写真にGoogle Cloud Vision APIを利用しラベル付けをしてみます。

経緯

先日、 AWS re:Invent 2018で発表されたこちらに影響を受け、今回の記事を作成することにしました。TinderではAmazon Rekognitionを利用しているようです。登録されている写真に対しラベル付けを

もっとみる

Tinderをpythonで分析してみた〜物体検出編〜

今回すること

プロフィールデータ編、顔写真編に引き続き、今回はラストの物体検出編となります。Google Cloud Vision APIを使用し、以下を検出しました。

1. 写真に写っている物体
2. 写真がスケベであるかを1-5の5段階で評価

学べること

・Google Cloud Vision APIの使い方
・各都市でどんな物体が写真に写っていることが多いのか、または少ないか
・各

もっとみる

Tinderをpythonで分析してみた〜顔写真編〜

今回すること

前回のプロフィールデータ編に引き続き、今回は取得した顔写真の解析を行います。具体的にはFace++のAPIにて写真を読み込み、顔のスコアを取得します。そして、取得したスコアが高いユーザーは多くのいいねを獲得しているかどうかを確認します。

学べること

・スコアはどの値が多いか、または少ないか
・どの都市の顔のスコアが高いか
・どの地域に顔のスコアが高いユーザーがいるか

環境

もっとみる