ゆかとデータ

🌃データサイエンス | コンテンツデベロッパー | プログラマー (Python R …

ゆかとデータ

🌃データサイエンス | コンテンツデベロッパー | プログラマー (Python R SQL) 主に英語圏でライブ配信を通じてデータプログラミングのデモやコワーキングを発信していますが、今回日本の方たちにもデータサイエンスの重要さを伝えたくてNoteを開設しました。

マガジン

  • スポティファイ

    スポティファイAPIを使ったデータアナリシスやアプリの作成過程について纏めています。

  • ビジュアライゼーション

    データビジュアルツールやプログラミングに関する記事を纏めてみました。

最近の記事

【地球沸騰化を可視化】NASA表面温度データの上昇速度を分析して100年予測をしてみた(地球かなりやばい状態)

先日、あるデータサイエンス関連のオンラインイベントの一環で、久しぶりにKaggle上でデータアナリシスのノートブックを作成しました。 ちなみにKaggle(カグル)とは: 予測モデリングと分析コンペティションのプラットフォームで、データサイエンティストや研究者が複雑なデータセットの予測と分析のための最高のモデルを生み出すことを競うコンペティションを常時開催しています。また、Kaggleは公開データプラットフォームを提供し、ユーザーがさまざまな分野のデータセットを見つけたり公

    • 🌃Spotify音楽比較データアプリを公開しました(β版)

      というアメリカのソフトウェア開発者であるEric Raymond氏が広めたソフトウェア開発哲学があります。完全には開発されていないバージョンでも早期かつ頻繁にリリースする事で、ユーザーからのフィードバックを早くから取り入れ機能性を高めたりバグを修復し、バージョンアップデートしてリリースする開発ループを確立することによってより良いソフトウェアプロダクトを早く提供できるという考えです。 私もこのRelease Early Release Oftenを念頭に置きながらSpotif

      • 再生

        🌃作業用ポモドーロタイマー動画をアップしました

        先月のNote記事で説明したスクリプトを使ってポモドーロタイマー動画をアップロードしました。ついでに新しいYouTubeチャンネルも開設しました。ここでは動画を作成するうえで必要なbotやブラウザーソースなどを構築して色々試していこうと思っています。

        • 🌃Spotifyが2023年度トップ50を発表!トレンド曲のデータ分析&可視化をしてみる。

          毎年恒例になったSpotifyが2023年のトップトラックスを発表しました。これは2023年中の総再生回数をまとめ、その結果に基づいたランキングを作成します。今回はSpotify APIを利用してトラックデータを取得し、その情報をもとにいくつかのシンプルなデータ分析を行います。2023年はどんな曲が多くの人に聴かれたのか、今年を彩った音楽の属性や性質に関するデータを簡単に可視化して見ていきたいと思います。 ちなみに今作成中のSpotify音楽データアプリですが、データをこの

        【地球沸騰化を可視化】NASA表面温度データの上昇速度を分析して100年予測をしてみた(地球かなりやばい状態)

        マガジン

        • スポティファイ
          5本
        • ビジュアライゼーション
          2本

        記事

          🌃【Pythonクラス】作業用ポモドーロタイマーのブラウザーソースを作ってYouTube動画を作ってみた

          ポモドーロテクニックとは?コロナ禍初期の2020年に広まった時間管理手法です。正確には1980年後半にフランチェスコ・チリロさんによって開発された手法ですが、コロナが蔓延し学校や職場が閉鎖されリモート勤務になった2020年以降に一気にこの手法が注目され、YouTubeやTwitchなどのオンライン動画配信プラットフォームでポモドーロタイマーを用いたコンテンツが多く上がりました。「ポモドーロ」という言葉はイタリア語でトマトを意味するそうで、この手法は欧米のキッチンではよく見ら

          🌃【Pythonクラス】作業用ポモドーロタイマーのブラウザーソースを作ってYouTube動画を作ってみた

          🌃グーグル主催のWomen in ML オンラインシンポジウム

          今日はGoogle主催のWomen in ML Symposiumという機械学習・AI関連のイノベーションにフォーカスを当て年一度開かれるオンラインシンポジウムに参加しました。かなり多くのワークショップが開かれていてこのNote記事では、レクチャーノートを作成する感覚でいくつかの要点を簡単に書き出して共有します。 (注)もう一度ワークショップ動画を見返しているので、このNote記事も随時アップデートするかもしれませんがご了承ください。 プロンプトエンジニアリングの種類につ

          🌃グーグル主催のWomen in ML オンラインシンポジウム

          🌃Pythonの言語ルールをめぐってChatGPTに文句言いまくった件でw

          本題に入る前に、私のプログラミング環境について 私の主なプログラミングはPython言語、時々RとSQL。 環境は主にVSCode、クラウド上だとKaggleノートブックやDataLore、Google Collabを使う事もあります。主軸はVSCode上のJupyter Notebookです。 今年からはAWSのCodeWhisperをVSCodeに搭載してコードアシスタントとしてチェックしてもらってます。 そしてChatGPTはペアプログラミングの相手感覚で使用してい

          🌃Pythonの言語ルールをめぐってChatGPTに文句言いまくった件でw

          🌃Streamlitを使ってSpotify音楽データの簡単なアプリを作ってみる

          先月アップしたNote記事では、Spotify APIを利用して気になる曲のデータ分析、そしてそのターゲット曲と今年Spotify上で最もストリームされているトレンド曲と属性などを比較するビジュアルを作成してみました。 以下のリンクから読んでみてください。 今回はこのプロジェクトをさらに発展させて、Streamlitというデータアプリプラットフォームを使って独自のアプリを作っていこうと思います。 👑Streamlitとは?Streamlitは、インタラクティブなデータ駆動

          🌃Streamlitを使ってSpotify音楽データの簡単なアプリを作ってみる

          🌃【おまけ】Tableauを使って報道の自由度ランキングの世界地図アニメーションを作る

          前回からの続きのおまけ記事です。詳しくは下のリンクからアクセスしてみてください。 今回は報道の自由度ランキングの世界地図アニメーションを作って、過去10年間各国の自由度がどのように変化していったのかを可視化していこうと思います。 作成過程データの取得 報道の自由度世界ランキングのデータを取得できるソースが2つあります。 まず一つ目は国境なき記者団の公式ウェブサイトで公開されているCSVファイルデータを年毎にダウンロードする方法です。 そしてもう一つがKaggle.co

          🌃【おまけ】Tableauを使って報道の自由度ランキングの世界地図アニメーションを作る

          🌃Tableauを使って報道の自由度世界ランキングのレーシングバーチャートを作る

          最近、日本を騒がしている様々な問題や事件が報道され、マスメディアに対する信頼が揺らぐ事案が増えているように思えます。この中で、日本の報道の自由度についての疑念が議論され、国境なき記者団が毎年発表する【報道の自由度世界ランキング】が注目されています。このランキングによれば、2023年においても日本は68位にとどまり、報道の自由度が他の先進国と比べて低いとの指摘がなされています。 しかし、日本の報道の自由度が他国に比べてどの程度低いのか、そして過去のランキングとの比較を通じてそ

          🌃Tableauを使って報道の自由度世界ランキングのレーシングバーチャートを作る

          🌃日本が今すぐにでも必要とするデータジャーナリズム

          データジャーナリズム。 まだあまり聞き覚えがない言葉だと思いますが、その名の通りデータを駆使して報道する手法です。データジャーナリストは大量のデータを収集、分析し、その結果を視覚化し、私たちが従来の報道からは見えないであろう現象を見つけ出し報道する職業です。データの信頼性や正確性を確認する事も責任としてあるので、とても重要なジャーナリストの仕事とも言えます。AIが使えるようになった今日でも、プログラミング言語や統計学についての知識が要求される職業です。 昨今日本を騒がし

          🌃日本が今すぐにでも必要とするデータジャーナリズム

          🌃【後半】Spotify API を使ってBe:Firstの楽曲データや2023年度の世界トレンドを分析してみる!

          【追加編集・アップデート:2024年1月4日】 このNote記事を最初に公開してからかなりコードの中身が変わりました。もっとグラフを追加したり、効率化アップを図りました。アップデートバージョンについてはまた新しくNote記事をアップしますのでお楽しみに。 前回からの続きです。詳しくはこちらのNoteから。 今回はいよいよBe:Firstのヒット曲【Mainstream】の楽曲データを取得して、今年Spotifyでグローバルで流行している曲との類似点などを分析してみようと

          🌃【後半】Spotify API を使ってBe:Firstの楽曲データや2023年度の世界トレンドを分析してみる!

          🌃【前半】Spotify API を使ってBe:Firstの楽曲データや2023年度の世界トレンドを分析してみる!

          しばらく流行曲なんて興味がなく、しかも日本の流行りにも疎かった私が、なんとなく口ずさめる曲に出会った。しかもそのバンドは海外で活躍することを夢見てる若手アーティストだとか。 そこで調べたくなったのが、彼らの今年の代表曲は、全世界のSpotifyで今年2023年流行っている曲とどれくらい似ているのか。つまり、Spotifyで良く聞かれている曲と属性などの曲調が似通っていれば、もしかして彼らの楽曲も全世界に届くんじゃないか?そう思い勝手に分析していきました。 今回フィーチャ

          🌃【前半】Spotify API を使ってBe:Firstの楽曲データや2023年度の世界トレンドを分析してみる!

          🚀データの世界で生きると決めたから。

          初めまして。英語圏でデータサイエンス、アナリティクス、そしてプログラミングのコンテンツクリエーターをしています。今までは世界中のプログラマーやデータサイエンティストに向けてライブ配信を通して学んだり教えてきたりしました。 でも今回日本の方たちに向けてNoteを書こうと思ったきっかけが、日本ではデータサイエンスという分野がまだまだ普及してないと感じたからです。世界的にデータ戦略が社会貢献や経済発展のための重要なツールとなった今、少しでも貢献できればと思い、Noteを開設しまし

          🚀データの世界で生きると決めたから。