マガジン

記事一覧

【書評】Pythonによる経済・経営分析のためのデータサイエンス~分析の基礎から因果推論まで

今回ご紹介する書籍はこちら。 かなり辛口な内容になっているので、そういうのが苦手な方は読まないで欲しい。 「経営分析のためのデータサイエンス」というフレーズで興…

yohey
3年前
1

YouTube「にじさんじ」ライブ配信アーカイブのチャットをGoogle Cloud Text-to-Speechを使って読み上げてみる

前回は、RでYouTubeのライブ配信アーカイブのチャットのデータを抽出して可視化を行った。 今回は、チャットデータを、Google Cloud Text-to-Speechを使って読み上げてみ…

yohey
3年前
2

Clubhouseをやってみて思ったこと

今流行のClubhouseをやってみたので、思ったことを雑に書いてみる。 Clubhouseに関して知らない方は、上記の記事が詳しく解説されているので読んでみてほしい。 第一印象…

yohey
3年前
1

セルフマネジメントについて書いてみる

リモートワークでのセルフマネジメントの必要性 リモートワークになって、従来よりもセルフマネジメントが求められている。 職場に出勤すれば、上司や同僚がいて基本的に業…

yohey
3年前
6

【R】Amazon 商品レビューの抽出

前回は、RでAmazonの売れ筋ランキングから情報を取得する方法を紹介した。 今回は、その続きとして、任意の商品に関して、レビュー情報を取得する方法を紹介したい。 レ…

yohey
3年前
1

【R】Amazon 売れ筋ランキングの情報を取得する

RでAmazonの売れ筋ランキングの情報を取得する方法を紹介する。 URLの構造URLは、以下のような構造になっているので、取得したいカテゴリを実際にアクセスして確認する。 …

yohey
3年前
2

【Amazonレビュー分析vol.1】売り筋ランキング[本-ビジネス・経済](2021-01-28)20位 嫌われる勇気―――自己啓発の源流「アド…

売れている商品のレビューのコメントを見ることで、普段の生活では分からない、世の中の価値観や感覚を知ることが出来るのではないだろうか? そんな事を思いついたので、…

yohey
3年前
1

雑談の大事さについて

コロナ禍でテレワークになって一年近くになる。 テレワークになって気付かされた事は多いが、その一つに雑談の大事さがある。 私は、ここ一年ほど、あまり成長出来てない…

yohey
3年前
1

【R】YouTube「にじさんじ」ライブ配信アーカイブのチャットデータを可視化してみる

前回の続き。 配信全体でのチャットのコメントの傾向を見てみる取得したチャットのコメントをワードクラウドで可視化してみる。 まず、下準備としてチャットのコメントを…

yohey
3年前

【R】YouTube 「にじさんじ」のライブ配信のチャット(配信終了後)を取得してみる

「にじさんじ」は、ライブ配信を結構やってるので、配信の時のチャットの内容の抽出をしてみる。 結論からいうと、思ったより難しい。APIでサクッと取れると思ったのだが、…

yohey
3年前
2

【R】YouTube Data APIを使って「にじさんじ」でランキングを作成してみる

前回は、YouTube Data APIを使って、にじさんじのデータを取得してみた。 今回は、視聴回数とレイティングでランキングを作成してみる。 準備APIキーなどをベタ打ちする…

yohey
3年前
1

【R】YouTube Data APIを使って「にじさんじ」のデータを取得してみる

YouTubeは、実は様々なAPIを提供しており、結構いろんなデータ取れる。 例えば、こちら。 チャンネルや動画の情報や、検索結果を取得することが出来る。 今回は、このAPI…

yohey
3年前
7

【書評】分析者のためのデータ解釈学入門 第3章 データに含まれるバイアス

今回は、こちらの本の第3章について紹介する。 この章では、バイアスの種類とその発生原因について解説されている。 測定基準に起因するバイアスまず、1つ目のバイアス…

yohey
3年前
1

【書評】億を稼ぐ勉強法

雑感全体的には良くある自己啓発本の内容ではあるが、著者の経験とそれによる成長が書かれているので、対象読者には刺激になる一冊だと思う。 そして、この本の対象読者は…

yohey
3年前

上場企業のおかしなIRグラフについて

面白いものを発見したので紹介したい。 上場企業のIRグラフについて、分析者から見て変なグラフ、分かりにくいグラフを紹介しているようだ。 なんと、2015年から毎年やっ…

yohey
3年前

【書評】徹底的に数字で考える。

全体的には良くあるビジネス書にあるような内容ではあるが、個人的に面白いなと思ったところを紹介したい。 仮説を立てられない人に足りないのは「ひとつに決める勇気」で…

yohey
3年前
2

【書評】Pythonによる経済・経営分析のためのデータサイエンス~分析の基礎から因果推論まで

今回ご紹介する書籍はこちら。
かなり辛口な内容になっているので、そういうのが苦手な方は読まないで欲しい。

「経営分析のためのデータサイエンス」というフレーズで興味をもったので買ってみたのだが、私自身には何も役に立たなかった。
著者が経営の実務者ではなくアカデミックである事と、対象読者を見ると、あまり真面目でない学生や社会人向けのようなので、それは仕方がない。Pythonの逆引き辞書もあるので、対

もっとみる

YouTube「にじさんじ」ライブ配信アーカイブのチャットをGoogle Cloud Text-to-Speechを使って読み上げてみる

前回は、RでYouTubeのライブ配信アーカイブのチャットのデータを抽出して可視化を行った。

今回は、チャットデータを、Google Cloud Text-to-Speechを使って読み上げてみる。

Google Cloud Text-to-Speechの設定に関しては、以下のサイトを参考に行った。
https://blog.apar.jp/web/9893/

上記を参考に設定を行い、以下の

もっとみる

Clubhouseをやってみて思ったこと

今流行のClubhouseをやってみたので、思ったことを雑に書いてみる。

Clubhouseに関して知らない方は、上記の記事が詳しく解説されているので読んでみてほしい。

第一印象としては、現時点では有名人やインフルエンサー、またはそれらを目指している人がビジネスするための新しいフィールドになっているという事であった。SNSを活用したビジネスやマーケティングなどは、既存のものである程度確立してお

もっとみる

セルフマネジメントについて書いてみる

リモートワークでのセルフマネジメントの必要性
リモートワークになって、従来よりもセルフマネジメントが求められている。
職場に出勤すれば、上司や同僚がいて基本的に業務を行うのだが、リモートになると、出勤という概念もなく、そばに上司や同僚もいない。サボり放題である。「ベッドの誘惑に勝てない」とか「ついついサボってしまう」などの声もよく聞く。
上記以外にも、家にいることで、家事や育児など、仕事だけをして

もっとみる

【R】Amazon 商品レビューの抽出

前回は、RでAmazonの売れ筋ランキングから情報を取得する方法を紹介した。

今回は、その続きとして、任意の商品に関して、レビュー情報を取得する方法を紹介したい。

レビューの最初のページは、以下のようになっている。

https://amazon.co.jp/product-reviews/<商品識別番号>

商品識別番号は、書籍の場合は「ISBN」、それ以外は「ASIN」である。
https

もっとみる

【R】Amazon 売れ筋ランキングの情報を取得する

RでAmazonの売れ筋ランキングの情報を取得する方法を紹介する。

URLの構造URLは、以下のような構造になっているので、取得したいカテゴリを実際にアクセスして確認する。
1ページにつき50件となっており、50位以降を取得したい場合は、pgでページ数を指定する。

https://www.amazon.co.jp/gp/bestsellers/<カテゴリ>/?pg=<ページ>

例えば、本-ビ

もっとみる

【Amazonレビュー分析vol.1】売り筋ランキング[本-ビジネス・経済](2021-01-28)20位 嫌われる勇気―――自己啓発の源流「アドラー」の教え

売れている商品のレビューのコメントを見ることで、普段の生活では分からない、世の中の価値観や感覚を知ることが出来るのではないだろうか?

そんな事を思いついたので、不定期にAmazonの売れ筋ランキングから、レビューの多い商品をピックアップして、レビュー分析してみる事にした。
最初にやってみるジャンルは、「本/ビジネス・経済」。

Amazon 売り筋ランキング[本 - ビジネス・経済](2021-

もっとみる

雑談の大事さについて

コロナ禍でテレワークになって一年近くになる。
テレワークになって気付かされた事は多いが、その一つに雑談の大事さがある。

私は、ここ一年ほど、あまり成長出来てないと感じている。振り返ってみると、日常の雑談から刺激を受け、自分自身の考えを整理して昇華させ、それを実行に移すという事をやってきたように思う。
雑談という形で、細かくアウトプットしてフィードバックをもらい改善する、というPDCAを高速に回し

もっとみる

【R】YouTube「にじさんじ」ライブ配信アーカイブのチャットデータを可視化してみる

前回の続き。

配信全体でのチャットのコメントの傾向を見てみる取得したチャットのコメントをワードクラウドで可視化してみる。
まず、下準備としてチャットのコメントをファイルに保存する。

video_id <- res_live$items$id$videoId[1]write_lines(chat_df$comment, sprintf("%s.txt", video_id))

次に、{RMeC

もっとみる

【R】YouTube 「にじさんじ」のライブ配信のチャット(配信終了後)を取得してみる

「にじさんじ」は、ライブ配信を結構やってるので、配信の時のチャットの内容の抽出をしてみる。
結論からいうと、思ったより難しい。APIでサクッと取れると思ったのだが、終了した配信のチャット内容を得るAPIは存在しない。
仕方ないので、スクレイピングで抽出することにした。

前提前回の記事で作成した関数を使う。

「にじさんじ」のライブ配信した動画の取得
検索のAPIで、eventTypeで、検索対象

もっとみる

【R】YouTube Data APIを使って「にじさんじ」でランキングを作成してみる

前回は、YouTube Data APIを使って、にじさんじのデータを取得してみた。

今回は、視聴回数とレイティングでランキングを作成してみる。

準備APIキーなどをベタ打ちするのは良くないので、api_key.txtに保存し、それを読み込む処理に変更。

library(tidyverse)api_key <- read_lines("api_key.txt")keyword <- "にじさ

もっとみる

【R】YouTube Data APIを使って「にじさんじ」のデータを取得してみる

YouTubeは、実は様々なAPIを提供しており、結構いろんなデータ取れる。
例えば、こちら。

チャンネルや動画の情報や、検索結果を取得することが出来る。
今回は、このAPIを使ってデータを取得するところまでを紹介したい。

APIキーの取得まず最初に、APIキーというものを取得する必要がある。
取得していない方は、こちらを参考に取得して欲しい。

検索結果の取得APIキーが入手出来たら、あとは

もっとみる

【書評】分析者のためのデータ解釈学入門 第3章 データに含まれるバイアス

今回は、こちらの本の第3章について紹介する。
この章では、バイアスの種類とその発生原因について解説されている。

測定基準に起因するバイアスまず、1つ目のバイアスとして紹介されているのが、測定基準に起因するバイアス。定義が異なる場合と、基準が時間的に変化してしまう場合について解説されている。

定義が異なる例として、同じ「弁護士」という職業でも、諸外国では、日本で言う弁理士、税理士、司法書士、行政

もっとみる

【書評】億を稼ぐ勉強法

雑感全体的には良くある自己啓発本の内容ではあるが、著者の経験とそれによる成長が書かれているので、対象読者には刺激になる一冊だと思う。

そして、この本の対象読者は、私が思うに「過去の著者」だ。過去の自分(著者)に向けた指南書のようなもので、「なぜ成功しないのか?それは○○だからだ。こうすれば上手くいく」といった内容になっている。

では、過去の著者とはどんな人物か。本書で度々出てくるキーワードとし

もっとみる

上場企業のおかしなIRグラフについて

面白いものを発見したので紹介したい。

上場企業のIRグラフについて、分析者から見て変なグラフ、分かりにくいグラフを紹介しているようだ。
なんと、2015年から毎年やっている。

2015年2016年2017年2018年2019年

各企業の広報も、頑張って良く見せたり、悪い印象が出ないようにあえて分かりにくくしてたり等苦労しているんだろうなと想像してしまう。

ちなみに、グラフについては、やろう

もっとみる

【書評】徹底的に数字で考える。

全体的には良くあるビジネス書にあるような内容ではあるが、個人的に面白いなと思ったところを紹介したい。

仮説を立てられない人に足りないのは「ひとつに決める勇気」です。

原因と結果をそれぞれ1種類の数字で表現し、その2者を仮の因果関係として結び付ける。こうするとこで次にするアクションが1種類になり、実際に行動に移せます。

本書でも書かれてるが、こう言った話をすると、「世の中そんなに単純じゃない」

もっとみる