矢崎 裕一

データ可視化の実践と普及に関する様々な活動をおこなっている。 デザイン科学修士(工学)…

矢崎 裕一

データ可視化の実践と普及に関する様々な活動をおこなっている。 デザイン科学修士(工学) デジタルハリウッド大学大学院 特任准教授/多摩美術大学 情報デザイン学科 非常勤講師/武蔵野美術大学 非常勤講師 共著書「RESASの教科書」 データ・ビジュアライゼーション・ジャパン 発起人

マガジン

  • データサイエンス

    データサイエンスの教育におけるアレコレ

  • 書評

  • レビュー

    書籍以外の映像などのレビューをまとめたマガジンです。

  • COVID-19

  • データ可視化原論

最近の記事

データ分析の科学としてのデータサイエンスの始まり

John Tukey は 1962 年に "The Future of Data Analysis" という論文を発表し、当時の統計学のアプローチを大きく批判しました。主な主張は以下の通りです。 自分は長らく統計学者だと思ってきたが、数理統計学の発展を見るにつれ、疑問を感じるようになった。 自分の中心的な関心事は、データ分析であり、それは数理統計学が適用されるデータを分析する手順、その手順の結果を解釈する技術、データ収集の計画などを含む、より広範なものである。 データ分

    • すがけんさんへ事業相談できる機会

      すがけんさんといえば、アドテクやブランド広告責任者、BtoBマーケティング責任者などのご経験と、なんといっても現在の「企業の10倍成⻑を支援する」ことを目指すMoonshotという打ち出しにすごくインパクトがあり、ご著書も拝読していたので、いつかお会いしたい方でした。 本来機会がなかなか得られないところ、貪欲な好奇心からだと思いますが、無料で相談に乗っていただけるということで、先日、六本木のカフェで、相談させていただきました!これまで誰からも頂いたことのないようなアドバイス

      • 「データ分析に必須の知識・考え方 認知バイアス入門 分析の全工程に発生するバイアス その背景・対処法まで完全網羅」

        山田典一さん著の「認知バイアス入門」を紹介します。下記の図が書籍の目次からなるダイアグラムです。書籍の全体構成を俯瞰することができます。 「データ分析に必須の知識・考え方 認知バイアス入門 分析の全工程に発生するバイアス その背景・対処法まで完全網羅」 第1章 分析者にとっての認知バイアス―複雑な世界と繋がり続けるための認知の癖を知る1.1 分析者にとっての認知バイアス 1.2 認知の働きを理解する 1.3 認知バイアスの起源を知る 1.4 各種バイアスの起源と特徴を知る

        • クイックスタート・ファイルをもとに、ChatGPTプラグイン機能の概要を調べる

          この記事に書いてあることChatGPTのプラグインがどのように機能しているかを、公式で用意されたクイックスタート・ファイルをもとに探っていきます。 実際に動作させるまでの手順と、機能の利用、わかったことを紹介します。 クイックスタート・ファイル ChatGPT plugins quickstart として用意されているのは、簡易To Doアプリです。 このチュートリアル・ファイルは、まずは概要を理解する目的で簡易な機能を持つものとして、作成されています。 どこかのA

        データ分析の科学としてのデータサイエンスの始まり

        • すがけんさんへ事業相談できる機会

        • 「データ分析に必須の知識・考え方 認知バイアス入門 分析の全工程に発生するバイアス その背景・対処法まで完全網羅」

        • クイックスタート・ファイルをもとに、ChatGPTプラグイン機能の概要を調べる

        マガジン

        • データサイエンス
          1本
        • 書評
          4本
        • レビュー
          2本
        • COVID-19
          16本
        • データ可視化原論
          4本
        • つれづれなるまま
          7本

        記事

          多摩美大・可視化表現演習 授業概要(2018〜2022年)

          可視化表現演習では、演習科目としてデータを可視化することを通じて作品作りに取り組みます。「データ」を現実の現象を切り取るためのメディアと捉え、コモディティ化したメディアとしての写真や動画が捉えることのできる光景や音声以外の、ときには直接目で見ることのできない現象について、それらを捕まえ、表現に変換します。そこにはデータとして残存する現象以外の要素をでっちあげてはいけない客観性と、作家として主張したい主観性の同居が求められる難しさがあります。インフォグラフィックとの違いとしては

          多摩美大・可視化表現演習 授業概要(2018〜2022年)

          ハッカーズチャンプル登壇

          沖縄のエンジニアの子たちに社会をハックする考え方を伝えたくて、検索してそんな場がないか調べた結果、年に一度開催されているハッカーズチャンプルを見つけアプライし採択いただき、こんな内容の講演を40分の駆け足で行なってきました。 ・データビジュアライゼーション事例紹介 ・データから価値を如何につくるか「データは、解きほぐして、かけ算すると、価値がでる」 ・RESASでゲームのように地域の課題を抽出する ・プレイパークのような行政サービスの作られ方 ・課題先進地域がその課題に取り

          ハッカーズチャンプル登壇

          ITリテラシー? 好奇心の問題では?

          マクドナルドで店内着席した状態で、アプリで注文と決済を行い、店員さんが席まで運んできてくれるモバイルオーダーサービス、めちゃ便利なので知ってからは毎回使ってますが、 数回の同一店舗での観測ですが、見てると30人に2人ぐらいしか使っておらず、あとは並んで注文しているようです。 こうやってデカデカと看板が立っているので、お店としても利用を促進したいはず。 結局これって、まずは周りを観察しているかだし、そのうえで未知なものに関心を持って知ろうとするかだし、未体験なことが起こっ

          ITリテラシー? 好奇心の問題では?

          生産技術の可視化と継承

          日本と海外(ポーランド)でのスーツケースの生産現場の映像を2つ視聴して、生産技術の可視化と継承について考察した。 日本で唯一のスーツケース生産工場である、エースラゲージ北海道・赤平工場にて、日本製スーツケース、プロテカが生産される様子 Profim(ポーランドにある、ヨーロッパの市場でオフィスの座席の製造メーカー) https://www.profim.eu/ 二つの動画、公開時期がほぼ同一であり、日本と海外(ポーランド)の比較という視点で見ざるをえない。二十年以上GD

          生産技術の可視化と継承

          インフォグラフィックが主観的で、データビジュアライゼーションが客観的?

          (2016年10月に書いたものです) インフォグラフィックが主観的で、データビジュアライゼーションが客観的だというのを見かけたので、、 センサーでデータを取得する際の選定されるセンサーのスペックや設置場所にも主観の入り込む余地はある(例えばガイガーカウンター)し、データの集計にも主観が入り込む余地がある。主観が入り込んだそれらのデータを使っている限り、データ可視化の段階でどんなに頑張っても主観的であることから逃れることはできない。 データ可視化する際も、たとえば年度の幅

          インフォグラフィックが主観的で、データビジュアライゼーションが客観的?

          Pythonで動かして学ぶ自然言語処理入門

          Pythonで動かして学ぶ自然言語処理入門 短めにご紹介Pythonというプログラム言語を用いて、自然言語(テキストデータ)を取得し、データベースへ保存し、Webアプリケーションとして検索できるようにするところまでの手順が記載されており、解析手法としては形態素解析、アノテーション、単語の重要度評価、文書の類似度評価、クラスタリング、同義語・上位語の取得、テキスト分類、特徴量抽出などもりだくさん! Amazonレビューで散見されたややネガティブなコメントが、この「データ

          Pythonで動かして学ぶ自然言語処理入門

          「絵文字 知られざる舞台裏」

          BS世界のドキュメンタリーにて、「絵文字 知られざる舞台裏」というドキュメンタリーが放送されました。私はAmazon Primeビデオで視聴しました(エピソード64です)。 Unicodeという国際標準化団体が絵文字の決定をとりまとめており、決定プロセスには、ベンダーのGoogle/Apple/Microsoft/Facebook/Twitterも審査に加わっている現状が映像で紹介されていました。 ドキュメンタリーでは、英語以上に広く世界中で使用される絵文字に、どんな事柄

          「絵文字 知られざる舞台裏」

          Pythonを使ってPDFからテキスト抽出するには?

          そもそもそのPDFはテキスト抽出に耐えうるものか?一口にPDFといっても様々な経歴を辿って、そのPDFファイルの姿をしています。まずはそもそもPythonでデータ抽出できるPDFなのかどうかを見極めましょう。 スキャンした画像をPDF化したファイルからテキストを抽出したい...まずはOCRソフトウェアを利用しましょう。OCRを利用したあと、そのテキストを抽出する際、Pythonを利用できると思います。 表が含まれていて、テキストというよりは表データとして抽出したい...T

          Pythonを使ってPDFからテキスト抽出するには?

          退屈なことはPythonにやらせよう ―ノンプログラマーにもできる自動化処理プログラミング

          筆者が購入したタイミングでは帯に「おかげさまで7万部突破!」とあり、売れているようです。「ホワイトカラー業務の効率化・自動化に...」とある通り、業務の効率化・自動化のために購入される方が多いのでしょう。 とはいえ、いつものオライリーの書籍のエディトリアルデザインであり、書籍の構成自体もエンジニアライクなもので、どの順番で読めばいいかなど、初学者であればあるほど悩むことが容易に想像できます。まともに最初から順番に読んでいっても挫折してしまいそうです。 実際の作業も、インタ

          退屈なことはPythonにやらせよう ―ノンプログラマーにもできる自動化処理プログラミング

          プレトタイプとしてのタモリさん〜Google×スタンフォード NO FLOP! 失敗できない人の失敗しない技術

          どんな書籍か「Google×スタンフォード NO FLOP! 失敗できない人の失敗しない技術」これは、新しいサービスや製品を作ろうとする際に、そのアイデアが本当にニーズのあるものなのか、市場調査ではなく自分で「プレトタイプ」(著者の造語)を数字を使って確かめてみようと説く書籍です。 実際に役に立ちそうな事例と考え方が満載です。翻訳書でリーン開発・スタートアップ系の書籍がいくつかあると思うのですが、間違いなくオススメしたい一冊です。ページ数多いですが、読みやすいのであっという

          プレトタイプとしてのタモリさん〜Google×スタンフォード NO FLOP! 失敗できない人の失敗しない技術

          【不定期更新】COVID-19 に関する用語

          自分用のメモも兼ねて、COVID-19 に関する用語をまとめていきます。 致死率/致命率...The Case Fatality Rate (CFR) 致死率/致命率 = この病気での死亡者数 / この病気と診断された人。ポイントは以下の通り。 ・母数が総症例数ではなく、医療機関で陽性と診断された人であること。医療機関で陽性と判断されていない発症者を含んでいない。 ・この確率は、病気そのものだけでなく、受ける治療法や患者自身の回復能力にも依存している。 ・母数が医療

          【不定期更新】COVID-19 に関する用語

          新型コロナウイルスの感染者数の増減を片対数グラフで表す理由

          新型コロナウイルス関連で、毎日数値がアップデートされ、様々なチャート、ダッシュボードが登場しています。ここでは、時系列の感染者数の推移を示すことで何を知りたいのか、という観点で、チャート表現を整理しました。 目次 ・片対数スケール + 時系列にて、新規症例数の指数関数的変化を知りたい ・両対数スケールにて、確定症例数の指数関数的変化を知りたい ・線形スケールのエリアチャートにて、感染者とその内訳(治癒者、死者、治療中etc)の推移を知りたい ・ダッシュボードで何を伝えるべ

          新型コロナウイルスの感染者数の増減を片対数グラフで表す理由