テキストマイニング

2019年10月22日(火)は祝日! withテキストマイニング

タイトルで完結していますが、なんと今年の10月22日は祝日です。皆様ご存知でした?私はさっき知りました。

先ほどサイボウズをぼんやり見ていたところ、謎の赤字が出てきました。

\\\ 10/22 即位礼正殿の儀 ///

全く聞き覚えがありません。とりあえずサイボウズがそう言うので祝日なんでしょう。響き的に天皇関係っぽいですが、令和に変わって半年近くたつのに今更なんだろうって感じです。

即位礼

もっとみる

pythonの参考書を買う時に注意すべき4つの基準【3時間厳選2冊/41歳チャラいおじさんに最適とほぼ断言】

こんにちは。薬師神です。

薬師神の自己紹介:断捨離ブームに乗り断捨離していくうちに髪型の分け目の断捨離に成功。「つむじ中心の髪型」という情報革命時代に相応しい髪型を体現する41歳のチャラいおじさん。会社もやっているようなのですが、最近pythonを学びはじめお勉強日記をnoteに綴っている。2020年以降流行間違い無しの斬新な髪型が気になる方はTwitterをチェックしてみると、もしかすると良い

もっとみる

テキストマイニング|言語データから掘り起こされる見えざる深層

連日、吉本興業の問題がメディアを賑わせていますね。当初は反社勢力との関係が論点でしたが、今では吉本興業の企業体質の問題にすり替わった感があります。松本人志さんや加藤浩次さんが自らの進退を賭して世間に訴えたように、所属芸人さんは不当な圧力で会社に拘束されているようです。

ただ、労働者の地位向上を求めるならば、労働組合を結成して会社に団体交渉を申し入れるのが筋ですよね。しかし、どういうわけか「会社を

もっとみる

女性向けAVと男性向けAVの違いを、AV研究者・Python初心者がテキストマイニングで分析する

まえがき

私の所属ゼミで、今学期はPythonを使ったテキストマイニングの実習が行われています。

『Pythonによるテキストマイニング入門』に書かれている内容を実践していく……という内容で、私が報告を担当することになったのは、5.3節「語の重要性とTF-IDF分析」と5.4節「KWICによる検索」。
しかし、教科書に書いてあるとおりに、「問い」もなく青空文庫の小説を分析しても、正直言ってあま

もっとみる
ありがとうございます!よろしければシェアもお願いします
51

「お客様の声を聞くアンケート」の分析、どうせならデコムに発注して下さい!

今回のnoteは比較的ポジショントークが強めです。苦手な人は、そのまま前のページに戻るか、このページを表示するタブを消して下さい。

「お客様の声」って大事ですよね。

CoCo壱番屋の社長は1日をアンケートで始まり、アンケートで終えるそうです。だからでしょうか、特にチェーン系飲食店に足を運ぶと、必ず「お客様の声をお聞かせ下さい」というアンケートはがきが置かれています。

お客様の声を聞いているの

もっとみる

備忘録:Python書いたことない人がcolaboratory使ってみてコケた話

colaboratory使ってテキストマイニングしようとして、⇩をやろうとしたらハマったアホほど初歩的なところ。

120%自分用のメモだよ

データの読み込みはちょっと面倒くさい

データよみこむのに、いきなりpd.read_csvつかったらこけた。

いっかいファイルをアップしないといけないらしい。

from google.colab import filesuploaded = files

もっとみる

【ビジネスマン必読書『君主論』全文を統計解析してみました】第8回:読解のキーパーソンとして出現頻度一位の「この人」の生き方を追おう!

前回の記事で、『君主論』全文中の登場頻度1位~4位の顔ぶれについての考察を行いました。

今回からはその続きとして、1位・2位を独占した「ボルジア親子」、3位のルイ12世に代表される「フランス王家」、4位の「教皇ユリウス2世」それぞれのキャラクターとポジションを詳細に見ていくことにします。

というのも、この四人の力関係がわかると、『君主論』におけるマキャベリの人物評価のスタンスもわかり、かつ、当

もっとみる

【ビジネスマン必読書『君主論』全文を統計解析してみました】第7回:出現頻度から読解のカギとなる人物を考察

世界的古典のウンチクを語れる知性派オトナになりたい人の為のデータ分析と題して、マキャベリの名著『君主論』の全文を解析していくこのシリーズ、前回までの試行錯誤の末、

ついにイタリア語原版から登場人物を出現頻度で一覧抽出するところまでたどりつきました。

今回は、そのリストを見ながら、いろいろ考察をしていきましょう。

出現頻度1位は予想通りのあの人、ただし2位以下が興味深い

もっとみる

【ビジネスマン必読書『君主論』全文を統計解析してみました】第6回:いよいよ結果公開!君主論内で言及されている「全人物名」を出現頻度順にリスト化!

前回の記事で紹介した工程を経て、ロウデータの中の表記ゆれをすべて修正完了しました。

・『君主論』作中でヴァレンティノ公と呼ばれている人物はすべて「チェーザレ・ボルジア」とみなし、

・「アレッサンドロ」と呼ばれている人名はすべて「教皇アレクサンデル」「アレクサンドロス大王」「ローマ皇帝アレクサンデル・セヴェロス」のいずれかに振り分け

・「フランス王」と呼ばれている人物はシャルル8世、ルイ12世

もっとみる

【ビジネスマン必読書『君主論』全文を統計解析してみました】第5回:外国語マニアの腕が鳴る工程!素材データをクレンジングしていきましょう!

※第4回と第5回では、今回のデータ分析に使用したソフト、使用したロウデータの収集方法の詳細を説明しています。分析の細かい手法に興味がなく早く結果を知りたい方は一足飛びに第6回に進んでいただいて構いません

※また本記事は2019年6月18日時点での情報となります。使用ソフトのバージョンやリンク先存在確認はあくまで執筆時点での最新情報となりますのでご了承ください

前回の記事で、イタリア語原版の『君

もっとみる