見出し画像

Whisper jaxとChatGPTを使ってYouTube動画のサマリーを自動生成してみた

解決したいこと

こんなことはないでしょうか?

  • 人におすすめしたい動画を見つけたが、どんな内容なのか端的に伝えることが難しい

  • せっかく動画コンテンツを作ったのに、その動画を宣伝するには、動画を作った人が内容を表現するか、第三者が動画の内容を見て文章を考えなければならない

AIを使って、解決を試みました。


出来上がるもののイメージ

事例として、2023年6月5日にYouTubeに公開された、Weekly Ochiaiの「先﨑彰容x落合陽一「分断時代」と日本の尊厳」動画のサマリーを作ってみました。

サマリー

この動画は、三島由紀夫、萩原朔太郎、そして伊藤詳の著作を参照し、個人主義、自然の役割、経済変化の影響、国民性の進化などのテーマを探求しながら、日本とアメリカの社会と文化について幅広い哲学的な考察を含んでいます。また、米国、中国、ロシア、インド、ブラジルなどの異なる国々の権力関係を検討し、彼らがグローバルな事象に与える影響についても考えています。

こんな内容です

  • 日本社会は、西洋化を追求するうちに、本来の本質を失い、アイデンティティーの危機に陥っているという批判がある。

  • アメリカの個人主義は、独立した独自の宗教的な風土に根ざし、自然との関係が深く、確信と自信の源として描かれている。

  • アメリカは、真の民主主義と新自由主義的な経済モデルに危機に直面しており、日本に適用された場合、若者にとって夢のない困難な社会を生み出している。

  • 個人主義の概念は、しばしば称賛されるが、上位の力やコミュニティーの指導なしに意思決定をしなければならない場合に不安や不確実性をもたらすことがある。

  • 特にコンピューターを日本の文化教育に統合することで、キャラクタービジネスやゲーム産業の成功に見られるように、古典的な思考や文化の深さとの新しいつながりを提供することができる。


具体的な手順

Whisper jaxを使って、YouTubeの音声を文字起こしする


Whisper jaxとは

  • Whisper jaxは、OpenAIの作った音声解析AIであるWhisperを使って、Web上で簡単に動画または音声の文字起こしができるwebアプリケーションです

  • Hugging Faceというプラットフォーム(AI版のGithubみたいなもの)が、高速な計算リソースを提供して、誰でも無償で利用できるようになっています

  • ただし、一度に利用できる人数が限られているため、込み合ているときはアクセスできなかったり、正しく処理が終わらなかったりします。エラーが起きたら、時間をおいて再度アクセスしてみましょう


元の動画の動画のURLを準備する

今回使った動画は、先述の通り、Weekly Ochiaiの動画です。

https://www.youtube.com/watch?v=nIzojlmrytE


Whisper jaxで文字起こしを生成する

  • https://huggingface.co/spaces/sanchit-gandhi/whisper-jax にアクセスします

  • 左上のタブで「YouTube」を選びます

  • URLの欄にYouTubeのURLを貼り付けます

  • 「transcribe」にチェックを入れます

  • (任意)「Return timestamps」にチェックを入れると、文字起こしにタイムスタンプが付与されます(下記の画像)

  • 「送信」を押してしばらく待つと、テキストが出力されます

ChatGPTで扱えるようにテキストを加工する

今回使った動画は、30分ほどあり、長大なテキストが出力されました。
そのままChatGPTで要約しようとすると、文字数が多すぎてえエラーになってしまいます。

そこで、出力された日本語のテキストを、一度英語に翻訳します。

日本語は、ChatGPT上では1文字あたり1トークン以上を消費しますが、英語は1単語あたり1トークン〜として扱われるため、日本語よりも多くの文字数を扱うことができます。

今回は、Google翻訳を使いました。
出力が複数ページにわたってしまいましたが、気にしなくて大丈夫です。


ChatGPTで要約を生成する

下記のプロンプトを用いて、要約を生成しました。

# Instructions

- Please interpret the following material abstractly and summarize it without compromising important context.
- The output should be in markdown format and include the following:
    - Summary: Please generate a summary in as short a sentence as possible.
    - List up to five new opinions that can be obtained, summarized in as short a sentence as possible and listed in bullet points.

# Material

(ここに、先ほど英訳したテキストを貼り付ける)

ChatGPTが、サマリーを出力してくれました。
(今回は、文字数が多いため、GPT-4 defaultを使っています)

日本語訳してみます。


要約

この資料は、三島由紀夫、萩原朔太郎、そして伊藤詳の著作を参照し、個人主義、自然の役割、経済変化の影響、国民性の進化などのテーマを探求しながら、日本とアメリカの社会と文化について幅広い哲学的な考察を含んでいます。また、米国、中国、ロシア、インド、ブラジルなどの異なる国々の権力関係を検討し、彼らがグローバルな事象に与える影響についても考えています。

新しい意見

  • 本社会は、西洋化を追求するうちに、本来の本質を失い、アイデンティティーの危機に陥っているという批判がある。

  • アメリカの個人主義は、独立した独自の宗教的な風土に根ざし、自然との関係が深く、確信と自信の源として描かれている。

  • アメリカは、真の民主主義と新自由主義的な経済モデルに危機に直面しており、日本に適用された場合、若者にとって夢のない困難な社会を生み出している。

  • 個人主義の概念は、しばしば称賛されるが、上位の力やコミュニティーの指導なしに意思決定をしなければならない場合に不安や不確実性をもたらすことがある。

  • 特にコンピューターを日本の文化教育に統合することで、キャラクタービジネスやゲーム産業の成功に見られるように、古典的な思考や文化の深さとの新しいつながりを提供することができる。


これを少し修正したのが、冒頭で紹介した「出来上がるもののイメージ」です。


ヘッダー画像

ヘッダー画像は、ChatGPTが出力した、英文の要約をプロンプトとして、Midjourneyで出力しました。

The material consists of a wide-ranging philosophical reflection about Japanese and American society and culture, referencing works of Yukio Mishima, Taro Hagiwara, and Shizo Ito, and exploring themes such as individualism, the role of nature, the impact of economic change, and the evolution of national identities. It also considers geopolitical implications, examining the power dynamics of different countries, such as the U.S., China, Russia, India, and Brazil, and their influence on global affairs. --ar 16:9 --niji 5 --style scenic


Reference

sanchit-gandhi/whisper-jax

Introducing ChatGPT

【落合陽一】成長できず、夢のない「若い人に“しんどい社会”を作ってしまった」「個人主義は肯定的な意味だけでない」日本思想史の先﨑彰…


関連記事

テクノロジーとイマジネーションを融合させる、マンガ制作ためのAIアプリケーションの活用のアイデア

ChatGPT実務活用のアイデア:知らない分野を短時間で概観する


以上

この記事が気に入ったらサポートをしてみませんか?