Raspberry Pi + Juliusで、音声認識→カレンダー登録QR用コード生成をやってみる 後編

作成編です。
何やかんやあって約一か月経ってしまいました。

* 使用ライブラリや遊んだ記録などは前編に記載しています(こちら)
ライブラリのインストール方法などは割愛します。

処理の流れ

1. RaspberryPi(マイク)に発声
2. モジュールモードで起動したJuliusで音声をテキスト化→TCPで送信
3. Node-REDで情報を受け、必要な情報が揃っていればiCalender形式

もっとみる

世界を音で変えよう

本日のゲームこちら

One Hand Clapping

現在、体験版ような形で配信されている「声」で道を作り進んでいくゲーム過去にも音声認識システムを使ったゲームはいくつかありました。

ぴかちゅうげんきでちゅう(N64)、シーマン(DC、PS2)、オペレーターズサイド(PS2)

ではこのOne Hand Clapping(ワンハンドクラッピング)はどこが違うのか?

これらの要素に「音

もっとみる

https://wired.jp/2019/05/21/google-made-truly-usable-voice-assistant/
オンデヴァイスのAIは、音声認識のゲームチェンジャーになるか

すごい技術だ。先日のリアルタイム翻訳(内部ではこのような技術も使用されているであろう)も含めて、一気に用途が広がり、スマホの次の携帯デバイスはこれではないかとさえ思う。

https://jp.techcrunch.com/2019/05/20/2019-05-15-googles-translatotron-converts-one-spoken-language-to-another-no-text-involved/
Googleが中間テキスト化不要の音声機械通訳の成果を発表

とうとう、全ての言語の翻訳機が出るかもしれない。これが完成したら、複数言語学習というコストが不要になり、また新しい段階に入るかもしれない。世界的にも大変重要な研究

Raspberry Pi + Juliusで、音声認識→カレンダー登録QR用コード生成をやってみる 前編

引き続きRaspberryPiでいろいろやってみます。

音声は昔からあるインターフェースですが、
音声アシスタントやスマートスピーカーの台頭により、
ここ数年で一気に使用頻度が上がったように感じます。
このあたりで一度触れておかないと完全に置いていかれそうなので、
遊びながら触っていこうと思います。
長くなったので2回に分けます。
今回は遊んだ記録を書いただけなので、こんなのあるんだー程度で

もっとみる

Halocodeの音声認識を実行することができた。

昨日のnoteでは、音声認識をオンラインのエディタで試し、うまくいきませんでした。。。

では、makeblockでおすすめしているmblock v5を使うとどうでしょうか?

できる!と期待していますが、まずは落ち着いてダウンロード。

mblockを導入する。

下記のサイトからダウンロードすることができます。

もしかしたら僕の回線の問題かもしれませんが、夜はダウンロードがめちゃくちゃ遅かっ

もっとみる
ありがとうございます!毎日続けるように、がんばります!
6

聞き違いへの適応

note184にちめ。

「不実施」が「富士市」、「新規性喪失」が「新規性創出」あたりもよくある。このあたりは、聞き違うも納得である。

「不使用」が「藤井様」はどのような聞き違いか、しばらくわけがわからなかった。“様”は“ヨウ”の“よう”である(……)。

よくある誤りや正解が容易に連想できる誤りの扱いにさいきんは慣れて、その場では放置しあとでまとめて直している。

音声認識されやすいように話し

もっとみる

2019-05-10 Alexa for Everywhere. #DevLOVE

2019/05/10 に開催された [DevLOVE Premium第4回] Alexa for Everywhere. のイベントレポートです。

●イベント概要
毎月、特別な企画をあなたにお届け。それが「DevLOVE Premium」
2019年。DevLOVEでは、毎月1回、あなたに特別な時間をお届けします。
「DevLOVE Premium」と題したこの企画、各回に1つの技術テーマを設け

もっとみる

障害者の「困った」をみんなの「よかった!」へ変える(電話)アイディペンデント通信Vol.57

電話をしていて相手の言葉を聞き逃してしまったり自分が何を話したのか忘れてしまったりすることはないでしょうか。
これは耳が遠くなったシニア層や難聴の方にはさらに大きな問題です。

この問題を解決しようとNTTドコモが電話の声を視覚化してくれるアプリをリリースしています。
「みえる電話」です。

通話相手の言葉をリアルタイムで文字に変換し、スマートフォン画面に表示してくれます。

話したい内容を文字入

もっとみる

インタビューを自動で文字起こししてくれる環境ができそうでできない

インタビューする際、録音はしても文字起こしはしないんですけど、発言内容の確認・検索はしたいので、テキストデータはほしいっす。
そういうときに便利そうなのが、Googleの音声認識システム「Cloud Speech-to-Text」です。

これ使えば高い精度で自動文字起こしをしてくれそうなんですが、使えるようにするまでがだるいっぽいんですよね。この技術、もしくはこれに近しい技術を使ってるサービス・

もっとみる