田村一起/(株)voiceware CEO

株式会社voicewareのCEOです!声質変換を中心に音声×AIの研究・開発をしてい…

田村一起/(株)voiceware CEO

株式会社voicewareのCEOです!声質変換を中心に音声×AIの研究・開発をしています。好きな声を選べる世界の実現に向けて日々活動中!

最近の記事

  • 固定された記事

声質変換サービス『One's Voice(α版)』を公開しました!

かなり久しぶりの更新となってしまいました・・・! で、更新ができていなかった間、どうしていたかというと、 自社サービスの開発に勤しんでおりました。 その甲斐もあり、ようやくサービスのα版公開できました!! サービス名は、『One's Voice』 当社のサービスということは当然、声質変換のサービスです。 折角なので、特長やα版の使い方を紹介したいと思います。 声質変換とは?まずは、声質変換って何?という方のために、簡単に説明すると、 「話す内容はそのままに声質のみを

    • 音声クローニング(音声クローン技術)とは?

      音声クローニングとは何か?ここ数年、「音声クローニング」という言葉をたびたび聞くようになりました。 音声クローニングとは一体何なのかと言うと、音声のクローン技術。つまり、特定の人の声を複製する技術のことです。 クローン技術と聞くと、「危険なもの」「未来の技術」という風に考える方もいるかと思いますが、音声クローニングは別に遺伝子を弄っているわけではなく、その実は音声合成技術(Speech Synthesis)のことで、既に広く使われている技術です。 音声合成とは簡単に言う

      • 声を再現する技術 〜音声合成と声質変換の違い〜

        声を再現するというニーズ最近は、声を再現したいという相談も増えてきました。 おそらく以前からニーズはあったと思うのですが、技術の発展によっていろんな場で活用・議論されるようになり、多くの方の目に止まるようになってきたのではないかと思います。 声の再現といっても、どういった場面で利用されるのかピンとこない方もいるかもしれませんが、代表的な例だと以下のようなケースです。 ・亡くなった方の声でライブをしたい ・亡くなった家族の声を聞きたい ・声を失った方が自分の声を取り戻した

        • 声もライセンス化されるようになる

          voicewareも創業から3年が経ちました。 改めて創業時の事業計画を見直してみると、まだまだ想い描いていた世界の実現には程遠いなと。 ただ、完全に見切り発車でスタートした当初から比べると、かなり形になってきているので、さらに加速度的に前進していきます! さて、今回は声の権利について書いてみました。 声を作る技術以前の記事でも書きましたが、voicewareで取り組んでいる声質変換技術によって声優の働き方が大きく変わってくる可能性があります。 https://note

        • 固定された記事

        声質変換サービス『One's Voice(α版)』を公開しました!

          AIで故人を再現できるようになる未来

          AI技術の発達によって、映画やアニメのように故人を再現することが可能になってきました。 弊社でも、失った声を再現できるサービスを提供しようとしています。 しかし、AIで故人を再現するとなると様々な課題が存在します。 そのような課題について少し考察してみました。 これまでの実例映像技術については、以前からテレビ等様々な場面で利用されてきたので馴染みが深いかもしれません。 しかし、今では人格でさえもコピーすることが可能となっています。 『Replika』というアプリでは

          AIで故人を再現できるようになる未来

          声を失った人はどうやって発声しているのか?

          先日、One's Voice というサービスを公開しました。 https://onesvoice-vw.com/ 声質変換技術を使って、失った声を再現できるようにするというサービスです。 利用用途の一つとして、喉頭癌等によって声帯を摘出した方が、元々の自分の声で喋れるようにするということを考えています。 声帯摘出というと、つんく♂さんを思い浮かべる人が多いかもしれませんね。 声帯を摘出すると、それまでと同じように声を出すことができなくなります。 では、声帯を摘出した方は

          声を失った人はどうやって発声しているのか?

          声質変換で声優という職業はどう変わる?

          以前、音声合成技術に着目して以下のようなブログを書きましたが、今回は声質変換技術について纏めてみます。 声質変換技術の紹介をした際に、「声優の仕事がなくなるのでは?」という質問をいただくことがあります。 たしかに、どんな声でも出せるようになると、声優は優れた技術をもった少数のみで良いのではないかという考えもあります。 しかし、私の見解としては、NOです。 実際、もう既に声優の仕事は、単にアニメや映画のアフレコのみではなくなっていて、イベントやTV・ラジオ番組等に出演す

          声質変換で声優という職業はどう変わる?

          これから爆増するであろう声質変換を使ったサービス。自分に合ったサービスの見分け方とは?

          声質変換を使ったサービスも徐々に増えてきました。 声質変換って何?という方は、こちらのブログをご参照ください。 技術が進歩して参入障壁が下がってくるにつれて、これから益々盛んになってくることは間違いないと思います。 そんな声質変換サービスですが、自分に合ったサービスはどうやって見分ければ良いのでしょうか? ポイントとなる観点を解説していきたいと思います。 そもそもどういう流れで声が変換されるのか?声質変換は機械学習を利用して行うため、大まかに、 1. 変換モデル作成

          これから爆増するであろう声質変換を使ったサービス。自分に合ったサービスの見分け方とは?

          デバイスを身体に埋め込む時代も近い? トランスヒューマニズムの現状

          いつもは音声関連や会社のことについて書いていますが、今回は僕が興味をもったことについて。 先日、手にマイクロチップを埋め込んでいる方と出逢い、こういった価値観が当たり前になってくるんだろうなぁと思い、少し調べてみました。 トランスヒューマニズムとは?新しい科学技術を用い、人間の身体と認知能力を進化させ、人間の状況を前例の無い形で向上させようという思想である。省略して>HやH+と書かれる場合もある。日本語では「超人間主義」などと訳される。 出典:https://ja.wik

          デバイスを身体に埋め込む時代も近い? トランスヒューマニズムの現状

          音声認識ってそもそも何?オススメの活用法と今後の変化まで!

          今回は音声技術の中でも、「音声認識」について取り上げたいと思います。 音声認識とは?最近は、テクノロジーに明るくない人にでも音声認識という言葉は当たり前のように使われるようになってきました。 ご存知の通り、音声認識とは、人の話した音声を文字に変換する機能のことです。Speech to Textとも呼ばれます。広義では、誰が話しているのか、その話者を特定する機能のことも指すそうです。 今回は、Speech to Textについて書いていきます。 さて、音声認識というとど

          音声認識ってそもそも何?オススメの活用法と今後の変化まで!

          なぜ今、音声ビジネスなのか?

          ここ1、2年くらいで音声ビジネスの話をよく聞くようになってきました。 自分自身が音声業界に携わっているということもあるとは思いますが、それでもNewsPicksでも特集が組まれたり、音声に特化したイベントが開催されたりと注目度は上がっている気がします。 特に音声メディアは急速に普及しているように思います。 テレビから動画に移り変わりつつあるように、ラジオから音声メディアに変わるのも当然の流れかと思います。 これからは、受動的に情報を得るのではなく、能動的に情報を選択する

          なぜ今、音声ビジネスなのか?

          起業して変わったこと

          会社ブログでも書きましたが、起業して2年が経ちました。 あっという間だったような、すごく長かったような。 とにかく濃い時間だったのは確かです。 創業当時に比べて、声質変換技術を取り巻く状況も大きく変わりました。 2年前は、声質変換に取り組んでいる会社はほとんどありませんでしたが、ここ最近はかなり増えてきました。 社会的な認知度も上がっているように思います。 技術が向上して、実用化が見えてきたことが大きいですね。 株式会社voicewareとしても、準備期間を経て、ここか

          起業して変わったこと

          増えるAIアナウンサー。AIに代替される仕事とは?

          別のブログでは何回か取り上げましたが、AIアナウンサーが増えているのはご存知でしょうか? 最近は、テレビでもAIアナウンサーをしばしば見るようになりました。 ナレーションを音声合成でやっていることもよくありますね。 中国では、かなりリアルなAIアナウンサーも存在しています。 参考動画) https://www.youtube.com/watch?v=8DqSzQcjWtE 若干の違和感はあるものの非常にクオリティが高くて、まるで本物のキャスターのようですよね。 感情

          増えるAIアナウンサー。AIに代替される仕事とは?

          音声から得られる情報って何がある?

          株式会社voicewareでは、声質変換技術を専門に取り扱っていますが、音声×AIの専門家ということで、しばしば音声分析の依頼をいただくことがあります。 それでは、音声を分析してどのような情報が得られるのでしょうか? よく挙げられるのは、感情と話者ですね。 実際にビジネスに利用されているケースも多いです。 感情分析って何に使えるの?という意見もよく聞きますが、意外とニーズは多いんですよ。 コールセンターのように音声のみでコミュニケーションをする状況では、感情を読み取る

          音声から得られる情報って何がある?

          Voice UIについて考えてみる

          Voice User Interface(音声インターフェース:以下、VUI)という言葉、まだまだ馴染みがない方が多いかと思います。 音声に関連する事業を取り扱っている身としては、もっとVUIに普及して欲しいところですね。 VUIとは、音声によって、様々なモノを操作したり、あるいは音声で情報を得たりすることです。 スマートスピーカーをイメージしていただけると一番わかり易いと思います。 例えば、 「Alexa、テレビをつけて。」 「OK Google、〇〇について教えて

          Voice UIについて考えてみる

          Oculus QuestでソーシャルVRを体験!!

          5/21にOculus Questが発売されましたね! 早速使ってみなければということで即購入! 声質変換とVRはかなり相性が良いんですが、実はVRのデバイスは今まで持っていませんでした。 Oculus Questを使ってみて感動しましたね! 没入感が半端なくて、ずっと仮想空間上に居られるなと思いました。 このクオリティが約5万円で買えるなんて、すごい時代になってきたなと思います。 Oculus Questの特徴は、何と言ってもスタンドアロン型で6DoF (6 De

          Oculus QuestでソーシャルVRを体験!!