記事一覧
Whisper、ChatGPTを活用した、テキスト入力不要な新感覚メモ日記アプリの紹介と、開発における学び
日常生活の中で生まれた「できごと」や「思ったこと」を、楽しく記録できるメモ日記アプリを開発しました!
しゃべったら、あとは丸投げして良い感じにメモを残してくれる「シャべマル」です!(笑)
シャべマルの紹介具体的には、、
音声入力でメモ内容を作成。かなり高精度な音声認識モデル(Whisper)を用いているので、想像以上にちゃんと文字起こししてくれます!
「今日あったこと」など、日記として利用
にょすです。生成AIなんでも展示会に出展します!
4/21(日)本日、こちらのイベントに出展者として参加してきます!
気合を入れてチラシも作りました!💪
僕は「技術を日常生活の中に溶け込むような体験に落とし込むこと」にハマっており、そのコンセプトを主軸に制作活動をしてきました。今日の展示会ではそれらを展示しようと思っています!
シャべマル:しゃべって丸投げメモアプリ「メモを取るという体験をもっと楽しく、もっと便利にできないか?」そんな思い
Gemini 1.5 Proで文字起こしを試してみた
Gemini 1.5 Proが音声ファイルにも対応したということで、Whisper大好きマンとして、どれほどのものなのかを簡単に調査したいと思います。
利用の仕方Vertex AIから利用ができました。Google AI Studioからも利用できるようです。詳細はこちら。
また今回検証する音声は以下のエネルギーに関する部分を利用します。
さっそく文字起こしを試してみるプロンプトによって出力
音声合成モデルStyle-Bert-VITS2をサーバレスアーキテクチャでWeb API化する
夢が詰まっているこちらのリポジトリを、Web APIとして立てて動かすための解説記事です。
この解説記事を書くにあたって、以下の記事を大変参考にしました。ありがとうございます!ただバージョンの違いがあったのか、これだけでは動かなかったため、補足という形で本記事は情報を補うものとしています。
概要サーバレスで動かすにあたって、今回はRunPod.ioを利用します。こちらでリクエストが来たタイミン
推しのプロンプト実験管理ツール「promptfoo」を解説
最近、推したいプロンプト実験管理方法を見つけたので、そちらの紹介記事になります!これを見つけてから、めちゃ楽になりました!
前提「ん?実験管理?」と思う方もいるかもなので、軽く背景のところから共有したいのですが、システムに組み込むプロンプト作りは、すごい難易度が高いなーと思ってます。
何が大変かというと、求められる品質が高いからです!
出力形式が期待通りでないとシステムエラーになってしまう。
生成AIによって「既存の仕事は代替されるが、新しい仕事が生まれる」ということに対して
ここについて色々なレポートや本などを読みながら、思考を整理しています。
情報量が膨大な中で、また様々な意見があり、こういった思考を整理する際には「間違っていたとしても、あえて自分はこうだと思う」というスタンスを取ることが理解を深めるのに大事なステップだと思っているので、
忘れないように、2024年1月時点での、自分の考えのスタンスをまとめていきます。
スタンスChatGPTをはじめとした、生
思考メモ:個人開発者が集う会社の形についての構想
昨日したツイートですが、普段の100倍くらいのインプレッションになったので、結構ニーズはあるんだろうなと思います。
現在の僕には余裕も覚悟もまだないので「じゃあやるか!」みたいにはならないのですが、この事について寝ている間も思考だけはすごい働いたので、未来の自分か、同じようなことを考えている人にとっての参考になればと思い、思考をつらつらとまとめていきます。
※経営も法律も素人なので、完全な妄想
好奇心ドリブンに生き、結構良い感じだった2023年。
雑記ですが、2023年は自分の人生にとって、印象的な年になったと思うので、簡単に振り返ってみたいと思います。
娘(第一子)が産まれた今年の5月に産まれたわけですが、生活スタイルと、自分の思考・価値観といったものが変わりました。色々大変なことはもちろんあったのですが、一方で、
娯楽に溺れなくなった(育児により、そんな時間がない)
短期よりも長期(20年後の娘が成人になった頃)の思考で物事を考え