Koji Iino

Sound AI Engineer、組織作り、マネジメント LinkedIn:htt…

Koji Iino

Sound AI Engineer、組織作り、マネジメント LinkedIn:https://www.linkedin.com/in/koji78/

最近の記事

PRWebでWebサービスのプレスリリースをグローバルに出してみた

海外向けにプレスリリースを出してみたかったので、調査の中からコストとネットワークあたりからPRWebを試してみることにしました。 結果アジア以外が圧倒的に増えました。 一番安いプランを使ったのでユニークカウントなどは激増とはなりませんでしたが、グローバル向けプレスリリースの雰囲気は感じられたかなというところです。 また、PRWebの購読者がどのようなユーザー層かも分かりませんが、出す前にレビューで確認していた「営業メールが増える」も実感出来ました。 プレスリリース作成アカ

    • 音解析AIのためのDeep Learningの訓練データのアノテーションツールをElectron, React, Pythonを組み合わせて自作してみる

      画像・動画のアノテーションツールは有料・OSSなど見つかりますが、訓練データ整形前は時間軸が異なる音のデータ(波形、スペクトログラムなど)に対して使いやすいツールが見つからないので自作してみようというものです。 Electron+Reactそもそも何故ネイティブアプリなどではないかというと、Webサービスで使うReactコンポーネントを共用出来たらいいなということが出発点でした。 単なるWebアプリですとローカルのファイルが扱いにくい点と、Webサービスとして起動するのもな

      • Docker上でWebサービス+Fluentd+Elasticsearchでアクセスログ管理

        docker-compose.ymlKibanaからElasticsearchに接続する際は`kibana_system`を使う構成です。後述のスクリプトでパスワードを設定しています。 webappのloggingのtagの値でfluentdのフィルター等は構成します。後述の設定ファイルで定義します。 version: "3"services: elasticsearch: image: docker.elastic.co/elasticsearch/elasti

        • AWS EC2インスタンス(g4dn.xlarge)でCUDA, cuDNNのセットアップ

          情報を探したり少し手間だったのでメモです。 なお、TensorFlowのバージョン依存はこちらの「テストされたビルド構成」で確認出来ます(ヘッダーまで翻訳されていますが・・・) 「Ubuntu Server 20.04 LTS」のAMIで作成しています。 NVIDIAドライバのインストールAWSのドキュメントの「パブリック NVIDIA ドライバー」を参考にしました。 「G4dn」は「Tesla / T シリーズ / T4」のようです。 AWSのドキュメントにも記載があり

        PRWebでWebサービスのプレスリリースをグローバルに出してみた

        • 音解析AIのためのDeep Learningの訓練データのアノテーションツールをElectron, React, Pythonを組み合わせて自作してみる

        • Docker上でWebサービス+Fluentd+Elasticsearchでアクセスログ管理

        • AWS EC2インスタンス(g4dn.xlarge)でCUDA, cuDNNのセットアップ

          スタジオ・ライブ録音をオーディオ分割してリミックス

          全員で演奏して録音するいわゆる一発録りの場合は音の加工には限界がありましたが、AIでオーディオ分割するサービス「Original Track」で楽器毎に分割するとリミックスが出来るのでスタジオ・ライブ録画したもので実践してみました。 元の動画楽器の音圧の方が勝ってしまってボーカルが埋もれてしまっていました。 (演奏のクオリティなどは置いておいて下さい!) リミックス後の動画ボーカルを前に出すようにリミックス。相対的に楽器の音圧が下がっています。 (ひとまず色々できそうと

          スタジオ・ライブ録音をオーディオ分割してリミックス

          Sidekiqのみでinitializersを読み込む(SSL接続)

          問題initializers/sidekiq.rbを作成してRedisへSSL接続しようとしてもエラーになる。 起動時のログから謎にURLだけは反映されていたので余計に混乱していた。 require 'sidekiq'require 'dotenv/load'require 'openssl'OpenSSL.debug = trueredis_url = ENV['REDIS_URL'] || 'rediss://localhost:6379/0'redis_crt_pa

          Sidekiqのみでinitializersを読み込む(SSL接続)

          ウェブサイトへのCookieに関する同意モードの組み込み

          今やどのサイトでも見るようになったCookieの同意を、ウェブサイトに組み込む際のざっくりとしたまとめです。 ユーザーの同意を管理する理由Googleがまとめてくれています。 ざっくり全体イメージGoogle Analyticsで分析する場合のざっくり全体イメージです。 同意されていないと分析データとしては送られないというものです。 気になるのは、タグマネージャでプレビューで確認する限り、同意されていなくてもスクロールやクリックなどのイベントは取得されているように見えま

          ウェブサイトへのCookieに関する同意モードの組み込み

          スモールスタートのWEBシステム構成案

          PoCなどでスモールスタートのWEBシステムを構築する際に、コストやセキュリティなども考慮してベターと思われる構成案をメモしておきます。 あくまでの2023/11時点の個人の見解です。また、あくまでも一案なので参考程度に見ていただければと思いますし、今後変わっていくと考えています。 想定しているWEBシステム利用者にはクラウド上で利用してもらう(ブラウザで使う) UIはある程度動的な変化が必要(クリックすると画面遷移無しで変化) ある程度のデータ量があり検索パターンが複

          スモールスタートのWEBシステム構成案

          CTOに必要なスキルと特質

          CTO(最高技術責任者)は、企業の技術戦略とイノベーションを牽引する重要な役割を担います。ここでは、CTOに必要なスキルと特質について整理してみます。 技術的知識と専門性CTOは、企業の技術戦略を立案するために、幅広い技術的知識と専門性を持つことが求められます。業界の最新動向や技術、ツールを把握し、これらを戦略に取り入れる能力が重要です。 ビジョンと戦略的思考成功するCTOは、技術的なビジョンと戦略的思考を持ち、企業の成長や競争力向上に寄与する技術戦略を策定します。また、

          CTOに必要なスキルと特質

          iPadOS 17 Safariのプロファイル

          新しくなったiPadOS 17のSafariのプロファイルが気になっていたので使い方だけ確認してみました。 プロファイルの追加「設定」ー「Safari」を開くと右側に「プロファイル」という項目があり、「新規プロファイル」ボタンで追加出来ます。 新たに追加してみると(ここでは「開発用」を追加してみました)、「個人用」というのが元々のプロファイルとして自動的に設定されるようです。 プロファイルの切り替えSafariのアプリを開き、右上のタブボタンで全てのタブを表示すると、タ

          iPadOS 17 Safariのプロファイル

          音楽関係の余暇市場の推移

          以下の内容から音楽関係のみ可視化してみました。 公益財団法人日本生産性本部「レジャー白書2022」 P.136 図表2-2 余暇市場の推移 (ロ)趣味・創作部門 楽器音響機器製品音楽テープCD(レンタル含む)音楽配信邦楽(学習)音楽会(鑑賞)所感 楽器や音響機器が下がっているのは残念です。それと同期したように学習も下がっています。演奏する人口や形態が変わってきたからでしょうか。  音楽配信が一度下がっているのはダウンロード販売からストリーミングへの変遷があったからでしょうか

          音楽関係の余暇市場の推移

          オンライン楽譜販売サイト(2023年8月)

          以下は、2023年8月現時点で見つけた情報に基づいたオンライン楽譜販売サイトです。なお、オンラインでPDFなどのデータとして販売しているサイトを対象としています。 ぷりんと楽譜掲載件数:287,650件(2023.8.7時点) 多彩な決済方法 MIDIも販売 楽譜の提供元は見つけられず ヤマハが運営しているので安心感がある 運営会社 ライセンス情報 JASRAC許諾 6523417231Y37019 6523417232Y30005 6523417004Y37

          オンライン楽譜販売サイト(2023年8月)

          AWS Vault with Docker

          以下を指定(値は不要) AWS_REGION AWS_ACCESS_KEY_ID AWS_SECRET_ACCESS_KEY AWS_SESSION_TOKEN docker run aws-vault exec profile -- docker run -e AWS_REGION -e AWS_ACCESS_KEY_ID -e AWS_SECRET_ACCESS_KEY -e AWS_SESSION_TOKEN image command docker-co

          AWS Vault with Docker

          PyYAMLのインストールエラー

          Object Detection APIのセットアップでも発生していて、解消法を探すのに少し手間取ったためメモしておきます。 PyYAMLのインストールエラー Collecting PyYAML==5.4.1 Downloading PyYAML-5.4.1.tar.gz (175 kB) ━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━ 175.1/175.1 kB 5.0 MB/s eta 0:00:00 Installing

          PyYAMLのインストールエラー

          WSL2でGPUを使う(PyTorch, CuPy, TensorFlow)

          Windows 11のWSL2(Ubuntu 22.04)でGPUを使う際にPyTorch, CuPy, TensorFlowを全て使おうと思ったら少し詰まった部分もあったのでメモとして残しておきます。 ※以下「WSL2」=「WSL2にインストールしたUbuntu」です バージョン一覧(2023/7/7時点)Windows 11 22H2 WSL2 Ubuntu 22.04 Nvidia Driver 536.40 CUDA 11.7.1 cuDNN 8.6.0

          WSL2でGPUを使う(PyTorch, CuPy, TensorFlow)

          1時間32分53秒は何秒?(ChatGPT, Bing, Bard)

          1+1=3 と答えるという記事も以前見かけていたので、ふと気になったので時間を計算してもらいました。 ※2023.6.8時点なので、今後変わっていくと思います ChatGPT-3.5 おおう、552053秒とのこと。 ChatGPT-4 5573秒、正解!(説明は少しだけ微妙な感じはありますが) Bing こちらも5573秒で正解! Bard ん?3253秒ですと。式は合っているのに・・・ 結果 ChatGPT-4とBingは正解でした。 おまけ、1+1

          1時間32分53秒は何秒?(ChatGPT, Bing, Bard)