見出し画像

AIニュースまとめ:2022年度上半期

毎週、気になったAI系のニュースをピックアップして、3行程度にまとめています。
今回は、2022年度上半期にまとめたものを貼り付けました。
改めてみると、AI分野は、いろいろな分野で思いもよらぬ発明がされているので本当に面白いです。

2022/03/28 ~ 2022/04/03 自殺などの危機にある個人のクエリを検知

https://www.itmedia.co.jp/news/articles/2203/31/news101.html
米Googleは3月30日(現地時間)、検索サービスでのAI技術活用について説明した。向こう数週間中に昨年のGoogle I/Oで紹介した検索アルゴリズム「MUM」(Multitask Unified Model)の採用で、自殺を考えるなど“個人的な危機”にある個人を検索クエリから検知し、より適切な情報を表示していく。
MUMは、複雑な疑問に「専門家のように答えられる」ことを目指す検索アルゴリズムであり、自然言語処理モデル「BERT」同様にTransformerアーキテクチャ上に構築されているが、BERTの1000倍強力という。
Google検索では既に、自殺、性的暴行、薬物乱用、家庭内暴力に関する情報を検索すると役立つアドバイスや相談先の連絡先を表示するようになっているが、MUMは、クエリの背後にある意図をより正確に把握できるという。

2022/04/04 ~ 2022/04/10 自動運転

https://www.itmedia.co.jp/news/articles/2204/07/news052.html
大阪メトロなどは4月6日、人工島・舞洲(大阪市此花区)で実施中の自動運転移動サービスの実証実験を報道陣に公開した。
自動運転は小型バスなどを想定し、特定条件下でシステムが無人の車を操作する「レベル4」相当となる。

2022/04/11 ~ 2022/04/17 タイピングと感情分析

https://www.itmedia.co.jp/news/articles/2204/18/news035.html
スイスのETH ZurichとオーストラリアのBond Universityによる研究チームはスマートフォンのキーボードをタイピングするパターンから操作したユーザーの感情状態やストレスなどを予測するモデル「Affective State Prediction from Smartphone Touch and Sensor Data in the Wild」を発表した。
研究では、スマートフォンのキー入力時のタッチイベントとIMU(慣性計測ユニット)のデータから感情を予測するモデルを提案しており、抽出したタッチデータとIMUデータからそれぞれを2次元ヒートマップに変換し、これらヒートマップから感情状態やストレスを予測するように分類器を学習する。
例えばネガティブな感情を体験しているときはバックスペースキーへのタップ数が多くなる、土日はポジティブで覚醒度が低く、反対に月火はネガティブで覚醒度が高いなどの分析結果が得られた。

2022/04/18 ~ 2022/04/24 日本語BERTモデルの無料公開

https://ledge.ai/bert-free-learning-model-in-japanese/
株式会社インフォマティクスは4月6日、ディープラーニング(深層学習)を用いた言語モデル「RoBERTa(A Robustly Optimized BERT Pretraining Approach)」の日本語版事前学習モデルを公開したと発表した。
ライセンスはApache 2.0で商用・非商用を問わず利用できる。
「RoBERTa」は、2019年に米Facebook AI Research社(現在の米Meta AI Research社)が公開したモデルであり、特定の問題に特化せず汎用性が高いため、さまざまな自然言語処理システムを効率的に実現できる。

2022/04/25 ~ 2022/05/01 ディープフェイクの判別

https://www.itmedia.co.jp/news/articles/2204/26/news170.html
東京大学大学院情報理工学系研究科の研究チームは4月26日、動画内の人物の顔が本物かどうかを判定する、ディープフェイク検出AIを開発した。
このAIは、既存研究の性能を大きく上回り、世界最高性能の評価を示したという。
より高い精度でディープフェイクの検出が可能になるため、悪用の根絶に期待できるとしている。

2022/05/02 ~ 2022/05/08 はゴールデンウィークにより記事が少なかったので休み。

2022/05/09 ~ 2022/05/15 デジタルヒューマンによる観光案内

https://www.itmedia.co.jp/news/articles/2205/12/news152.html
京都大学発のスタートアップ企業、データグリッド(京都市左京区)のシンセティック(合成)AIで生成したデジタルヒューマンを用い、京都市内の人気スポット3カ所を案内する動画を作成した。
シンセティックAIは、デジタルヒューマンなど合成データの生成に特化したAIであり、データグリッドによるとGAN(敵対的生成ネットワーク)をベースに独自のAIモジュール群やAPIなどを加えたという。
広告宣伝分野での新技術の可能性を探る実証実験である。

2022/05/16 ~ 2022/05/22 カードのイラストとテキストの自動生成

https://www.itmedia.co.jp/news/articles/2205/20/news127.html
自然言語処理モデル「Cohere」などを開発する、カナダのCohere社は5月19日(現地時間)、トレーディングカードゲーム「マジック:ザ・ギャザリング」(MTG)風のカードを自動生成できるAI「Urzas.ai」(ウルザのAI)を作成したと発表した。
好きな言葉をカード名に入力するだけで、イラストやテキストなどを自動で生成する。

2022/05/23 ~ 2022/05/29 文章からの画像生成

https://www.itmedia.co.jp/news/articles/2205/25/news088.html
米Googleの研究部門Google Researchは5月24日(現地時間)、文章から画像を生成する拡散モデル「Imagen」を発表した。
独自開発のベンチマーク「DrawBench」では、OpenAIの同様のAI「DALL-E 2」よりも人間に好まれる結果になったとしている。
GoogleはImagenを「現時点では公共の使用には適していない」と判断し、一般に公開はしないとしている。

2022/05/30 ~ 2022/06/05 方向付けできる文章生成

https://www.itmedia.co.jp/news/articles/2206/02/news048.html
米ミシガン大学、韓国のKAIST、韓国のNaver AI LABによる研究チームが、人間(作家)とAI(GPTベースの言語モデル)が小説の物語を共同制作できるツール「TaleBrush: Sketching Stories with Generative Pretrained Language Models」を開発した。
まず作家が主人公の名前を決め、物語の一部を書き、物語の中で主人公の運勢がどう変わるかをスケッチ(スタイラスペンで直感的に一筆書きで描く)する。
文章と線画グラフは連動しており、一方を編集すると一方も変わる仕組みで、作家は生成された文章を編集したり、線画グラフを修正したりして物語を練ることができる。

2022/06/06 ~ 2022/06/12 信号機の自動化

https://www.itmedia.co.jp/news/articles/2206/13/news051.html
Universityの研究チームは、交差点にあるライブカメラの映像で交通状況を監視し、深層学習モデルで適切な信号操作をリアルタイムに行う、ビジョンベースの完全自律型信号制御システムを開発した。
英Aston Universityの研究チームが開発した「Fully-Autonomous, Vision-based Traffic Signal Control: from Simulation to Reality」は、交差点にあるライブカメラの映像で交通状況を監視し、深層学習モデルで適切な信号操作をリアルタイムに行う、ビジョンベースの完全自律型信号制御システムである。
システムは、カメラの映像を使ってリアルタイムに環境を感知し、その情報を処理して交差点内の交通をできるだけ効率的に移動させるための信号を決定する。

2022/06/13 ~ 2022/06/19 広告の埋め込み

https://www.itmedia.co.jp/news/articles/2206/17/news100.html
フジテレビは6月17日、AIを用いて本編内に広告を合成する「iCADs」システムを本格運用すると発表した。
視聴者が見ているドラマ本編の背景などに交通広告やポスターという形で広告を合成する。
「通常は動画の前後や途中にインストリーム広告が入るが、iCADsで本編内に広告や商品情報を合成することで、ゆくゆくはコンテンツが途切れず、一気に視聴できるようになる」(フジテレビ)

2022/06/20 ~ 2022/06/26 コードの自動生成

https://www.itmedia.co.jp/news/articles/2206/22/news088.html
米Microsoft傘下のGitHubは6月21日(現地時間)、昨年6月からテクニカルプレビューを提供している「GitHub Copilot」の一般提供を開始したと発表した。
月額10ドルあるいは年額100ドルのサブスクリプションサービスになる。
GitHub CopilotはAI言語モデルの「GPT-3」を用いた米OpenAIの技術により、関数名とコメントから、関数のコードを丸ごと自動補完するAIプログラミング機能。

2022/06/27 ~ 2022/07/03 オンライン会議の自動要約

https://ledge.ai/zoom-amptalk/
株式会社amptalkは6月21日、同社が提供するオンライン商談自動化ツール「アンプトーク」において、業界初とうたう「Zoomに対応したオンライン商談内容を自動で要約する機能」を開発し、提供開始した。
自動書き起こし・分析の機能に加え、「自動要約機能」は書き起こされた文章から要点をピックアップし、自動で要約することで、抜け漏れのない議事録をスムーズに作成する。また、要約された文章はSalesforceに自動出力が可能。
本機能により、より効率的な商談の振り返りが可能になり、効果的なオンライン商談とインサイドセールスとフィールドセールスの連携向上といった営業活動全体の効率化を実現するという。

2022/07/04 ~ 2022/07/10 ペットボトル内の不純物判定

https://www.itmedia.co.jp/news/articles/2207/11/news035.html
シンガポール国立大学と韓国Yonsei Universityの研究チームが、「Detecting counterfeit liquid food products in a sealed bottle using a smartphone camera」という、スマートフォンのカメラのみで開封前の密封されたボトル内の液体内容物に不純物が混入されていないかを検出するシステムを開発した。
密封されたボトルを逆さにし、それによって上昇した気泡の形や動きをカメラで捉え、機械学習で分類して不純物かどうかを予測する。
複数の参加者に異なる液体の入ったボトルを回転させながら、スマートフォンのカメラで撮影してもらい、500分以上の録画データを収集した結果、最大で95%の検出精度を達成し、その有効性を実証した。

2022/07/11 ~ 2022/07/17 世の中の気分の可視化

ヤフー株式会社で先進的なビッグデータ・AI技術の研究開発を担うYahoo! JAPAN研究所は6月28日、慶應義塾大学SFC研究所 上席所員(常勤) 大越 匡 准教授(環境情報学部)と連携し、ユーザーの検索キーワードなどの情報をもとに「世の中の気分」(以下、ムード)の浮き沈みを推定する「全国ムード指数」を公開したと発表した。
同モデルを用いて分析すると、特定の検索キーワードとユーザーのムードには関係性があることや、「土日はムードが高くなり、(休日後の)月曜はムードが低くなる」「新型コロナによる緊急事態宣言が発令されるとムードが低くなる」、「新型コロナに関して、第一波、第二波と時間が経過するにつれて、ムードの低下具合が緩和されている(新型コロナに慣れつつあることが推測される)」ことなどがわかった。
これまで「全国ムード指数」は一般公開していなかったが、より多くのユーザーにAIやデータを使ったテクノロジーの楽しみや将来の可能性を知ってもらうべく、「全国ムード指数」ページにて、週単位の傾向を公開するという。

2022/07/18 ~ 2022/07/24 キャッチコピーの自動生成

株式会社デジタルレシピは6月30日、OpenAI社が提供する自然言語処理モデルGPT-3を活用したAIコピーライティングサービス「Catchy(キャッチー)」の提供を開始した。
Catchyは、AIがキャッチコピーをはじめ100パターンを超えるさまざまな文章を生成するAIコピーライティングツールだ。
資料作成、広告文、メール文、記事作成などの文章作成業務のほか、動画や新規事業などの企画提案もできるという。

2022/07/25 ~ 2022/07/31 画像自動生成モデルの一般公開

2022年4月に研究者・専門家向けに提供が始まった画像生成・編集AI「DALL・E2」の一般向けベータ版が公開されました。
「クレジット」1回で画像生成なら4枚、画像編集なら3枚の処理が可能で、登録初月は50クレジットが付与され、2ヶ月目以降は月ごとに15クレジットが付与されます。
付与されたクレジットの範囲で利用するなら追加料金は不要ですが、もっと多くの画像を処理したい場合、15ドル(約2000円)で115クレジットが付与されます。

2022/08/01 ~ 2022/08/07 相性の良い食材

カゴメが2019年に実施した「子どもの野菜に対する意識調査」結果から子供が苦手な野菜21種類を選び、NECの「リンク予測AI技術」で50万以上のレシピから野菜と相性の良い食品を導き出した。
それら組み合わせを“伝説のプリン職人の店”と呼ばれる「プルシック」(岐阜県)の所浩史オーナーシェフがプリンに仕上げた。
レシピを特設サイトで無償公開する他、一部店舗で販売する。

2022/08/15 ~ 2022/08/21 フォント自動生成

筑波大学発AIスタートアップのAIdeaLab(東京都千代田区)は8月17日、5つの文字から1万4000以上の文字をAIで自動生成するフォント生成システムの特許を出願したと発表した。
システムは、敵対生成ネットワーク(GAN)をベースに、大量のフォントを学習させた上で、手作業でデザインした数個の文字から、太さやセリフ(装飾)の形状を抽出し、生成する。
パラメーター調整でフォントを生成するUI、少ない文字数でのアップロードでフォントを生成するUIなど、さまざまなパターンのサービス展開を織り込んでおり、特許出願技術をベースに、フォント制作会社向けソフトウェアを開発予定である。

2022/08/22 ~ 2022/08/28 フリーの画像自動生成

AIスタートアップ企業の英Stability AIは8月22日(現地時間)、画像生成AI「Stable Diffusion」をオープンソース化した。
AI技術者向けコミュニティサイト「HuggingFace」でコードやドキュメントを公開した他、同AIを試せるデモサイトなども公開している。
Stable Diffusionを使い作成した機械学習モデルは、ライセンスを明記することで営利・非営利問わずに使用可能。

2022/08/29 ~ 2022/09/04 コミックにおける地雷表現の回避

明治大学中村聡史研究室の研究チームが発表した「コミックにおける読者依存性の高い地雷表現回避手法の実現」は、漫画の読書中に見たくないシーンを予告し、そのページを読むときに回避できるシステムを提案した研究報告だ。
途中で出てくる“グロテスクなシーン”を見たくないなどの個人的に遭遇を回避したい場面だけを避け、作品全体を読み進める読書体験を可能にする。
今回はPCでの電子コミック閲覧にとどまったが、今後はスマートフォンやタブレットなどのモバイル端末にも対応したいという。

2022/09/05 ~ 2022/09/11 好きな被写体のみを撮れるカメラ

米UCLA(University of California, Los Angeles)の研究チームが開発した「To image, or not to image: class-specific diffractive cameras with all-optical erasure of undesired objects」は、好きな対象物だけを撮影し、その他は削除できるカメラシステムである。
このカメラは、望ましくないクラスの物体の特性情報を、光の回折によって出力時に全て光学的に消去するため、それらの直接の画像を記録することはない。
そのため、外部の攻撃に強くプライバシーの保護が最大化され、また不要な画像を記録しないため、カメラの画像保存・転送の負荷を軽減できる。

2022/09/12 ~ 2022/09/18 ブラウザの自動操作AI

AIスタートアップのAdeptが、デジタルツールを使用するように訓練された大規模なTransformerモデル「ACT-1」を発表しました。
ACT-1はブラウザで何が起こっているかを監視し、クリック・入力・スクロールなどの特定アクションを実行できるChrome拡張機能に接続されており、操作を自動化できます。
ユーザーはテキストボックスにコマンドを入力するだけで、ACT-1は、ユーザーの高度な要求を受け止め、それを実行することができます。

2022/09/19 ~ 2022/09/25 犯罪予測システム

株式会社Singular Perturbationsは、福岡市に対して犯罪予測を用いたパトロール最適化支援サービス「CRIME NABI」の実証実験を9月12日より開始したことを発表した。
福岡市と福岡地域戦略推進協議会は、AIやIoTなどの先端技術を活用した社会課題の解決につながる実証実験プロジェクトを全国から募集し、「福岡市実証実験フルサポート事業」として優秀なプロジェクトの福岡市での実証実験をサポートしており、今回はその1つ。
CRIME NABIは、過去の犯罪発生情報や人口統計、土地利用データ、天気などのデータにもとづき、2種類の独自アルゴリズムにより犯罪を予測し、犯罪が発生しやすいと予測された場所を重点的に警備するルート策定も行う。

2022/09/26 ~ 2022/10/02 メロディーをバッハ風に変換

Experiments with Google」は、Googleが人工知能(AI)や拡張現実(AR)といった最新技術の可能性を示すために、実験的な応用例を紹介するショーケースだ。膨大なコンテンツを公開しており、その多くはスマートフォンやPCで試せる。
Assisted Melodyは、画面上の五線譜に書き込んだメロディを“クラシック音楽の巨匠たち風に演奏してくれる。
Assisted Melodyが学習した巨匠は、バッハとモーツァルト、ベートーベンである。

この記事が気に入ったらサポートをしてみませんか?