今日のAI・ロボット系のニュースで思ったこと【23/5/6】

企業で研究職をしてるぴんだ (@884deep) / Twitterです。
AIとロボットに関するニュースを引用しながら思ったことを書きます。


DreamPose: AIでファッション写真をリアルな動画に変換

ニュース要約(以下リンクから引用)

  • ファッション写真は情報提供に限界があるため、ファッションビデオの需要が高まっている。

  • DreamPoseはAIを利用して、ファッション写真をリアルな動画に変換する新しい手法。

  • 安定した拡散モデルを基盤に、よりリアルな動きや質感を再現できる。

  • 既存のビデオ拡散モデルの問題を克服し、高品質なビデオを生成できる。

思ったこと

ファッションビデオが一般的になると、消費者にとっても購入判断がしやすくなるでしょうね。。DreamPoseは、単一の画像から動画を生成できるのがすごい。


トランスフォーマーベースのLLMが事実関連をどのように抽出するか

ニュース要約(以下リンクから引用)

  • トランスフォーマーベースのLLMは事実知識を捉えるのに非常に有能。

  • 研究者たちは、LLMが事実関連をどのように抽出するかを調査した

  • モデル内部で事実関連を抽出するメカニズムが明らかになる。

  • この研究は、知識の局所化やモデル編集の新たな研究方向性を開く可能性がある。

思ったこと

この研究によって、LLMの内部機能を理解することができれば、モデルの性能向上やバイアスの軽減に役立つ。LLMで半年くらいなんで性能でるのかわからんって言われ続けてたのが、少し解明に向かったらしい。


AIの父、ジェフリー・ヒントンがAIの危険性に警鐘を鳴らす

ニュース要約(以下リンクから引用)

  • ジェフリー・ヒントンがGoogleを辞任し、AIの危険性について公然と議論。

  • 彼はAIの急速な発展が「危険に向かって突進している」と警告。

  • AIによるテキスト、画像、動画の偽造が真実を見極めることを困難にする可能性。

  • AIが仕事の自動化により失業を引き起こすことを懸念。

思ったこと

ヒントンの懸念は、AI開発の責任ある進め方の必要性を浮き彫りにしている。倫理的なAI開発が重要だと思われる。


AI業界でオープンソースプロジェクトが台頭、GoogleとOpenAIに脅威か

ニュース要約(以下リンクから引用)

  • オープンソースプロジェクトが急速に増え、GoogleやOpenAIに脅威をもたらす可能性。

  • Google内部からの文書によれば、「私たちには防波堤がなく、OpenAIにもない」との指摘。

  • GPT-4や他の独占的なモデルが注目を集めているものの、資金やインフラの優位性は徐々に薄れつつある。

  • オープンソースプロジェクトが迅速にイノベーションを進め、企業のビジネスモデルを変える可能性。

思ったこと

GoogleやOpenAIが最適化やイノベーションの主導権を失っているかもしれない。ChatGPTがでてきたときは、これでOpenAIがユーザのフィードバックもらいまくってさらに賢くなっちゃったらどんどん独占状態になるなぁと思っていたけど、オープンソースたちが盛り返しているらしい。いいね!



Google I/O 2023での新製品とAndroid 14の展示が期待される

ニュース要約(以下リンクから引用)

  • Google I/Oは5月10日午前10時(PT)から開催

  • Pixel 7aPixel TabletPixel Foldの3つのハードウェアが発表されると予想

  • Android 14(内部コード名:Upside Down Cake)のリリースが夏に予定されている

  • バッテリー寿命の向上、アクセシビリティ機能の追加、セキュリティ/プライバシー機能の強化がAndroid 14の主要な機能とされる

  • 人工知能(特に生成AI:Bard)がGoogleの消費者向けソフトウェアに幅広く導入されることが予想される

思ったこと

Google I/O 2023が近づいてる。Pixel 7aやPixel Tablet、そして待ち望まれていたPixel Foldが発表される?iphoneを使ってるから実感しにくいけどAndroid 14ではバッテリー寿命の向上やアクセシビリティ機能の追加など、使い勝手がさらに良くなるといいっすね


StarCoderが登場:オープンソースのAIコード生成ツール

ニュース要約(以下リンクから引用)

  • ServiceNowとHugging Faceが共同で開発したStarCoderが発表されました。

  • StarCoderはBigCodeプロジェクトの一部で、15億パラメータの大規模言語モデル(LLM)です。

  • 80以上のプログラミング言語に対応しており、特にPythonに強みがあります。

  • オープンソースで提供されており、OpenAIのCodexやAmazonのCodeWhisperと競合します。

  • StarCoderは、Code Open RAIL-Mライセンスで提供され、利用者は内部のコードを見ることができます。

思ったこと

StarCoderの登場により、AIコード生成ツールの市場がますます競争が激化していくでしょう。しかし、StarCoderがオープンソースであることは、その普及に大きな影響を与えるでしょう。開発者がモデルの内部を理解しやすく、より透明性が高まることで、信頼性の向上や、さまざまなプロジェクトへの適用が期待できます。

また、StarCoderが多くのプログラミング言語に対応していることも、その普及を促進する要因となるでしょう。特にPythonに強みがあることは、データサイエンスや機械学習分野での利用が期待されます。

Hugging Faceのリンク



BingとEdgeの新機能

ニュース(以下リンクから引用。日本語なので要約なし)

思ったこと

これみんな使ってんのかな?Bingのチャット。数回使ったけどなんかあんまり使ってないんだよな。。なんでかが説明できないんだけど(笑)もうちょっと使ってみようかな

この記事が気に入ったらサポートをしてみませんか?