見出し画像

人工知能(AI)入門 ―歴史から最新動向、応用、課題までを解説―

 このnote記事は、AIについて短時間でかつ網羅的に知識を得たいと考えている方に向けて作成しました。この記事を読んでいただければ、基本的なAIの現状などについてサクッと理解することができると思います。
 後半にはAIの情報収集に役立つ、有益な文献やWebサイトを複数紹介していますので、ぜひご活用いただければと思います。
 比較的ボリュームのある記事になっておりますが、楽しみながらご覧いただければ幸いです。


1.AIとは

定義

 人工知能(Artificial Intelligence、AI)とは、人間の知的な振る舞いをコンピュータプログラムによって実現する学問分野およびその技術を指します。
 1950年代に誕生し、計算機科学、数学、心理学、認知科学、哲学など様々な学問分野が関係し構成されています。

AIの歴史的経緯

 AIの考え方の源流は古代ギリシャ時代にさかのぼり、機械が「思考する」ことができるかという問いに哲学者たちが取り組んでいました。
 本格的な研究が始まったのは1950年、英国の数学者アラン・チューリングが「機械は思考できるのか」という問いを計算理論の観点から論じた論文[1]を発表したことがきっかけです。

 1956年、米国のダートマス会議においてAI という用語が初めて使われ、この分野の研究が本格化しました。会議には、AI分野の重要な概念を提唱したジョン・マッカーシー、ハーバート・サイモンらの第一人者が参加しました[2]。
 その後、知識表現、探索アルゴリズム、ニューラルネットワーク、機械学習など、AIを実現するための様々な理論と手法が提唱されてきました。2010年代に入りディープラーニングの実用化が進み、AIの性能が飛躍的に向上したことで、第三次AIブームが到来しています。
 皆さんもご存じの通り、OpenAIからChatGPTが発表されてから専門家だけでなく、一般大衆の間にも浸透しました。

主なAI技術

現在のAI分野において、主に扱われているAI技術についてご紹介します。

  • 機械学習
    データから規則性を見つけ出し、新しいデータに対する予測や判断を行う技術。

  • ディープラーニング
    ニューラルネットワークを深層化し、膨大なデータから高度な特徴を自動的に学習する技術。

  • 自然言語処理(NLP)
    人間の言語を理解し生成するための技術。機械翻訳、対話エージェントなどに活用される。

  • コンピュータビジョン
    デジタル画像やビデオを認識、解析する技術。顔認識、自動運転などに用いられる。

代表的な研究者と貢献

  • アラン・チューリング
    計算機による「思考」の可能性を最初に論じた。
    チューリングテストの提唱者。

  • ジョン・マッカーシー
    AIという用語の命名者。プログラミング言語Lispの開発者。

  • マーヴィン・ミンスキー
    フレーム理論、ニューラルネットワークなどの提唱者。
    MIT AIラボ所長を務めた。

  • ジェフリー・ヒントン
    ディープラーニングの理論的基礎を築いた。
    ディープラーニングの第三次AIブームの立役者。

[1] A. M. Turing (1950). "Computing machinery and intelligence". Mind 49: 433-460
[2] John McCarthy et al. (2006). "A Proposal for the Dartmouth Summer Research Project on Artificial Intelligence"

2.AIの基礎理論

 AIを実現するための様々な理論的アプローチが存在します。
 ここでは大きく分けて4つの手法を紹介します。

探索アルゴリズム

 問題を解く際に用いられる”探索アルゴリズム”は、目標状態に至る経路を効率的に見つける手法です。
 代表例として、ルービックキューブの解法を見つける幅優先探索や、ナビゲーションのための最短経路探索に用いられるダイクストラ法があります[1]。また、チェスのようなゲームの戦略を立てる際は、ミニマックス法などの探索手法が使われます。

知識表現とエキスパートシステム

 エキスパートシステムは、専門家の知識を形式化し、推論エンジンを用いて特定の問題を解決するシステムです。知識表現の手法として、フレーム、意味ネットワーク、ロジックなどがあります[2]。
 初期のAIシステムはこの手法に基づいていましたが、エキスパートナレッジを事前に構築する必要があり、柔軟性に欠けるという課題がありました。

ベイズ統計

 ベイズ統計は、観測データから確率的に事象を推定する方法論です。ベイズの定理に基づき、新しい観測データが得られるたびに確率分布を更新していきます。
 これにより、パターン認識、予測、意思決定などの問題に適用できます[3]。ベイズフィルタは、モンテカルロ法などの近似計算手法と組み合わせて使われます。

ニューラルネットワーク

 ニューラルネットワークは、生物の神経回路網をモデル化した数理モデルです。入力データから出力を導く際、中間層での階層的な特徴抽出が行われます。
 単純なパーセプトロンに始まり、多層化やリカレント結合の導入などの発展を経て、現在に至るディープニューラルネットワークへと進化してきました[4]。

[1] Stuart Russell, Peter Norvig (2003). Artificial Intelligence: A Modern Approach
[2] Elaine Rich, Kevin Knight (1991). Artificial Intelligence
[3] David J.C. MacKay (2003). Information Theory, Inference and Learning Algorithms
[4] Ian Goodfellow, Yoshua Bengio, Aaron Courville (2016). Deep Learning

3.主要アプリケーション分野

 続いて、主要なアプリケーション分野と、そこでどのような技術が開発・利用されているかを紹介していきます。

コンピュータビジョン

引用:Redmon, Joseph, et al. "You only look once: Unified, real-time object detection."より

 コンピュータビジョンとは、デジタル画像やビデオデータから視覚的な特徴を認識し解析する技術分野です。代表的な用途として、顔認識、物体検出、動作認識などがあげられます。特に近年は、ディープラーニングの画像認識への適用により、その性能が飛躍的に向上しています。

 自動運転分野でも、カメラやセンサーから得られる映像データを解析し、周辺の車両や歩行者、障害物を検知することがコンピュータビジョンの重要な役割です[1]。また、医療画像診断の分野でも、AIによる病変検出の研究が進んでいます。

自然言語処理(NLP)

著作者:Freepik

 自然言語処理は、人間の自然言語(文章や音声)を理解し、必要な情報を抽出したり新しい文章を生成したりする技術です。機械翻訳、対話エージェント、テキスト要約、感情分析などへの応用が進んでいます。

 特に、トランスフォーマーと呼ばれる新しいアーキテクチャを採用した大規模言語モデルが登場して以降、NLPの性能が大幅に向上しました。GPT-3[2]やBERTなどの言語モデルは、膨大な文章データから言語の特徴を学習することで、高度な言語処理を実現しています。

ロボティクス

著作者:macrovector/出典:Freepik

ロボティクスとは、ロボットの設計、製造、制御に関わる工学分野です。AIは、ロボットの知能化に不可欠な要素技術として活用されています。例えば、視覚センサーからの入力を認識し、適切な行動を選択するための意思決定エンジンにAIが使われています。

 代表的なAIロボットとしては、ボストン・ダイナミクスのAtlas[3]、ホンダのAsimo、ソフトバンクのPepperなどがあげられます。また、産業用ロボットの自動化の分野でも、AIによる作業計画の最適化などへの応用が期待されています。

ゲーム&エンターテイメント

 ゲームAIは、ゲームの中で人工知能が操作するエージェントを設計するための技術分野です。リアルタイムに状況を判断し、最適な行動を選択する必要があります。そのため、探索アルゴリズム、機械学習、プランニングなどのAI技術が広く活用されています[4]。

 また、近年は生成AIによるゲーム制作への応用が注目されています。キャラクターやマップ、ストーリーなどのゲームコンテンツを人工知能によって自動生成することで、コンテンツ制作の効率化が期待できます。

[1] DeepDrive (2018). "Computer Vision for Autonomous Vehicles"
[2] Brown et al. (2020). "Language Models are Few-Shot Learners"
[3] Boston Dynamics https://www.bostondynamics.com/atlas
[4] Yannakakis & Togelius (2018). Artificial Intelligence and Games.

4.先端のAI技術動向

強化学習

 強化学習は、エージェントが環境から報酬を最大化するように行動を学習する機械学習の一種です。試行錯誤を繰り返しながら、経験から最適な戦略を見つけていきます。AlphaGoにも用いられたこの手法は、ロボット制御やゲームAIなど、様々な分野への応用が期待されています[1]。

 特にDeepMindが開発したAlphaZero[2]は、チェス・将棋・囲碁のゲームルールしか与えられていないにも関わらず、自己対局からすべての知識を獲得し、超人的な強さを発揮しました。このように、強化学習はAIに素早く学習させるための有力な手段となっています。

生成AIモデル

 生成AIモデルとは、画像、音声、テキストなどのデータを出力できるAIモデルの総称です。デジタルコンテンツの自動生成はもちろん、創薬設計や材料開発への応用が見込まれています。

 代表例としてStable Diffusion[3]は、テキストの入力に基づいて高品質の画像を生成できます。また、GPT-3に代表される大規模言語モデルは、論文や小説、対話文を自動生成できます。さらにJukebox[4]は、歌声やメロディといった音楽データを生成できるマルチモーダルモデルです。

マルチモーダルAI

 マルチモーダルAIとは、画像、テキスト、音声など異なるモダリティ(様式)のデータを統合的に処理できるAIのことです。CLIPやALTなどのマルチモーダル言語モデルは、画像とテキストの意味的関係を理解できます[5]。

 さらに、PaLMやCosmica-Studioなどの大規模マルチモーダルモデルは、テキストだけでなく、画像・音声・センサーデータなどのマルチモーダル入力をモデル内で統合的に処理できます。クロスモーダルな認識・生成が可能となり、様々なタスクにおける革新的な応用が期待されています。

説明可能AI(XAI)

 機械学習モデルの判断根拠を人間が理解できる形で説明する技術が説明可能AI(XAI)です。ブラックボックス的な深層学習モデルの解釈が難しいことから、その重要性が指摘されています。代表的な手法にSHAP(Shapley Additive exPlanations)[6]があり、個々の特徴量がモデル出力にどの程度寄与したかを示すことができます。

 医療や金融などの重要な意思決定においては、AIの判断根拠が説明できることが求められ、XAIへの期待が高まっています。また、AIのバイアスやプライバシー面での課題解決にもXAIの貢献が期待されています。

[1] Sutton & Barto (2018). Reinforcement Learning: An Introduction
[2] Silver, David, et al. (2018). "A general reinforcement learning algorithm that masters chess, shogi, and Go through self-play"
[3] Rombach et al. (2022). "High-Resolution Image Synthesis with Latent Diffusion Models"
[4] Dhariwal et al. (2020). "Jukebox: A Generative Model for Music"
[5] Radford et al. (2021). "Learning Transferable Visual Models From Natural Language Supervision"
[6] Lundberg & Lee (2017). "A Unified Approach to Interpreting Model Predictions"

5.AIの倫理的課題

著作者:pch.vector/出典:Freepik

プライバシー、公平性、安全性への配慮

 AIシステムの普及に伴い、プライバシー、公平性、安全性への配慮が欠かせなくなっています。
 プライバシーの観点から、AIがユーザーの個人情報を不当に収集・利用することは避けなければなりません。特に顔認識やセンサーデータの活用においては、同意なくプライバシーを侵害しないよう注意が必要です。
 また、AIの意思決定にバイアスが無いか、公平性を担保できるかが重要な課題となっています[1]。

 さらに、自動運転車やサイバー攻撃対策など、人命に関わる領域では、AIシステムの安全性とロバスト性を確保することが不可欠です。AIの誤作動や悪用によって重大な事故が起きないよう、厳格な評価やリスク管理が求められます。

技術利用者の責任

 AIシステムを開発・運用する技術者や企業には、大きな責任が伴います。AIによる重大な人権侵害や環境破壊、差別的行為などのリスクを認識し、法的・倫理的に適切な利活用を心がける必要があります。

 特にAIの説明責任(説明可能性)の確保は重要です。AIシステムの判断根拠を人間が理解できるようにしておかないと、バイアスや誤りに気付くことができません。また、万が一の事故時に原因の追及ができなってしまうことは重大な問題といえます。

AI規制の動向

 AIの発展に伴う懸念に対処すべく、世界各国でAI規制の議論が進められています。EUの人工知能法案[2]は、高リスクAIシステムに対する要件と罰則規定を設けています。一方で、開発者の責任や規制対象範囲などの課題が指摘されており、今後の調整が必要とされています。

 米国では、AIエクスプロナビリティ評議会がガイドラインを策定しました。AIの透明性やアカウンタビリティ、公平性の確保などが求められています[3]。
 また、日本ではAI戦略会議が人間中心のAI原則を打ち出しました。
 民間企業でも、自主的なAI倫理ポリシーの整備が進んでいます。しかし、実効性ある規制のためには、国際協調の下での統一的なルール作りが不可欠といえます。

[1] European Commission "Ethics of Artificial Intelligence"
[2] European Commission "AI Act"
[3] U.S. AIExplanability 360 (2023) "AI Explainability Resources"

6.AI技術の展望

AIの潜在的発展と影響(雇用、意思決定)

 AIは加速度的に進化を遂げており、今後ますます私たちの生活に浸透していくことが予想されます。AIがもたらす潜在的な影響は、産業や雇用、社会システム、さらには人間性にまで及ぶと考えられています。

 雇用への影響については、AIが代替する仕事が増える一方で、新しい仕事が生まれるという見方があります[1]。しかし、AIに人間が代わられるペースが速すぎると、雇用の大量喪失が避けられない恐れもあります。社会的な対策が求められます。

 また、AIが意思決定の多くを担うようになれば、民主主義や司法制度などの社会システムの在り方そのものが問い直される可能性があります[2]。AIの公平性とバイアスの問題は看過できません。

 さらに、AGI(人工汎用知能)が実現すれば、人工知能が人間を超える「シンギュラリティ」が訪れるという指摘があります[3]。そうなれば、人間とAIの関係性や人間の存在意義そのものが問われることになります。

人工汎用知能(AGI)への期待と懸念

 AGIとは、人間と同等かそれ以上の汎用的な知能を備えたAIシステムを指します。現在のAIは、概ね特定のタスクに特化している「狭い知能」にすぎないということがいえますが、AGIが実現すれば理論上はあらゆる問題を解決できるようになります。

 AGIの実現により、経済的に大きな富が生み出され、世界的な課題解決にもつながると期待されています[4]。しかし一方で、AGIが人間を支配下に置く危険性への懸念も存在します。また、AGIの意図をコントロールできなくなるリスクも指摘されています。

 よって、AGIの研究においては、人間の尊厳やコントロール可能性を確保することが大前提となります。AIの価値観をどう設計するか、AGIに人間の価値観や倫理観を持たせるかが重要な課題です[5]。また、実用化の上では、AGIの影響を見通し、人類に有益なものとなるよう設計することが求められます。

[1] World Economic Forum (2020). "The Future of Jobs"
[2] 苑野淳一 (2021). 「AIと民主主義」 [3] Vernor Vinge (1993). "The Coming Technological Singularity"
[4] Grace et al. (2018). "When Will AI Exceed Human Performance?"
[5] Russell, S. (2019). Human Compatible: Artificial Intelligence and the Problem of Control.

7.AIの本格的な日常レベルの実用化に向けて

業務へのAI活用事例

 AIはビジネス分野でますます重要な役割を果たすようになってきました。
 AIは生産性や効率性を飛躍的に高める汎用的なツールとして、あらゆる業種で活躍が期待されています。
 代表的な活用例をいくつか簡単に紹介します。

  • 業務自動化(RPA)
    - AIが定型的な事務作業を人間に代わって自動処理[1]

  • 製造業や流通
    - 需要予測や在庫最適化などにAIを活用し、コスト削減[2]

  • マーケティング
    - AIが顧客データを分析し、personalization(個人最適化)を実現

  • 金融業界
    - AIが与信審査や不正検知などに貢献

日常生活でのAI活用

  • スマートスピーカーやIoTデバイスとの連携により、家電の音声操作やスマートホーム化が進んでいます。

  • 自動運転技術の実用化も進み、レベル3の条件付自動運転車が一部で導入されています[4]。

  • ECサイトの商品レコメンドや、動画配信サービスの視聴履歴に基づく番組推薦にAIが活用されています。

  • ChatGPTやCopilotを始めとし、LLMを専門的な知識を持たずとも簡単に日常レベルで使用する人たちが増えています。
    特に、簡単な文章の要約や、メール文の作成など人間の創造性に依存しないタスクであれば、AIに任せることも一般化しつつあります。

AIリテラシーの重要性

 AIが社会に浸透するにつれ、AIに対する正しい理解とリテラシーを身につけることがますます重要になってきます。
 AIリテラシーの向上には、教育現場でのAI教育の充実はもちろん、メディアや企業によるAI広報・啓発活動の推進も重要となります[5]。AIと人間が共生するためには、国民一人ひとりがAIを正しく理解することが不可欠です。

  • AIの基本概念と仕組み

  • AIの可能性と限界

  • AIの倫理的課題(プライバシー、公平性、説明責任など)

  • AIの活用法(業務でも日常生活でも)

 このような基礎知識を一般市民一人ひとりが身に付けることが求められていくことは自明の理といえます。
そのために、中等教育レベルから教育体制を整えていく事が必要になってくるでしょう。
 しかし、急速に技術が発展している現在において、”正しい使い方”を説明できる大人も多くはないという現状があります。
 まずは、国家レベルでの最低限の土台を作っていくということが急務であると私は考えています。

[1] UiPath(2022)."The Automation Advantage"
[2] McKinsey(2018)."Artificial Intelligence The Next Digital Frontier?"
[3] MDPI(2022)."A Survey on Virtual Assistants"
[4] 国土交通省(2022)."自動運転に関する制度について"
[5] 山森陽介(2022)."AIリテラシー教育の重要性と課題"文部科学省

8.AIに関する主要文献・情報源

 最後になりますが、今回のようなAIについての情報を集めるにあたり参考となる文献や情報源をお伝えしたいと思います。
 かなり専門的な領域に踏み込んだ著書もありますが、もっと深く知見を広げていきたいとお考えの方は、ぜひ参考にしてみてください。

歴史的な著書

  • 計算する機械と知性- A.M.チューリング(1950年)
    AIの考え方の源流とされる論文です。チューリングはコンピュータが「思考」できるかを計算理論の観点から論じています。

  • 認知科学の基底 - M.ミンスキー(1986年)
    MIT AIラボの所長を務めたミンスキー他による名著です。
    知能のメカニズムに関する重要なアイデアが提示されています。

入門書・解説本

研究論文と会議・ジャーナル

 すべて英語ですが、有益な情報が数多く掲載されています。
 英語に抵抗がなければぜひ覘いて見ることをお勧めします。
 英語に自信がなくとも、翻訳ツールを用いれば理解可能ですから、積極的に見てみると良いでしょう。

  • arXiv(アーカイブ)
    AI分野の最新論文がプレプリントとして無料公開されているリポジトリ。

  • NeurIPSICMLICLR
    機械学習の主要国際会議。最先端の研究論文が発表されています。

  • IEEE TPAMIJMLR
    コンピュータビジョン、機械学習に関する有力ジャーナルです。
    査読を経た研究論文が掲載されています。

ニュースソース

  • MIT Technology ReviewWiredThe Verge(メディア)
    AIに関する最新ニュースや解説記事を掲載しています。

  • hardvard.aianalyticsvidhya(ブログ)
    AIの技術トレンドやビジネス応用について詳しい情報が得られます。

  • The Batch
    AI(ニューズレター) 最新のAI研究成果やスタートアップ動向をタイムリーにキャッチアップできます。

 また、これらのほかにも学会や企業の公式サイトも有益な技術情報源となります。学習にはさまざまな情報チャネルを活用することが重要ですので、積極的に多くの情報を取りに動いていくことが大切です。

おわりに

一つの記事としては、かなり長くなってしまいましたが、
お読みいただき、ありがとうございました。
この記事が少しでも何か皆様のお役に立てれば幸いです。

この記事が気に入ったらサポートをしてみませんか?