<概要>
⚫︎生成AI学習に向けて
⚫︎生成AIのはじまりとこれから
⚫︎プロンプトについて
⚫︎生成AIの歴史
生成AIの歴史は、人工知能(AI)の歴史と深く結びついており、数々のブレイクスルーを経て現在の隆盛に至っている。
AIの黎明期(1950年代 – 1970年代)
| チューリングテスト(1950年) | アラン・チューリングが提唱したチューリングテストは、「機械が人間と区別がつかないレベルの会話ができるかどうか」を判定するテストで、 AIの知性の基準として広く知られている。 これは、生成AIの目標の一つである「人間らしい出力」の概念の原点とも言える。 |
| ダートマス会議(1956年) | ジョン・マッカーシーが「人工知能」という言葉を提唱し、AI研究が本格的にスタートした。 この時期は、記号処理や探索・推論といった手法が中心だった。 初期のAI研究では、チェスや将棋といったゲームで人間に勝つプログラムなどが開発された。 |
| ELIZA「エリザ」(1966年) | ジョセフ・ワイゼンバウムが開発したELIZAは、簡単な自然言語処理を用いて人間と対話するプログラム。 特定のキーワードに反応して事前に用意された文章を返すという単純な仕組みだったが、人間らしい会話をシミュレートする試みとして注目 を集めた。 |
AIの冬の時代(1970年代 – 1990年代)
初期のAI研究に対する過度な期待と、当時の計算機能力の限界から、AI研究は一時停滞期に入る。
この時期は、「AIの冬」と呼ばれている。
機械学習の発展(1980年代 – 2010年代)
機械学習、特に統計的手法に基づく研究が活発化した。
データから学習することで、より複雑なタスクをこなせるAIが登場し始めた。
| ニューラルネットワークの再評価 | 1980年代後半から、バックプロパゲーションなどのアルゴリズムの発展により、ニューラルネットワークが再び注目を集めるようになった。 |
ディープラーニングの登場と生成AIの隆盛(2010年代 – 現在)
| ディープラーニングのブレイクスルー | 2010年代に入り、ディープラーニング(深層学習)が画像認識や自然言語処理などの分野で圧倒的な性能を発揮し、AIは第三次ブームを迎える。 |
| GAN「ガン」(敵対的生成ネットワーク)(2014年) | イアン・グッドフェローらが提案したGANは、2つのニューラルネットワーク(生成器と識別器)を競わせることで、本物に近いデータを生成す る手法。 GANの登場は、生成AIの分野に大きなインパクトを与えた。 画像生成、文章生成、音楽生成など、様々な分野で応用されている。 |
| VAE「ブイエーイー」(変分オートエンコーダ) | GANと並んで、生成モデルの重要な手法。 データの特徴を潜在変数にエンコードし、そこからデータを生成する。 |
| Transformer「トランスフォーマー」モデル(2017年) | Googleが開発したTransformerモデルは、自然言語処理の分野で大きな進歩をもたらした。 従来のRNN(Recurrent Neural Network)に比べて並列処理が可能になり、大規模なデータセットの学習が効率的に行えるようになった。 |
| 大規模言語モデル(LLM)の登場 | TransformerモデルをベースにしたBERT、GPTなどの大規模言語モデルが登場し、自然言語生成の精度が飛躍的に向上した。 特に、GPT-3やその後のモデルは、人間と区別がつかないような自然な文章を生成することで、大きな話題となった。 |
| 拡散モデル | 近年、画像生成の分野で注目を集めているのが拡散モデル。 ノイズを加える過程を逆再生することで、高品質な画像を生成する。 |
生成AIの現在と未来
現在、生成AIは画像、テキスト、音楽、動画など、様々な分野で活用されており、今後の展望としては、以下のような点が期待されている。
・より高品質で創造的なコンテンツの生成
・人間とAIのより自然なインタラクション
・新たな産業やサービスの創出
・倫理的な課題への対応(フェイクニュース、著作権侵害など)
【生成AIとイーロンマスク】
イーロン・マスクは生成AIの可能性に早くから注目しており、関連する活動を多岐に渡って展開しており、生成AIとイーロン・マスクは深い関わりがある。
- OpenAIの共同設立者
イーロン・マスクは、2015年にSam Altmanらと共に非営利団体としてOpenAIを共同設立した。
OpenAIは、人類全体に利益をもたらすことを目的とした人工知能の研究開発を行っており、GPTシリーズなどの大規模言語モデルで世界的に知られている。
しかし、マスクは2018年にテスラやSpaceXなどの自身の事業との利益相反を理由にOpenAIの取締役を辞任している。 - xAI(エックスエーアイ)の設立
OpenAIを離れた後、マスクは2023年7月に自身のAI企業「xAI」を設立。
「宇宙の真理を理解する」という壮大なビジョンを掲げ、生成AIの研究開発に注力している。 - Grok(グロック)の開発
xAIは、独自の生成AIモデル「Grok」を開発した。
Grokは他の大規模言語モデルと同様にテキスト生成、質問応答、要約など、様々な自然言語処理タスクを実行できる。 - Grokのオープンソース化
2024年3月、xAIはGrok-1の基本モデルとネットワークアーキテクチャをオープンソース化し、研究者や開発者はGrokの技術を自由に利用し改良することができるようになった。 - 生成AIによるゲーム開発スタジオの新設
2024年12月には、マスクが生成AIを活用したゲーム開発を行うスタジオを新設する計画が報じられた。
これにより、ゲーム開発の分野でも生成AIの活用が進むことが期待される。 - 生成AIに対するイーロン・マスクの懸念
マスクは生成AIの可能性を高く評価する一方で、その潜在的な危険性についても警鐘を鳴らしており、特に、AIが人間の仕事を奪う可能性や悪用されるリスクについて懸念を表明している。
そのため、AIの開発と規制に関する議論を積極的に行っている。 - 生成AIと社会への影響に関する発言
マスクはAIの急速な発展が社会に大きな変革をもたらす可能性を示唆している。
仕事の消失やUBI(普遍的基礎所得)の必要性など、AIがもたらすであろう課題について議論を呼ぶ発言も行っている。
【孫正義とAGI】
孫正義氏とAGI(汎用人工知能)※は非常に密接な関係にあり、孫氏はAGIの可能性に強い期待を寄せており、その実現が社会に大きな変革をもたらすと考えている。
- AGIへの強い期待と確信
孫正義氏は公の場でAGIについて頻繁に言及しており、その実現を確信していることを表明している。
特にソフトバンクグループのイベント「SoftBank World」などでは、AGIに関する講演を行い聴衆にその重要性を訴えている。 - AGIの定義と将来像
孫氏はAGIを「人間の知能と同等以上の知能を持つAI」と定義しており、人間のあらゆる知的活動をAIが代替できるようになる未来を描いている。
さらに、AGIは自己意識を持つ可能性についても言及しており、AIが単なるツールではなく人間のパートナーやメンターになる未来を想像している。 - ASI(人工超知能)への言及
孫氏はAGIのさらに先にあるASI(Artificial Super Intelligence、人工超知能)についても言及している。
ASIは人間の知能を遥かに超える知能を持つAIであり、人類の叡智の総和の数万倍、あるいはそれ以上になるとされている。
孫氏は、ASIが10年以内に実現する可能性があると述べており、その到来に備える必要性を強調している。 - 人間の脳との比較
孫氏は、人間の脳のシナプス数(約100兆個)とAIのパラメータ数を比較し、AIの進化のスピードを強調している。
人間の脳のシナプス数は過去20万年間変わっていない一方で、AIのパラメータ数は指数関数的に増加しており、近い将来、AIが人間の脳を超えることは明らかだと述べている。 - 情報革命の進化
孫氏は過去のインターネット革命や携帯電話革命と同様に、AGIの実現を情報革命の新たな段階と捉えている。
AGIは社会のあらゆる分野に大きな変革をもたらし、人々の生活や働き方を根本から変える可能性があると考えている。 - 日本へのメッセージ
孫氏は、AGIの時代において日本が世界に後れを取らないように警鐘を鳴らしている。
日本は技術力やデータ活用において遅れをとっている部分があり、AGI時代に向けて早急な対応が必要だと訴えている。 - AI倫理への言及
孫氏はAGIの可能性を強調する一方で、その倫理的な側面についても言及している。
AIが人間の仕事を奪う可能性や悪用されるリスクについて懸念を表明しており、AIの開発と規制に関する議論の重要性を訴えている。
特に、ASIが「思いやりや慈しみ、優しさなど、柔らかい関係性を結べる」存在になることを期待しており、AIが人類の幸福に貢献することを願っている。 - ソフトバンクグループのAI戦略との関連
ソフトバンクグループは、Arm (アーム)の買収などを通じて、AI半導体分野に積極的に投資している。
これはAGIの実現に不可欠な計算基盤を強化する戦略と見ることができる。
また、ソフトバンク・ビジョン・ファンドを通じてAI関連企業に幅広く投資しており、AGI関連技術の発展を支援していると言える。
※AIとAGIの違いとは?
| AI | AGI | |
|---|---|---|
| 知能の種類 | 特化型 | 汎用型 |
| 対応できるタスク | 特定のタスク | 幅広いタスク |
| 学習能力 | 学習データに依存 | 道の状況でも学習・適応 |
| 人間との類似性 | 限定的 | 高い |
| 現在の状況 | 実用化されているものが多数ある | まだ実現していない |
| 例 | 画像認識、音声認識、自然言語処理、ゲームAIなど | 人間のような知能を持つAI |
例えば、画像認識AIは大量の画像データから学習し画像に写っている物体を認識できるが、文章を理解したり音楽を作曲したりすることはできない。
一方で、AGIは文章を理解し、音楽を作曲し、絵を描き、科学的な発見をし、人間と自然な会話をすることができると想定されている。
つまり、AIは特定のタスクに特化した知能であるのに対し、AGIは人間のように幅広いタスクをこなせる汎用的な知能であるということ。
例)ChatGPTは大規模言語モデルと呼ばれるAIの一種で、自然な文章生成能力を持っているが、あくまで特定のタスク(文章生成)に特化したAIであり、AGIではない。
ChatGPTは、与えられたデータに基づいて文章を生成することはできるが、未知の状況に自ら適応したり、人間のような創造性や常識に基づいて行動したりすることはできない。
<AGI実現の難しさ>
常識の獲得:
人間が当たり前のように持っている常識をAIにどのように教えるのかが難しい。
推論と判断:
人間のように複雑な状況を理解し、適切な推論や判断を行う能力をAIに与えるのが難しい。
意識と感情:
人間のような意識や感情をAIに持たせることは、倫理的な問題も含めて大きな課題である。
⚫︎プロンプトについて
プロンプト(Prompt)とは?:
AIとの対話やコマンドラインインタフェース(CLI)などの対話形式のシステムにおいて、ユーザが入力する指示や質問のこと。
AIがユーザの要求や問いに対して適切な応答や結果を生成するためには、明確で具体的なプロンプトが必要。
<文章生成AIについて>
①主なサービス
ChatGPT / Gemini(旧Google Bard) / Notion AI / Catchy / Jasper / ELYZA LLM for JP / SAKUBUN / Magic Write / AIのべりすと / PlayAI/ぷれあい / Appleも文章生成AIの作成に力を入れている
②主な特徴
・多様な文章生成
記事、小説、詩、メールなど、様々な種類の文章を作成可能
・学習能力
膨大なデータを学習し、人間らしい自然な文章を生成
・効率化
人間の作業を補助し、文章作成の効率化に貢献
・創造性
新しいアイデアや表現を生み出す可能性を秘める
<プロンプト記述のPOINT>
「明確な指示」を書くことが大事
・文字数の制限をする
例)「〇〇文字で」
・具体的な例の参考テキストを提供する
例)「以下の例を参考にしてください」「初心者にもわかりやすく教えて下さい」
・一気に依頼せず依頼内容を分割する
例)「〇〇について教えてください」→「この文章を〇〇文字で要約してください」→「この文章をビジネス用語に変えて下さい」
※ファクトチェックとは?
ニュース記事やSNS上の情報などが事実と合致しているかどうかを検証し、正確性を評価する行為のこと。
AIは必ずしも正確な情報をくれるわけではなく、ネット上の主流の回答をしたり一部誤った情報をくれたりすることがまだあるため、AI加圧用の場面においてファクトチェックは欠かせない。
<ファクトチェックの手順>
1.情報の収集:
検証対象となる情報について、複数の情報源から収集する。
2.情報の分析:
収集した情報を詳細に分析し、矛盾点や不一致点がないかを確認する。
3.専門家への諮問:
必要に応じて専門家や研究者に意見を聞き、情報の信頼性を検証する。
4.評価:
分析結果に基づいて情報の正確性を評価し、事実と異なる部分があれば指摘する。