各大科技巨头の競争は商業アプリケーションの発展を促進するだけでなく、オープンソースAI研究の調査統計から、2024年のAI Index reportはGitHub上のAI関連プロジェクトの数が2011年の845から2023年の約180万に急増したことを示しています。特に、GPTがリリースされた2023年には、プロジェクト数が前年同期比で59.3%増加し、世界の開発者コミュニティのAI研究への熱意を反映しています。
現在、業界で一般的にAIエージェントの定義は、環境を認識し、それに応じた行動を取る知能システムを指します。センサーを通じて環境情報を取得し、処理後にエグゼキューターを介して環境に影響を与えます(Stuart Russell & Peter Norvig, 2020)。私たちは、AIエージェントはLLM、RAG、記憶、タスク計画、およびツール使用能力を集約したアシスタントであると考えています。単純な情報提供だけでなく、計画、タスクの分解、そして実際に実行することができます。
AIエージェントは未来の可能性が大きく、Web3+AIの発展の新たなエンジンとなる可能性があります。
AIエージェントはWeb3+AIの救いの手になれるのか?
AIエージェントプロジェクトはWeb3+AI分野で強力な市場競争力を示しています。現在、Web3のAIエージェントプロジェクトは数が少なく、全体の8%を占めていますが、AI分野における時価総額は23%に達しています。技術が成熟し、市場の認知度が向上するにつれて、将来的には10億ドルを超える評価を受けるプロジェクトがいくつか出現することが予想されます。
Web3プロジェクトにおいて、AIコアではないアプリケーション端製品にAI技術を導入することは、戦略的な優位性になる可能性があります。AIエージェントプロジェクトの組み合わせ方では、全エコシステムの構築とトークン経済モデルの設計に重点を置き、分散化とネットワーク効果を促進することが重要です。
AIの波:プロジェクトの続出と評価の上昇の現状
ChatGPTが2022年11月に登場して以来、わずか2ヶ月の間に1億人以上のユーザーを惹きつけ、2024年5月にはChatGPTの月収が驚異の2030万ドルに達しました。OpenAIはChatGPTを発表した後、すぐにGPT-4やGP4-4oなどのバージョンを続々とリリースしました。このような急速な展開に、各大手テクノロジー企業はLLMなどの最先端AIモデルの応用の重要性を認識し、自社のAIモデルやアプリケーションを次々と発表しました。例えば、Googleは大規模言語モデルPaLM2を発表し、MetaはLlama3を投入し、中国の企業は文心一言や智谱清言などの大規模モデルを発表しました。明らかにAIの分野は、争奪戦の場となっています。
各大科技巨头の競争は商業アプリケーションの発展を促進するだけでなく、オープンソースAI研究の調査統計から、2024年のAI Index reportはGitHub上のAI関連プロジェクトの数が2011年の845から2023年の約180万に急増したことを示しています。特に、GPTがリリースされた2023年には、プロジェクト数が前年同期比で59.3%増加し、世界の開発者コミュニティのAI研究への熱意を反映しています。
AI技術への熱意は、投資市場に直接反映されており、AI投資市場は強力な成長を示しており、2024年の第2四半期には爆発的な成長を見せる。この世界には、1.5億ドルを超えるAI関連投資が16件あり、これは第1四半期の2倍にあたる。AIスタートアップの資金調達総額は240億ドルに急増し、前年同期比で2倍以上の成長を遂げた。その中で、マスク氏のxAIは60億ドルを調達し、評価額は240億ドルに達し、OpenAIに次ぐ評価額2位のAIスタートアップとなった。
AI技術の急速な発展は、かつてない速度でテクノロジー分野の地図を再形成しています。テクノロジーの巨人間の激しい競争から、オープンソースコミュニティプロジェクトの活発な発展、さらには資本市場によるAIコンセプトへの熱烈な支持に至るまで、プロジェクトは次々と登場し、投資額は再び最高記録を更新し、評価額もそれに伴って上昇しています。全体として、AI市場は高速成長の黄金期にあり、大規模言語モデルと検索強化生成技術は言語処理分野で重要な進展を遂げています。それにもかかわらず、これらのモデルは技術的優位性を実際の製品に転換する際に、モデルの出力の不確実性、生成された不正確な情報の幻想リスク、モデルの透明性の問題などの課題に直面しています。これらの問題は、信頼性が非常に重要なアプリケーションシナリオにおいて特に重要になります。
この背景の中で、私たちはAIエージェントの研究を始めました。なぜなら、AIエージェントは実際の問題解決と環境との相互作用の包括性を強調しているからです。この転換は、AI技術が純粋な言語モデルから、現実の問題を真に理解し、学習し、解決できる知能システムへと進化することを示しています。したがって、私たちはAIエージェントの発展から希望を見出し、それがAI技術と実際の問題解決との間のギャップを徐々に埋めていることを実感しています。AI技術の進化は生産力の構造を再形成し、Web3技術はデジタル経済の生産関係を再構築しています。AIの三要素:データ、モデル、計算力が、Web3の分散型、トークン経済、スマートコントラクトといった核心的な理念と融合することで、一連の革新的なアプリケーションが生まれることを予見しています。この潜在能力に満ちた交差領域において、私たちはAIエージェントが自律的にタスクを実行する能力を持ち、大規模な応用を実現する巨大な可能性を示していると考えています。
そのため、私たちはWeb3におけるAIエージェントの多様な応用について深く研究を開始しました。Web3の基盤インフラ、中間層、アプリケーションレベル、データおよびモデル市場などの複数の次元から、最も有望なプロジェクトタイプとアプリケーションシナリオを特定し評価することを目的とし、AIとWeb3の深い統合を深く理解します。
! AIエージェントはWeb3+AIの命の恩人になれるか?
概念の明確化:AIエージェントの紹介と分類の概要
基本的な紹介
AIエージェントについて紹介する前に、読者がその定義とモデル自体の違いをよりよく理解できるように、実際のシナリオを例に挙げます:あなたが旅行を計画していると仮定しましょう。従来の大規模言語モデルは、目的地情報や旅行の提案を提供します。検索強化生成技術は、より豊かで具体的な目的地の内容を提供できます。そしてAIエージェントは、アイアンマン映画のジャービスのように、ニーズを理解し、一言でフライトやホテルを積極的に検索し、予約操作を実行し、スケジュールをカレンダーに追加します。
現在、業界で一般的にAIエージェントの定義は、環境を認識し、それに応じた行動を取る知能システムを指します。センサーを通じて環境情報を取得し、処理後にエグゼキューターを介して環境に影響を与えます(Stuart Russell & Peter Norvig, 2020)。私たちは、AIエージェントはLLM、RAG、記憶、タスク計画、およびツール使用能力を集約したアシスタントであると考えています。単純な情報提供だけでなく、計画、タスクの分解、そして実際に実行することができます。
この定義と特性に基づいて、私たちはAIエージェントがすでに私たちの生活に溶け込んでいることを発見できます。AlphaGo、Siri、テスラのL5レベル以上の自動運転など、さまざまなシーンで応用されています。これらのシステムの共通の特徴は、外部のユーザー入力を感知し、それに基づいて現実の環境に影響を与えることができるということです。
ChatGPTを例に概念を明確にするために、TransformerがAIモデルを構成する技術アーキテクチャであることを明確に指摘する必要があります。GPTはこのアーキテクチャに基づいて発展したモデルシリーズであり、GPT-1、GPT-4、GPT-4oはそれぞれ異なる発展段階のバージョンを表しています。ChatGPTはGPTモデルから進化したAIエージェントです。
カテゴリー概要
現在、AIエージェント市場は統一された分類基準が形成されていません。私たちは、Web2およびWeb3市場における204のAIエージェントプロジェクトにラベルを付けることによって、各プロジェクトに対応する顕著なラベルに基づいて、一次分類と二次分類に分けました。その中で、一次分類は基盤インフラ、コンテンツ生成、ユーザーインタラクションの3つのカテゴリであり、実際のユースケースに基づいて細分化されています。
基盤インフラ系:このカテゴリは、エージェント分野のより基層の内容を構築することに焦点を当てており、プラットフォーム、モデル、データ、開発ツール、そしてより成熟した基層アプリケーションのB2Bサービスを含んでいます。
開発ツール: 開発者にAIエージェントを構築するための補助ツールとフレームワークを提供します。
データ処理クラス: 異なる形式のデータを処理および分析し、主に意思決定を支援し、トレーニングのためのソースを提供します。
モデル訓練クラス: AI向けのモデル訓練サービスを提供し、推論、モデルの構築、設定などを含みます
B端サービス:主に企業ユーザー向けに、企業サービス、垂直型、自動化ソリューションを提供します。
プラットフォーム集合型: 様々なAIエージェントサービスとツールを統合したプラットフォーム。
インタラクティブタイプ:コンテンツ生成タイプに似ていますが、持続的な双方向のインタラクションが異なります。インタラクティブエージェントは、ユーザーのニーズを受け入れ理解するだけでなく、自然言語処理(NLP)などの技術を通じてフィードバックを提供し、ユーザーとの双方向インタラクションを実現します。
感情サポートタイプ: 感情的なサポートと陪伴を提供するAIエージェント。
GPT系: GPT(生成的事前学習トランスフォーマー)モデルに基づくAIエージェント。
検索系: 検索機能に特化し、より正確な情報検索を主な目的としたエージェントを提供します。
コンテンツ生成タイプ:このタイプのプロジェクトは、ユーザーの指示に基づいてさまざまな形式のコンテンツを生成するために、大モデル技術を利用してコンテンツを作成することに焦点を当てています。テキスト生成、画像生成、動画生成、音声生成の4つのカテゴリに分かれています。
! AIエージェントはWeb3+AIの命の恩人になれるか?
Web2 AI Agentの開発状況の分析
私たちの統計によれば、Web2の従来のインターネットにおけるAIエージェントの開発には明らかなセクター集中の傾向があります。具体的には、約3分の2のプロジェクトが基盤インフラタイプに集中しており、その中でも主にB向けサービスと開発ツールが多いです。この現象についてもいくつかの分析を行いました。
技術の成熟度の影響:インフラ関連プロジェクトが主導的な地位を占める理由は、それが技術の成熟度に起因している。これらのプロジェクトは通常、時間の試練に耐えた技術とフレームワークの上に構築されており、開発の難易度とリスクを低減している。AI分野における「シャベル」に相当し、AIエージェントの開発と応用に対して堅実な基盤を提供している。
市場の需要の推進:もう一つの重要な要因は市場の需要です。消費者市場と比較して、企業市場はAI技術への需要がより切迫しており、特に運営効率を向上させ、コストを削減するソリューションを求めています。同時に、開発者にとっては、企業からのキャッシュフローが比較的安定しており、後続のプロジェクトの開発に有利です。
アプリケーションシーンの制限: 同時に、私たちはB2B市場におけるコンテンツ生成AIのアプリケーションシーンが相対的に限られていることに気づきました。その出力の不安定性のため、企業は生産性を安定的に向上させることができるアプリケーションを好みます。これにより、コンテンツ生成AIがプロジェクトライブラリに占める割合は比較的小さくなっています。
このトレンドは、技術の成熟度、市場の需要、そしてアプリケーションシーンの実際の考慮を反映しています。AI技術の進歩と市場の需要がさらに明確になるにつれて、このパターンは調整される可能性がありますが、基盤インフラは依然としてAIエージェントの発展の堅実な基盤となるでしょう。
! AIエージェントはWeb3+AIの命の恩人になれるか?
Web2のAIエージェントリーダーシッププロジェクト分析
私たちは現在のWeb2市場におけるAIエージェントプロジェクトについて深く掘り下げ、分析を行います。Character AI、Perplexity AI、Midjourneyの3つのプロジェクトを例に挙げます。
キャラクターAI:
製品紹介: Character.AIは、人工知能に基づく対話システムとバーチャルキャラクター作成ツールを提供しています。そのプラットフォームでは、ユーザーがバーチャルキャラクターを作成、訓練し、インタラクションすることができ、これらのキャラクターは自然言語で対話し、特定のタスクを実行することができます。
データ分析: Character.AIの5月の訪問者数は2.77億人で、プラットフォームは350万以上のデイリーアクティブユーザーを持ち、その大半は18歳から34歳の間にあり、若いユーザー層の特徴を示しています。Character AIは資本市場で素晴らしいパフォーマンスを発揮し、1.5億ドルの資金調達を完了し、評価額は10億ドルに達し、a16zが主導しました。
テクニカル分析:Character AIはGoogleの親会社Alphabetと非独占的な大規模言語モデルの使用に関するライセンス契約を締結しました。これはCharacter AIが独自の技術を採用していることを示しています。注目すべきは、同社の創業者であるNoam ShazeerとDaniel De FreitasがGoogleの対話型言語モデルLlamaの開発に関与していたことです。
パープレキシティAI:
製品紹介:Perplexityはインターネットから情報を収集し、詳細な回答を提供できます。引用と参考リンクを通じて情報の信頼性と正確性を確保し、ユーザーに教育し、追求やキーワード検索を行うよう導き、ユーザーの多様な検索ニーズに応えます。
データ分析: Perplexityの月間アクティブユーザー数は1000万人に達し、2月にはモバイルおよびデスクトップアプリのアクセスが8.6%の増加を実現し、約5000万人のユーザーを惹きつけました。資本市場では、Perplexity AIが最近6270万ドルの資金調達を発表し、評価額は10.4億ドルに達しました。リード投資家はダニエル・グロスで、参加者にはスタン・ドレッケンミラーとNVIDIAが含まれています。
技術分析:Perplexityが使用している主要なモデルは微調整されたGPT-3.5であり、オープンソースの大規模モデルを微調整した2つの大型モデル:pplx-7b-onlineとpplx-70b-onlineです。これらのモデルは専門的な学術研究や特定の分野の問い合わせに適しており、情報の真実性と信頼性を確保します。
ミッドジャーニー:
製品紹介: ユーザーはPromptsを使用してMidjourneyでさまざまなスタイルとテーマの画像を作成でき、写実的から抽象的な幅広い創作ニーズをカバーします。プラットフォームは画像の混合と編集も提供しており、ユーザーは画像の重ね合わせやスタイル転送を行うことができます。プラットフォームのリアルタイム生成機能により、ユーザーは数十秒から数の間に画像を生成できます。