Let's be honest - everyone is talking about Model Context Protocol (MCP) as if it's the next big revolution in AI. Tech blogs are buzzing, conferences are filled with MCP panels, and developers are rushing to implement it. But here's my take: MCP isn't such a big deal. It's just another protocol in the evolution of agent tools.
エージェントツール自体は巨大な取引であり、重大なセキュリティリスクを伴いますが、MCPは誇張されているのでしょうか? 必ずしもそうではありません。 それは実装のひとつであり、より長く進化的な道のりの一歩です。
この記事では、MCPを通して、エージェントツール(プロトコルに関係なく)の本当のリスクについて議論し、現在レーダーの下で飛んでいるx402のようなプロトコルで次に向かう場所を探索しますが、実際にはより革命的な可能性があります。
The Developer Story: Evolution of Agent Tools(エージェント・ツールの進化)
少し振り返り、どのようにここに到着したかを見てみましょう。古い時代(そして古い時点で、私はわずか数年前のこと)では、AIエージェントがいくつかのツールを使用することを望んでいた場合 - ウェブ検索機能を言えば - あなたはプロバイダーとアカウントを作成し、クレジットカードを入れ、APIキーを取得し、その特定のツールを統合するためにカスタムコードを書く必要がありました。
それからMCPが来た。突然、これらのサーバーはすべてコミュニケーションのための共通のプロトコルに合わせることができた。今では、それぞれのツールのためのAPIキーを持つ1つのMCPクライアントを持つことができます。 それはより良いですか? 絶対に。 それは革命的ですか? いいえ、しかしそれは重要で効果的な進歩です。 僕はまだMCPクライアント内の各ツールを構成する必要があります。 それは、カスタマイズされたコードを書くことや各ツールの依存性をインストールするよりも良い方法です。
MCPが実際にやったことは、エージェントがツールと話す方法を標準化することでした。それは役に立ちますが、それは誰もが行うゲーム変換器ではありません。それは私たちがエージェントシステムを構築する方法の自然な進歩にすぎません。
このように考えてください:LLM自体は限られた意味で自律的です - それはテキストを生成することができますが、それはそれについてです。
しかし、MCP でさえ、私はまだボトルネックです。私はそれらのツールをすべて構成し、それらの API キーをすべて管理し、エージェントがどのツールにアクセスできるかを決定する必要があります。
セキュリティストーリー:エージェントツールの本当のリスク
セキュリティの観点から言えば、MCP自体が問題であるのではなく、エージェントが今や達成できる規模である。そして、このスケールを上回るたびに、リスクが増加するという意味です。
私のエージェントがウェブにアクセスするとき、そこには多くのリスクがありますが、本当の危険は、エージェントがすべてのリスクを家に持ち帰るということです - すべての不正情報、迅速な注入の脆弱性、偏見、セキュリティとセキュリティの両方の問題。
例えば、Redashのようなツールを通じて当社のデータベースにアクセスできるエージェントを持っているとします。私は、あるトピックに関するウィキペディアページにアクセスし、情報を引っ張り、それがどのように機能するかを理解し、その情報に基づいてJiraチケットを作成し、当社のデータベースからいくつかの関連データを引っ張ります。
無邪気に聞こえるでしょう? しかし、誰かがそのウィキペディアページに隠されたコンテンツを挿入した場合はどうでしょうか? テキストの後ろに、エモジや目に見えない文字を使用して隠されているため、あなたが人間として見るコンテンツさえありません。 エージェントは、悪意のある指示を含むこの隠されたコンテンツを見たり処理したりすることがあります。 突然、私のエージェントは私のサーバー上でコードを実行している - 潜在的に悪意のあるコード - すべては、ウェブページを訪問したためです。
これは理論的なリスクではありません。これは今起こっています。そして問題はMCPではなく、エージェントがツールにアクセスできるという事実です。
あなたが2人の従業員を持っている場合、あなたは彼らを安全に意識するように訓練することができます。もしあなたが彼らにかわいい猫や子犬を含むメールを送信するが、マルウェアを含む場合、彼らは、おそらくそれをクリックしないでしょう。
私たちのエージェントがより自律的になるほど、このリスクは増加します。MCPのようなプロトコルは、エージェントをより多くのツールに接続しやすくすることによって、この傾向を加速させています。
MCPを超えて:エージェントプロトコルの次なる進化
誰もがMCPに執着している一方で、レーダーの下で飛んでいる何かがさらに興味深いことが起きている。
では、x402とは何ですか?それは、AgentsがAPIやAgent Toolsにアクセスするのを助けるCoinbaseによって開発されたプロトコルです「Pay as you go」モデルで考えてください。
これが重要な理由です: x402 では、それぞれの MCP サーバとツールを個別に構成するのではなく、エージェントにお金を与え、必要なツールを見つけて使用させることができます。
プロトコルは、常に正確に1米ドルを価値とする仮想通貨のstablecoinであるUSDCに基づいて構築されています。ビットコインとその波動性とは異なり、USDCは一貫した価値を維持し、自動化されたプログラム的な支払いに最適です。
このプロトコルは実際には以前から原始的な形で存在していましたが、悪く実装されていなかったため、誰もそれを使用していませんでした。今、Coinbaseはそれを修正し、暗号化に基づいて構築し、Stripe、Anthropic、AWSのような主要なプレイヤーが関与しています。
開発者の視点から見ると、これはすべてを変えます。MCPクライアントの各ツールを構成する現在の頭痛の代わりに、私は単にエージェントを資金調達し、残りを処理させることができます。
これを視点に置こう:LLMは自律的ですが、テキストだけを書くことができます。RAGを持つエージェントはあなたのデータを読み取ることができます。ツールを持つエージェントはウェブを検索したり、電子メールを送信するなどのアクションを取ることができます。
イノベーションとセキュリティのバランス
だから、これがどこに残るのか? 私たちはMCPを持っていますが、それは有用ですが、誇張されています。私たちは、エージェントの動作方法を根本的に変えることができるx402のような新興プロトコルを持っています。
現実は、私たちは誰もが意識し、次の大きな破壊が起こった後ではなく、今すぐセキュリティプロセスに取り組む必要があるということです。しかし、ここに鍵があります:セキュリティはイノベーションをブロックすることはできません。
私たちが必要とするのは、開発を遅らせない自動化されたセキュリティプロセスです. リスクプロファイルに基づいてエージェントのアクションを自動的に承認または拒否するツール. エージェントがあまりに許可を持っている場合を検出し、それらをより制限されたアクセスを有する異なるエージェントに分離することを提案するシステムです. インテグレーション前に潜在的に悪意のあるMCPサーバーを識別できるスキャナー。
あなたのエージェントがウェブブラウジングとデータベースの両方にアクセスできる場合、それはリスクベクターです。それらの機能は、制御されたチャネルを通じて相互に通信する別々のエージェントによって処理されるべきかもしれません。
私が見ている未来は、セキュリティが最初から開発プロセスに組み込まれており、アプリケーションのプロトタイプ化を含め、後で考えるのではなく、開発者がそれらを遅らせることなく安全な選択をするのを助ける自動ツールを持っており、それらが存在する非常に実際のリスクを軽減しながら、ますます自律的なエージェントの力を受け入れることができます。
MCPは革命ではなく、進行中の進化の一歩に過ぎません。本当の革命は、私たちがエージェントの自律性について考える方法と、これらのますます強力なシステムを守る方法で起こっています。
エージェントツールの未来は信じられないほどエキサイティングですが、リスクも伴います。
- 書いた Bar-El Tayouri, Head of Mend AI atふるさと