AIエージェントが大流行
最近、新しく登場する生成AI関連のサービスのほとんどがAIエージェントを名乗っているのではないだろうか? そのくらいAIエージェントという単語を目にする機会が多い。もはや流行と言ってもいいだろう。一年前はチャットボットに勢いがあったが、話題はすっかりAIエージェントに持っていかれた格好だ。チャットボットは企画書やメールは作ってくれるが、AIエージェントはこれまで人に頼んでいたようなもっと現実に関わる作業を行なってくれるのだ。
日本でこれだけAIエージェントが話題になる背景には、米国などと比較した生成AI活用率の低さがある。単に生成AIを経験しようというのではなく、導入によって業務の効率化を目指すのであれば、いちいちプロンプトを考えて何度も生成AIとやりとりをするのではなく、作業の最終的な目標を与えれば、AIが現状を踏まえた計画を考え、判断、作業を行って結果を返してくれるAIエージェントが望ましい。
ビジネス系ではチームの共同作業でファイル管理やドキュメント処理に使えるAnthropicのClaude Coworkや、営業支援などに利用できるSalesforceのAgentforce 360など、もともと生成AIサービスに取り組んできた企業が提供するAIエージェントは評価も高く企業導入が進んでいる。Open AIのOpen AI OperatorやGoogleのGoogle Gemini AI Agent などWebを使用して複雑な操作をまとめて実行できるものは個人利用でも注目されている。
一方で、AIエージェントを名乗るサービスの中には、これは本当にAIエージェントと呼べるのだろうかと首を捻るものも少なくない。個別の命令に解答した後で次にどうしますかと尋ねてくるのでは、チャットボットと何が違うのだろうか?
人工知能を使用する「エージェント」は新しい考え方ではない。1995年に出版された“Artificial Intelligence: A Modern Approach”(邦題『エージェントアプローチ 人工知能』)という書籍で著者のS. ラッセル と P. ノービックは、「ある環境の中で知覚と自律的な行動を通じて目的を達成しようとする主体」をエージェントと呼んだ。もちろんこの時代に生成AIは存在しなかったし、エージェント自体あくまでも概念の話だった。当時は「エージェントAI」と呼ばれていたが、自律的に作業をする現在のAIエージェントが登場してからは、どちらもAIエージェントと呼ばれている。
現在のAIエージェントはLLMをエンジンにして、実際に稼働しているが、課題を解決すべき環境、状況を把握し、指示を遂行するために単純なifの分岐では済まない判断を行う、そして作業を行なった結果が目的にそぐわなければ別の方法を試す必要がある。このときユーザーにいちいちプロンプトの入力を求めるのではなく、AI自身がまず一つの方法を選択し他のアプリを呼び出すなどしてトライした後で、うまくいかなければ別の方法を試すという行動のループを実現できるかどうかを、AIエージェントは問われている。
例えばAIエージェントに東京-大阪出張の交通機関の手配を指示した時、最初にAIが考えて選択した移動法の新幹線が満席だったら、飛行機の手配に切り替えて実行するといった判断と作業が必要になる。
チャットボットでも時にはAIエージェント並の成果を出せる時もあるだろうが、どこまで自律的に判断して作業を行えるかで、大きな違いが出てくるだろう。チャットボットよりは少しはましだが、AIエージェントと呼ぶには判断が不十分なサービスも見られる。
もちろん、AIの判断が常に正しいとは限らないので、作業の結果に対して人間の判断は必要だが、これは人間同士で上司が部下に作業を任せる場合も同様だろう。

AIエージェント利用も一つの選択肢にしたい
こうした作業のための利用を目的とするAIエージェントの他に、ユーザーが自分の目的のためにエージェントを作成する基盤の提供もAIエージェントサービスと呼ばれることがある。Microsoft 365 Copilotのエージェントビルダーなどがわかりやすいだろう。
AIエージェントが実行する作業にはさまざまなレベルがあり、一般的な使いやすさを第一にしているものもあれば、先に設定を必要とするものもある。自分で作成しなくても選択するだけで必要な解答を得られるならその方が楽だが、Microsoft 365のようにそれぞれの利用者に長年のデータ資産が蓄積され、多様な企業文化の中で利用されている場合には、そこから得られる解答も豊富で多岐にわたる。欲しい解答の全てをメニューとしてAIエージェントが用意できるわけではなく、企業の業務習慣などに適した、より自由度の高い解答を得るためには、自作の方が向いている場合もある。

AIエージェントではないが、Google GeminiのNotebook LMを見ると、画面を3分割し、左側に元となるデータをアップロードし、中央のウィンドウで要約などをチャットで指示し、右ウィンドウでは出力の形式を選択することで一連の作業を完結する。ユーザーが何を自分で判断し何をAIに任せるかの整理が一目でわかる。選ぶという人の役割を明確にしてくれているので迷うことが少ない。AIを活用する上で、こうした人の思考を邪魔しない設計も重要になる。

さまざまなビジネス上の作業で人手では考えられない高効率を実現してくれるAIエージェントだが、人間の判断、選択により高い自由度を与えたい作業では、必ずしも第一の選択肢とは限らない。
AIエージェントという売り文句だけにいたずらに飛び付かないで、AIを利用して得たい結果とそのゴールまでの道筋をもう一度見直し、業務に適したAIの利用ということを考えてみるきっかけにしてみてはどうだろうか? その上で選択したAIエージェントなら、きっと驚くほどの成果を上げてくれるはずだ。


