2025年も止まらない「AIエージェント」開発、主体が全アプリケーションに拡大

2025年に入り、エージェントは再度注目を集めています。一方で、「エージェント」という言葉は今日非常に多義的であり、文脈によって意味が大きく変わります。前回エージェントという言葉が流行ったのは2023年だったのですが、少し間を置いての再登場です。

これまでのエージェントと今日のエージェントでは何が変わったのでしょうか。

前回

に続き、従来との定義の違いや現在のAI文脈におけるエージェントの位置づけを整理してみたいと思います。

あらゆるアプリケーションでAIネイティブな実装が可能に

写真

2025年にエージェントが再度注目を集めるようになった要因はいくつか考えられますが、まずは2024年に登場したマルチモーダルLLMの進化が大きいと考えられます。マルチモーダルLLMは、

テキストだけでなく画像や音声など、複数のモダリティを統合して処理することが可能

です。

これにより、従来のテキストベースのタスクだけでなく、画像認識や音声認識など、より多様なタスクに対応できるようになりました。例えば、画像を入力として受け取り、その内容を分析してテキストを生成する、といったことが可能です。

PCの画面をスクリーンキャプチャし、その画像をマルチモーダルLLMに入力として渡し、画像の内容から押すべきボタンやメニューの位置を特定。その後、マウスやキーボードの操作を再現する、といったような手順でアプリケーションの操作が可能になります。

続きを読むには無料会員登録が必要です。

残り 1139 / 1672 文字

KAIGI IDにログインすると、すべての記事が無料で読み放題となります。

登録に必要な情報は簡単な5項目のみとなります

「AdverTimes. (アドタイ)」の記事はすべて無料です

会員登録により、興味に合った記事や情報をお届けします

岡田太一(sync.dev Technical Director/Visualization Artist)
岡田太一(sync.dev Technical Director/Visualization Artist)

CG会社のDigital Artist からキャリアを開始。ポストプロダクションを経て、現在はビジュアルクリエイティブ領域にてテクニカルディレクションを担当。得意な分野は映像編集、ビデオ信号とリアルタイム合成、トラッキング関連など。2022年から『ブレーン』で連載中。

岡田太一(sync.dev Technical Director/Visualization Artist)

CG会社のDigital Artist からキャリアを開始。ポストプロダクションを経て、現在はビジュアルクリエイティブ領域にてテクニカルディレクションを担当。得意な分野は映像編集、ビデオ信号とリアルタイム合成、トラッキング関連など。2022年から『ブレーン』で連載中。

この記事の感想を
教えて下さい。
この記事の感想を教えて下さい。

このコラムを読んだ方におススメのコラム

    タイアップ