AIがアプリを操作する時代へ ― Google・Anthropic・Notionが同じ週に動いた理由と、私たちへの影響

AIがアプリを操作する時代へ ― Google・Anthropic・Notionが同じ週に動いた理由と、私たちへの影響

カテゴリ

記事タイプ

レベル

関連AIツール

ページに広告が含まれる場合があります。
Picture of 山原 慎也
山原 慎也

AIリスキル株式会社 代表取締役。日本最大級の生成AIメディア「AIツールギャラリー(累計100万PV超)」を運営し、これまでに600以上のAIツールを検証、1000以上の記事を執筆。
大阪を拠点に、法人向けの生成AI顧問や研修、各種生成AIサービスを提供しています。

「Uberを呼んで」とスマホに話しかけると、AIがUberアプリを開いて目的地を入力し、配車手配を進めてくれる。そんな未来が、2026年2月の最終週に一気に現実味を帯びました。

2月24日から25日にかけて、Google、Anthropic、Notionという3社が立て続けに「AIによるアプリ操作」に関する発表を行っています。Googleはスマホアプリの自動操作、AnthropicはPC操作AIのスタートアップ買収、Notionは自社ワークスペース内での自律エージェント。方向性はそれぞれ違いますが、「AIがチャットで答えるだけの時代は終わりつつある」という点では共通しています。

この記事では、3つの動きを整理しながら、AIエージェントによるアプリ操作が私たちの生活にどう関わってくるのかを見ていきます。

チャット型AIから「操作するAI」へ ― 何が変わったのか

AIとの付き合い方は、この2年ほどで段階的に変わってきました。最初は質問に答えてくれるだけだったAIが、画像や文書を読み取り、今では実際にアプリを動かすところまで来ています。

AIの進化ステップ

2023年: チャットで質問に回答
2024年: 画像・文書を理解
2025年: 検索・分析を自動実行
2026年: アプリを直接操作

2024年10月にAnthropicが「Computer Use」(AIがパソコンの画面を見て操作する技術)を発表したとき、ベンチマーク(標準テスト)のスコアは15%未満でした。それが2026年2月現在、同じテスト(OSWorld)で72.5%にまで上がっています。16ヶ月で約5倍。人間と同じ画面を見てマウスやキーボードを操作する精度が、急速に実用レベルに近づいているということです。

Gartnerの予測によれば、2026年末までに企業向けアプリの40%にAIエージェントが組み込まれる見通しです(2025年時点では5%未満)。消費者向けスマホアプリでも、同じ流れが始まりました。

AIエージェントを実際に使ってみる

Geminiを試す Claudeを試す

※いずれも無料プランあり

3社の発表を並べてみると、アプローチがまるで違う

同じ週に出た3つのニュースですが、狙いも技術的な仕組みもかなり異なります。それぞれの特徴を整理してみます。

項目 Google Gemini Anthropic Claude Notion
発表日 2月25日 2月25日 2月24日
操作対象 スマホアプリ(Uber等) PC全般(MacBook) Notion内ワークスペース
仕組み 端末内の仮想ウィンドウ クラウド上のPC操作 API連携+自社AI
ユーザーの承認 決済時に必須 タスク完了前に確認 トリガー設定時に定義
利用可能時期 2026年3月(ベータ) 研究開発段階 2026年2月24日〜
対象地域 米国・韓国 未公開 グローバル

Googleのアプローチは「スマホの中で完結する」のが特徴です。Geminiがアプリを操作するとき、端末内に「セキュア仮想ウィンドウ」と呼ばれる隔離された画面を作り、その中だけでタップやスクロールを行います。ほかのアプリやデータにはアクセスしません。たとえば「美術館までUberを呼んで」と指示すると、GeminiがUberアプリを仮想ウィンドウ内で起動し、目的地を入力して配車タイプを選択。最後の「注文確定」ボタンだけは、ユーザー自身がタップする仕組みです。対応アプリはUber、DoorDash、Grubhub、Instacart、Lyft、McDonald’s、Starbucksなど。

一方、Anthropicは2月25日にシアトルのスタートアップVercept社を買収しました。Verceptは「Vy」というサービスを運営していて、クラウド上のMacBookをAIが遠隔操作するという大胆なアプローチを取っていました。画面を「見て」ボタンをクリックし、フォームに入力する ― APIがなくても、人間と同じように操作できるのが強みです。AnthropicのClaude Computer Useのベンチマーク改善(15%→72.5%)を考えると、この買収でさらに精度が上がる可能性があります。

Notionは少し毛色が違います。2月24日に発表された「Custom Agents」(バージョン3.3)は、Notion内で24時間自動的に動くAIエージェントです。Slack、メール、カレンダーと連携して、タスクの振り分けや日報作成、受信トレイの整理などを自動化します。汎用的なアプリ操作ではなく、自社のエコシステム内に閉じた自動化という方向性です。

実生活のどんな場面で使えるのか

「AIがアプリを操作する」と聞いても、実感が湧きにくい方もいると思います。具体的にどんな場面で役に立つのか、ユースケースごとに見てみます。

やりたいこと別 ― どのAIが向いているか

「毎朝のスタバ注文を自動化したい」 Gemini
「帰り道にUberを手配しておいてほしい」 Gemini
「Webブラウザで情報収集して資料にまとめたい」 Claude
「複数アプリをまたいだ業務フローを自動化したい」 Claude
「チームのSlack通知を整理して日報を作りたい」 Notion
「プロジェクトのタスク振り分けを毎日自動でやりたい」 Notion

Geminiは「スマホで日常的に繰り返す操作」に向いています。毎朝のコーヒー注文や、帰宅時の配車手配のように、手順が決まっていてお金が絡むもの。決済の最終確認はユーザーが行うので、意図しない購入を防げます。Google公式ブログでは「to-doリストをGeminiに渡す」使い方が紹介されていて、複数のアプリにまたがるタスクを順番にこなしてくれるイメージです。

Claudeの方向性は「PCでの知的作業の代行」です。画面を見てマウスとキーボードを操作するので、API連携がないソフトでも動かせます。たとえば社内の経費精算システムにログインして、フォームに入力して提出するといった使い方が想定されています。ただし現時点ではまだ研究開発段階で、一般ユーザーが気軽に使える状況ではありません。

Notion Custom Agentsは、すでにNotionを使っているチームにとって即戦力になりそうです。ベータ開始からわずか数日で21,000以上のカスタムエージェントが作られたと発表されています。2026年5月3日までは無料で試せるので、Notionユーザーなら触ってみる価値はあります。

AIエージェントの最新動向をチェック

Geminiを試す Claudeを試す

※Geminiのアプリ操作機能は2026年3月以降、Pixel 10/Galaxy S26で提供開始予定

セキュリティとプライバシーの課題 ― 楽観視は禁物

AIにアプリを操作させるということは、自分のスマホやPCを「他人に触らせる」のとほぼ同じ意味です。各社とも対策を講じていますが、現時点で解決しきれていない問題があります。

知っておくべきリスク

データの流出リスク: AIがアプリを操作する過程で、画面上の個人情報(住所、メールアドレス、決済情報など)を読み取る可能性があります。Googleの仮想ウィンドウ方式はアクセス範囲を限定していますが、操作中のアプリ内の情報はAIに見えている状態です。

誤操作のリスク: AIの操作精度は向上していますが、72.5%というスコアは裏を返せば約4回に1回は失敗する可能性があるということです。金銭が絡む操作では特に注意が必要です。

企業のデータガバナンス: 2026年のセキュリティ調査によると、AIエージェントを正式なIT承認のもとで運用している組織はわずか14.4%。多くの企業で、AIエージェントの権限管理が追いついていません。

Googleはこの問題に対して、仮想ウィンドウ内でのみ操作を行い、決済の最終確認をユーザーに委ねるという設計で対応しています。AnthropicもClaude Computer Useに「human-in-the-loop」(人間が承認するステップ)を組み込んでいます。ただ、セキュリティ専門家からは「AIエージェントを独立したIDとして管理すべき」という指摘が出ており、現状のほとんどのサービスでは対応できていません。

個人で使う場合は、まず金額の小さいタスク(コーヒーの注文など)から試してみて、挙動を確認しながら段階的に利用範囲を広げるのが現実的な使い方です。

この流れはどこへ向かうのか

2026年2月最終週の3つの発表は、いわば「AIエージェント競争の幕開け」と言えます。ただし、各社が目指しているゴールは微妙に異なります。

AIとの付き合い方の変化

これまで

ユーザーの操作

アプリを自分で開く → 検索する → 選ぶ → 入力する → 確定する → 次のアプリへ移動 → 繰り返し

これから

AIエージェント活用

やりたいことを伝える → AIが複数アプリをまたいで作業 → 最終確認だけユーザーが行う

Googleはスマートフォンという圧倒的なユーザーベースを持っています。Pixel 10やGalaxy S26に標準搭載されることで、特別な設定なしにAIエージェントが使える環境を作ろうとしています。Anthropicはクラウド経由のPC操作で、より複雑な業務フローの自動化を狙っています。Notionは自社プラットフォーム内の効率化に集中することで、既存ユーザーへの価値提供を優先する戦略です。

Deloitteの2026年テクノロジートレンドレポートでは、エージェント型AIが「2026年最大のテクノロジートレンド」として取り上げられています。IDCの予測によると、2026年末までに企業向けアプリの80%にAIエージェントが搭載される見込みです。消費者向けも含めると、年内に私たちの日常生活にも変化が見え始めるでしょう。

とはいえ、現時点ではまだベータ版や研究段階のものが多く、「すべてが自動化される」わけではありません。Geminiのアプリ操作は3月から米国・韓国限定で始まり、日本への展開時期は未定です。Anthropicの技術もまだ研究開発フェーズ。実際に私たちが日常的に使えるようになるまでには、もう少し時間がかかります。

今のうちにできること

GeminiやClaudeの無料プランでAIとのやり取りに慣れておくと、アプリ操作機能が日本で使えるようになったときにスムーズに移行できます。Notionを使っているなら、Custom Agentsの無料期間(5月3日まで)に試してみるのもおすすめです。

AIエージェントに触れてみる

Geminiを試す Claudeを試す

※Geminiはスマホ・PC両方で無料利用可。Claudeは無料プランあり

保存:
共有:
Picture of 山原 慎也
山原 慎也

AIリスキル株式会社 代表取締役。日本最大級の生成AIメディア「AIツールギャラリー(累計100万PV超)」を運営し、これまでに600以上のAIツールを検証、1000以上の記事を執筆。
大阪を拠点に、法人向けの生成AI顧問や研修、各種生成AIサービスを提供しています。

関連記事

人気記事

AI音声入力ツール「Aqua Voice」を使って作業効率を5倍にする方...
Claude Code開発者から学ぶ13の使いこなし術|実際のセットアッ...
Akoolは安全?危険性は?商用利用のルールと合わせて解説
【2025年最新】ManusでLP・Webアプリを作る方法と注意点まとめ
AI画像生成アプリ「Pictor」の使い方を解説!感想も紹介
AI音声入力ツール「Aqua Voice」を使って作業効率を5倍にする方...
Akoolは安全?危険性は?商用利用のルールと合わせて解説
中国発Ropet、各国で大反響。日本初「LOVOT」のパクリ説も浮上。
【2025年最新】ManusでLP・Webアプリを作る方法と注意点まとめ
AI画像生成アプリ「Pictor」の使い方を解説!感想も紹介
【Windows】ChatGPTのデスクトップアプリをインストールする方法
AI音声入力ツール「Aqua Voice」を使って作業効率を5倍にする方...
AI画像生成アプリ「Pictor」の使い方を解説!感想も紹介
LLMとは?基本から応用まで5つのポイントをわかりやすく解説しま...
Feloでプレゼン資料を自動生成する方法!機能紹介と使い方ガイド

関連記事

上部へスクロール
AIツールギャラリーへのフルアクセスをお楽しみください!