Google Gemini Deep Research Pro Preview を Antigravity 拡張で試す — 時間・料金・サーバ側停止（061 続編）

2026.03.24 | 9 min read

今日の日付（閲覧日）

読み込み中…

061 続編 · Antigravity と Deep Research の実地メモ

前編（API・モデル仕様の公式整理）は brief061 へ。

公式リンク（Google AI for Developers）

Deep Research ガイド｜モデル仕様｜ Interactions API ｜料金（エージェント）

📝 記事について：
前回の記事（こちら）の続きとして、実際に手元で Deep Research Pro Preview を動かしてみました。
正直びっくりしたのが、「エージェント」がサーバ側でガリガリ動く仕組みなので、気軽なチャットのつもりだと料金が思った以上にかかるんです……。
せっかくだから、実際に体験して感じた「こういう仕組み・注意ポイントなんだよ！」というのを、びんぼうなくたびれたおっさん視点でまとめておきます。
この記事が、これからお試ししようとしている方がびっくりしないため＆お財布防御になるなら、筆者としては本望です……！

前編（brief061）で整理したとおり、Deep Researchは Google サーバ上で動く調査エージェントです。本稿は、Google Antigravity（VS Code 系）向けに自作した非公開の拡張機能から deep-research-pro-preview-12-2025 を叩いたときの体感に絞ります。

通常のチャット生成とは違い、時間がかかる・料金が高い・やめるならサーバへキャンセル要求を送るの三点が効きます。拡張のコードや VSIX は公開しません（安全のため）。

Core Insights

① 時間（早くても数分・難題は 10 分級も）
② 料金（エージェント分が積み上がる。筆者は常用しない）
③ 停止（ウィンドウを閉じるだけでは足りず、サーバへキャンセル要求が要る）

1 時間

待ちが「チャット」ではない

1 テーマでも早くて 3 分前後、内容が重いと10 分を超える感覚でした。裏では検索・読解・執筆ループが回っている、という理解で待つ必要があります。
2 料金

安い LLM 感覚は捨てる

筆者の体感では1 クエリあたりおおよそ 1 US ドル前後に感じることが多く、公式が示すタスク規模別の推定レンジ（例: 約 2〜5 ドル/タスク）とも整合し得ます。条件・時期で変動します。
3 停止

止めないと回り続ける

結果が出るまでサーバ側で処理が続くイメージです。キャンセル要求を送らないと止まりにくい恐れがあり、課金も伸び得ます。送信後も即停止は保証されません（後述）。

Antigravity 上の Deep Research 画面（実行〜完了）

テーマを入れて調査を開始し、停止で打ち切る、という最低限の UI です。状態行は completed / cancelled などが表示され、出力は長文・章立て・引用風のマーカが付いたレポート調になりやすい印象でした（お試しの軽いテーマでもボリュームが出ます）。

Antigravity の Deep Research パネル。テーマ入力・調査開始・停止・完了状態とレポート出力の例 — 図1: 実行結果の例。停止ボタンが「サーバ側のジョブをどう扱うか」とセットで重要です。

品質の印象（「学術っぽい深掘り」）

筆者が試した範囲では、学術論文や総説のような枠組みで横断的にまとめる傾向が強く、単なる要約より縦横に広い調査に寄りがちでした。その分、トークンと検索が嵩み、コストも比例して重くなる感覚です。用途を絞らないと「高いのに読みきれない」が起きやすいです。

自社データ検索（File Search）— 筆者は未検証

次の説明は筆者が File Search を Deep Research 連携で試した結果ではありません。
File Search（公式）と Deep Research ガイド（公式）に沿った整理です。

仕組み：社内ドキュメント等を File Search ストア に取り込み、リクエストの tools に type: "file_search" と file_search_store_names（例: fileSearchStores/my-store-name）を渡すと、モデルがそのストアを検索して応答に活かせる、という位置づけです。ストアの作成・アップロード・ドキュメント管理は公式に API が用意されています。
Deep Research との併用：公式の Deep Research ガイドには、Deep Research と file_search の併用は実験的（Experimental）である旨の注記があります。利用可否・挙動・警告は当該ページの最新版で確認してください。
注意：マルチモーダルやツール追加はコストとコンテキスト消費が増えやすい、という注意も Deep Research 側のベストプラクティスに含まれます（自社データを足すほど「安くない」方向に振れやすいイメージです）。

設定・履歴（モデル名とポーリング）

拡張側では deep-research-pro-preview-12-2025 を指定し、エンドポイントは generativelanguage.googleapis.com、ポーリング間隔やタイムアウトを設定できます。履歴には cancelled や failed、HTTP 400 なども並び、プレビュー期の揺らぎを実感しました。

Antigravity Settings と Deep Research パネル。モデル名・ポーリング・タイムアウトと履歴の cancelled 表示 — 図2: 設定と履歴。停止や失敗がログに残るので、「何がサーバ上で動いたか」を後から追いにくい分、ここを見る価値があります。

停止は「サーバへキャンセル」— 料金と直結

このエージェントは、クライアントを閉じても即停止とは限りません。
Interactions API へキャンセル要求（POST .../v1beta/interactions/{id}/cancel）を送るのが基本です。
ただし送信後も反映ラグやエラーがあり得るため、「送信 = 即停止」とは決めつけない運用が安全です。

1) リクエスト ID の保存（万が一対策）

開始レスポンスの id を保存しておくと、途中で UI が崩れても後から停止対象を追えます。
下の例では Set に保持しています。

// TypeScript: 開始時に interaction ID を保存
const activeIds = new Set<string>();

async function startDeepResearch(apiKey: string, userPrompt: string) {
  const res = await fetch('https://generativelanguage.googleapis.com/v1beta/interactions', {
    method: 'POST',
    headers: { 'Content-Type': 'application/json', 'x-goog-api-key': apiKey },
    body: JSON.stringify({
      agent: 'deep-research-pro-preview-12-2025',
      input: userPrompt,
      background: true,
      store: true
    })
  });
  if (!res.ok) throw new Error(await res.text());
  const json = await res.json();
  const interactionId = json?.id;
  if (interactionId) activeIds.add(interactionId);
  return interactionId;
}

2) 停止コード（サーバへ cancel 送信）

停止時は保存済み ID に対して /cancel を送ります。
成功した ID は管理対象から外し、失敗時は残して再試行できる形にします。

// TypeScript: 保存済み ID へ cancel を送る
async function cancelAll(apiKey: string) {
  const ids = Array.from(activeIds);
  await Promise.all(ids.map(async (id) => {
    const res = await fetch(
      `https://generativelanguage.googleapis.com/v1beta/interactions/${encodeURIComponent(id)}/cancel`,
      {
        method: 'POST',
        headers: {
          'Content-Type': 'application/json',
          'x-goog-api-key': apiKey
        }
      }
    );
    if (res.ok) activeIds.delete(id);
  }));
}

sequenceDiagram participant Ext as Extension participant Api as InteractionsAPI Ext->>Api: POST create background Api-->>Ext: id in_progress loop Polling Ext->>Api: GET interaction by id Api-->>Ext: status and outputs end Ext->>Api: POST cancel request by id Api-->>Ext: ack or error

Google AI Studio の利用額（表示の遅れ）

Gemini API キーを Google AI Studio 側で管理している場合、利用額画面でおおよその支出を追うことができます。筆者の画面では「Overages may occur during 10 minutes latency」のような注意があり、約 10 分前後の反映ラグがあり得る旨が示されていました（表示文言・実際の反映タイミングは環境や改修で前後し得るので、あくまで目安です）。高額エージェントほどラグ中の積み上がりを意識し、月次の費用上限（試験運用）を併用すると安全弁になります。

Google AI Studio の Gemini API 利用額画面。月次上限と利用額のバー、遅延に関する注意文言の例 — 図3: 利用額のモニタ例。数字は環境・日付により異なります。高コストエージェント利用時はここを定期的に見るのがおすすめです。

まとめ

Deep Research はサーバ上の長時間エージェント。チャット感覚の待ち時間・課金感覚は不適切。
止めるならキャンセル要求（反映にラグや失敗があり得る）。放置はコスト直結。
出力は厚いレポートになりやすいが、その分高い。筆者は常用せず、必要時のみ。
AI Studio 利用額＋月次上限で「見えない燃焼」を抑えるのが現実的。
API の型・制限の整理は引き続き brief061 を参照。

Artist's Perspective

「いやあ、正直言って、貧乏すぎるお財布にやさしくないっすね……。このLLM、ちと高杉晋作でした～～。実験してたらあっという間に料金が増えて、ふと見たら４０円アップ、こりゃ無理だと……。３、４リクエストで８０円とか、もう泣くしかない……。だからこの拡張は、さすがに危険なので、公開はやめときます～～～。でも、学術論文とかの精度は、ほんと恐ろしいレベルかもしれません……。学術や厳密な開発レベルで制作しているなら、これは、最強かもしれません。。。。。GoogleAIPROプランの１０ドル以内になんとか、今回実験収まったのは、幸いです。」

データソース・参考リンク

本記事は以下の情報源を参考にしています。内容の正確性については、必ず元のデータソースをご確認ください。

関連シリーズ（Tech Briefing 056-062）

brief056 ｜ brief057 ｜ brief058 ｜ brief059 ｜ brief060 ｜ brief061 ｜ brief062