Deep Research Pro Preview を Antigravity 拡張から試した記事のサムネイル

Google Gemini Deep Research Pro Preview を Antigravity 拡張で試す — 時間・料金・サーバ側停止(061 続編)

| 9 min read

今日の日付(閲覧日)

061 続編 · Antigravity と Deep Research の実地メモ

前編(API・モデル仕様の公式整理)は brief061 へ。

公式リンク(Google AI for Developers)

Deep Research ガイド モデル仕様 Interactions API 料金(エージェント)

📝 記事について:
前回の記事(こちら)の続きとして、実際に手元で Deep Research Pro Preview を動かしてみました。
正直びっくりしたのが、「エージェント」がサーバ側でガリガリ動く仕組みなので、気軽なチャットのつもりだと料金が思った以上にかかるんです……。
せっかくだから、実際に体験して感じた「こういう仕組み・注意ポイントなんだよ!」というのを、びんぼうなくたびれたおっさん視点でまとめておきます。
この記事が、これからお試ししようとしている方がびっくりしないため&お財布防御になるなら、筆者としては本望です……!

前編(brief061)で整理したとおり、Deep ResearchGoogle サーバ上で動く調査エージェントです。本稿は、Google Antigravity(VS Code 系)向けに自作した非公開の拡張機能から deep-research-pro-preview-12-2025 を叩いたときの体感に絞ります。

通常のチャット生成とは違い、時間がかかる・料金が高い・やめるならサーバへキャンセル要求を送るの三点が効きます。拡張のコードや VSIX は公開しません(安全のため)。

Core Insights

時間(早くても数分・難題は 10 分級も)
料金(エージェント分が積み上がる。筆者は常用しない)
停止(ウィンドウを閉じるだけでは足りず、サーバへキャンセル要求が要る)

  • 1 時間

    待ちが「チャット」ではない

    1 テーマでも早くて 3 分前後、内容が重いと10 分を超える感覚でした。裏では検索・読解・執筆ループが回っている、という理解で待つ必要があります。

  • 2 料金

    安い LLM 感覚は捨てる

    筆者の体感では1 クエリあたりおおよそ 1 US ドル前後に感じることが多く、公式が示すタスク規模別の推定レンジ(例: 約 2〜5 ドル/タスク)とも整合し得ます。条件・時期で変動します。

  • 3 停止

    止めないと回り続ける

    結果が出るまでサーバ側で処理が続くイメージです。キャンセル要求を送らないと止まりにくい恐れがあり、課金も伸び得ます。送信後も即停止は保証されません(後述)。

Antigravity 上の Deep Research 画面(実行〜完了)

テーマを入れて調査を開始し、停止で打ち切る、という最低限の UI です。状態行は completed / cancelled などが表示され、出力は長文・章立て・引用風のマーカが付いたレポート調になりやすい印象でした(お試しの軽いテーマでもボリュームが出ます)。

Antigravity の Deep Research パネル。テーマ入力・調査開始・停止・完了状態とレポート出力の例
図1: 実行結果の例。停止ボタンが「サーバ側のジョブをどう扱うか」とセットで重要です。

品質の印象(「学術っぽい深掘り」)

筆者が試した範囲では、学術論文や総説のような枠組みで横断的にまとめる傾向が強く、単なる要約より縦横に広い調査に寄りがちでした。その分、トークンと検索が嵩み、コストも比例して重くなる感覚です。用途を絞らないと「高いのに読みきれない」が起きやすいです。

自社データ検索(File Search)— 筆者は未検証

次の説明は筆者が File Search を Deep Research 連携で試した結果ではありません
File Search(公式)Deep Research ガイド(公式) に沿った整理です。

  • 仕組み:社内ドキュメント等を File Search ストア に取り込み、リクエストの toolstype: "file_search"file_search_store_names(例: fileSearchStores/my-store-name)を渡すと、モデルがそのストアを検索して応答に活かせる、という位置づけです。ストアの作成・アップロード・ドキュメント管理は公式に API が用意されています。
  • Deep Research との併用:公式の Deep Research ガイドには、Deep Research と file_search の併用は実験的(Experimental)である旨の注記があります。利用可否・挙動・警告は当該ページの最新版で確認してください。
  • 注意:マルチモーダルやツール追加はコストとコンテキスト消費が増えやすい、という注意も Deep Research 側のベストプラクティスに含まれます(自社データを足すほど「安くない」方向に振れやすいイメージです)。

設定・履歴(モデル名とポーリング)

拡張側では deep-research-pro-preview-12-2025 を指定し、エンドポイントは generativelanguage.googleapis.com、ポーリング間隔やタイムアウトを設定できます。履歴には cancelledfailed、HTTP 400 なども並び、プレビュー期の揺らぎを実感しました。

Antigravity Settings と Deep Research パネル。モデル名・ポーリング・タイムアウトと履歴の cancelled 表示
図2: 設定と履歴。停止や失敗がログに残るので、「何がサーバ上で動いたか」を後から追いにくい分、ここを見る価値があります。

停止は「サーバへキャンセル」— 料金と直結

このエージェントは、クライアントを閉じても即停止とは限りません。
Interactions API へキャンセル要求POST .../v1beta/interactions/{id}/cancel)を送るのが基本です。
ただし送信後も反映ラグやエラーがあり得るため、「送信 = 即停止」とは決めつけない運用が安全です。

1) リクエスト ID の保存(万が一対策)

開始レスポンスの id を保存しておくと、途中で UI が崩れても後から停止対象を追えます。
下の例では Set に保持しています。

// TypeScript: 開始時に interaction ID を保存
const activeIds = new Set<string>();

async function startDeepResearch(apiKey: string, userPrompt: string) {
  const res = await fetch('https://generativelanguage.googleapis.com/v1beta/interactions', {
    method: 'POST',
    headers: { 'Content-Type': 'application/json', 'x-goog-api-key': apiKey },
    body: JSON.stringify({
      agent: 'deep-research-pro-preview-12-2025',
      input: userPrompt,
      background: true,
      store: true
    })
  });
  if (!res.ok) throw new Error(await res.text());
  const json = await res.json();
  const interactionId = json?.id;
  if (interactionId) activeIds.add(interactionId);
  return interactionId;
}

2) 停止コード(サーバへ cancel 送信)

停止時は保存済み ID に対して /cancel を送ります。
成功した ID は管理対象から外し、失敗時は残して再試行できる形にします。

// TypeScript: 保存済み ID へ cancel を送る
async function cancelAll(apiKey: string) {
  const ids = Array.from(activeIds);
  await Promise.all(ids.map(async (id) => {
    const res = await fetch(
      `https://generativelanguage.googleapis.com/v1beta/interactions/${encodeURIComponent(id)}/cancel`,
      {
        method: 'POST',
        headers: {
          'Content-Type': 'application/json',
          'x-goog-api-key': apiKey
        }
      }
    );
    if (res.ok) activeIds.delete(id);
  }));
}
sequenceDiagram participant Ext as Extension participant Api as InteractionsAPI Ext->>Api: POST create background Api-->>Ext: id in_progress loop Polling Ext->>Api: GET interaction by id Api-->>Ext: status and outputs end Ext->>Api: POST cancel request by id Api-->>Ext: ack or error

Google AI Studio の利用額(表示の遅れ)

Gemini API キーを Google AI Studio 側で管理している場合、利用額画面でおおよその支出を追うことができます。筆者の画面では「Overages may occur during 10 minutes latency」のような注意があり、約 10 分前後の反映ラグがあり得る旨が示されていました(表示文言・実際の反映タイミングは環境や改修で前後し得るので、あくまで目安です)。高額エージェントほどラグ中の積み上がりを意識し、月次の費用上限(試験運用)を併用すると安全弁になります。

Google AI Studio の Gemini API 利用額画面。月次上限と利用額のバー、遅延に関する注意文言の例
図3: 利用額のモニタ例。数字は環境・日付により異なります。高コストエージェント利用時はここを定期的に見るのがおすすめです。

まとめ

  • Deep Research はサーバ上の長時間エージェント。チャット感覚の待ち時間・課金感覚は不適切。
  • 止めるならキャンセル要求(反映にラグや失敗があり得る)。放置はコスト直結。
  • 出力は厚いレポートになりやすいが、その分高い。筆者は常用せず、必要時のみ。
  • AI Studio 利用額+月次上限で「見えない燃焼」を抑えるのが現実的。
  • API の型・制限の整理は引き続き brief061 を参照。

Artist's Perspective

「いやあ、正直言って、貧乏すぎるお財布にやさしくないっすね……。このLLM、ちと高杉晋作でした~~。実験してたらあっという間に料金が増えて、ふと見たら40円アップ、こりゃ無理だと……。3、4リクエストで80円とか、もう泣くしかない……。だからこの拡張は、さすがに危険なので、公開はやめときます~~~。でも、学術論文とかの精度は、ほんと恐ろしいレベルかもしれません……。 学術や厳密な開発レベルで制作しているなら、これは、最強かもしれません。。。。。GoogleAIPROプランの10ドル以内になんとか、今回実験収まったのは、幸いです。」

データソース・参考リンク

本記事は以下の情報源を参考にしています。内容の正確性については、必ず元のデータソースをご確認ください。