GeminiのAPI料金はいくら?モデル別の価格やコストを抑える方法7選を徹底解説

Gemini APIは、Googleの生成AIであるGeminiを自社のアプリケーションやサービス内に組み込むことができる開発者向けの機能です。

しかし、以下のような悩みから導入に迷う方も多いでしょう。

「Gemini APIの料金体系がわからない」

「Gemini APIの料金の確認方法を知りたい」

本記事では、Gemini APIの料金に関する基礎知識、料金の確認方法、API料金の節約方法や支払い方法の設定手順などをまとめました。

【記事を読んで得られること】

  • Gemini APIに関する基礎知識
  • Gemini APIの料金体系
  • 他社サービスの料金比較
  • Gemini API利用料金の確認方法
  • API料金を抑える方法
  • 支払い方法の設定・課金停止の手順

Gemini APIの導入を考えている場合は、ぜひ参考にしてください。

株式会社エヌイチ 代表取締役 CEO
奥山 幸生

株式会社エヌイチ代表取締役|AIを駆使して法人1期目年商5.5億円達成|AI×マネタイズジャンルで日本一のYouTube「AI収益化ラボ」の登録者5.6万人超|国内最大級のChatGPTスクール「ChatGPT道場」の受講者3300人超|AI人材を育てるプロ


\ 「業務効率を10倍にする現場ですぐ使えるプロンプト20選」を特別配布中! /

【経営者・事業責任者の方へ】
なぜ、あなたの会社の生産性は上がらないのか?

「現場は頑張っているが、会社全体の生産性が期待したほど上がらない…」
もし、そう感じているなら、原因は次のようなものではないでしょうか。

  • 定型業務に時間を奪われ、付加価値の高い仕事に集中できていない
  • 生成AIを導入したが、一部の社員が使うだけで組織的な活用につながっていない
  • 営業担当者のスキルにバラつきがあり、成果が属人化してしまっている
  • SNSマーケティングや資料作成に、未だに多くの人手と時間を費やしている
  • 部門間の連携が滞り、気づけば無駄な会議や手戻りが発生している

これらの課題は、AIを「個人」の便利ツールとして放置し、「組織」の武器として活用できていないことが原因です。
多くの企業が「最適な活用法が分からない」「AI活用が個人任せ」という壁にぶつかり、AI導入の効果を最大化できずにいます。

株式会社エヌイチでは、AI活用の専門家として、“個人任せ”のAI活用を、“組織の成果”に変えるご支援をしてきました。

とくに「オンボーディングの高速化」「営業プロセスの標準化」「バックオフィス業務の自動化」といった分野で、企業変革を実現してきた実績がございます。

今回、そのノウハウを結集し、明日から現場ですぐに使える「成果実証済みのプロンプト20選」をご用意しました。

「AI活用」を机上の空論で終わらせずに、確かな成果を出すために。
指示の出し方一つで会社の生産性が劇的に変わるという事実を、まずはこちらの資料で体感してみませんか?

\ 「業務効率を10倍にする現場ですぐ使えるプロンプト20選」を無料で受け取る /

目次

GeminiのAPI料金に関する基礎知識

Gemini APIの料金について正しく理解するために、まずは以下の基礎知識を押さえておきましょう。

GeminiのAPI料金に関する基礎知識
  • 無料の利用が可能
  • 使用量に応じて加算される従量課金制
  • Geminiのサブスクリプションとは別枠
  • 入力・出力それぞれに課金
  • モデルによって異なる料金体系

それぞれ詳しく解説します。

無料の利用が可能

Gemini APIは一部のモデルに一定量まで課金せずに使える無料枠が用意されています。小規模なアプリ開発やテスト実装であれば十分に試せる容量です。

ただし、無料枠を超えると自動的に料金が発生します。想定外の請求が発生しないよう、利用状況を定期的に確認しましょう。利用状況の確認はGoogle Cloud Consoleから簡単に調べられます。

使用量に応じて加算される従量課金制

Gemini APIは、無料枠を超えると使った分だけ支払う従量課金制となります。

APIの利用料は「トークン」と呼ばれる単位で計算され、この「トークン」とはAIが認識できる文字のまとまりと覚えておきましょう。日本語では、1トークンがおよそ1文字から3文字に相当するといわれています。

このトークンをどれだけAIが処理したかによって料金が算出されます。

したがって、APIを使って大量の文章や資料を処理する場合は料金がはね上がる可能性があるため、予算の範囲内に収まるか事前に試算しておくと安心です。

Geminiのサブスクリプションとは別枠

Gemini APIの料金は、Google AI ProやGoogle AI Ultraなどの月々のサブスクリプションとは別に設定されています。

サブスクリプションを契約している人は、契約プランの月額料金に加えて、無料枠を超えた分のAPI利用料が上乗せされます。また、Geminiのサブスクリプションを契約せずにAPIのみの利用も可能であり、APIの利用にサブスクリプション加入の有無は関係ありません。

なお、先ほど触れたとおり、有料プランだからといって従量課金が発生しないわけではない点に注意しましょう。

入力・出力それぞれに課金

Gemini APIは、AIへ投げる質問(=入力)とそれに対するAIからの回答(=出力)の両方に料金が発生します。人間が送る指示だけでなく、AIが出した答えの長さによってもコストが変動するということです。

一般に、AIが答えを出す出力のほうが単価が高く設定されているため、AIへの質問文が短くてもAIが長文の答えを出せば費用はかさみます。

入力と出力で単価の違いはありますが、やり取りされる情報の合計量が利用料に反映されると理解しておきましょう。

モデルによって異なる料金体系

Gemini APIには能力やスピードの異なるいくつかのモデルが用意されており、どれを選ぶかによっても料金が変わります。

具体的に、2025年11月にリリースされた最新モデルのGemini 3 Proは、100万トークンあたり入力が$2、出力が$12になります。対して2025年6月にリリースされた旧モデルGemini 2.5 Proは、入力が$1.25、出力が$10と割安です。

また、同じ世代のモデルでもスペックが違えばAPI料金も異なります。実際に、Gemini 3 FlashのAPI料金はGemini 3 Proの価格の4分の1です。

予算や目的に応じて最適なモデルを選ぶことが重要なので、次章のモデル別料金表を参考にしてみてください。

GeminiのAPI料金のモデル別比較

先ほど触れたとおり、Gemini APIの料金は使うモデルによって異なります。

各モデルの特徴を正しく理解し、目的や処理内容に応じた適切なモデル選びがコストを管理するうえでのポイントです。

以下の表にGemini APIのモデル別の料金と主な用途・特徴についてまとめました。

モデル名リリース日 無料枠入力料金(100万トークンあたり)出力料金(100万トークンあたり)主な用途・特徴
Gemini 3 Pro2025年11月なし$2$12最新のフラッグシップモデル。高度な数学・推論・複雑なタスク向け。
Gemini 3 Flash2025年12月15回/分1,500回/日$0.5$3高速・高効率の標準モデル。第3世代の主力。
Gemini 2.5 Pro2025年6月なし$1.25$102.5世代の高性能モデル。現在は3 Proへの移行が推奨。
Gemini 2.5 Flash2025年6月2回/分20回/日$0.3$2.52.5世代の高速モデル。コストと性能のバランスが良い。
Gemini 2.5 Flash-Lite2025年7月30回/分1,500回/日$0.075$0.3超軽量・低コスト。大量の単純タスク向け。

Gemini APIは、能力の高さや処理速度、そして料金が異なる複数のモデルを展開しています。高性能なモデルほど精度や能力は高まりますが、その分コストも上がるため常に最適とは限りません。

最新の高性能モデルであるGemini 3 Proは、複雑な推論や高度なコード生成に対応した思考モードを搭載しており、精度の高い回答を出してくれます。一方、Gemini 3 Flashはスピードとコスト効率をバランスよく備えたモデルで、リアルタイムな応答や大量のデータ処理が求められるシステムにおすすめです。

モデルごとに無料枠の有無や1分間・1日あたりのリクエスト上限が異なるため、開発のフェーズや予算に合ったモデルを見極めて使いましょう。

ほかのAIサービスAPIとの料金比較

GeminiAPIの導入を検討する際は、他社のAIサービスのAPI料金と比較して検討しましょう。

Gemini API、ChatGPT API、Claude APIの料金を整理してまとめました。

モデル無料枠入力料金(100万トークンあたり)出力料金(100万トークンあたり)
Gemini 3 Proなし$2$12
Gemini 3 Flash15回/分1,500回/日$0.5$3
GPT-5.2 proなし$21$168
GPT-5.2なし$1.75$14
GPT-5 miniなし$0.25$7
Claude Opus 4.5なし$5$25
Claude Sonnet 4.5なし$3$15

各社とも入力トークン・出力トークンで単価を分けた従量課金制を採用している点は共通しています。

Gemini APIの特徴はやはり、毎日リセットされる無料枠が提供されているところです。

ただ、無料枠の提供が今後も続くとは限りません。無料枠を前提にした運用に依存しすぎるのではなく、有料になった場合の料金体系も理解したうえで設計しておくことが重要です。

最新の情報を定期的に確認し、正しい料金・条件を把握しながら活用する姿勢も求められます。

GeminiのAPI料金の確認方法

API利用料金の確認は予算を管理するうえで必須の作業です。ここでは、Gemini API利用料金の確認方法を実際の画面を見せながら解説します。

Google Cloud Consoleにアクセスする

Gemini APIの料金はGoogle Cloud Consoleから確認できます。まずは、Google Cloud Consoleにアクセスし、APIを利用しているアカウントでログインしましょう。

ログインすると、上の画像のようなプロジェクトの基本情報やAPIの稼働状況を確認できるダッシュボードが表示されます。

該当のプロジェクトを選ぶ

API料金を調べたいプロジェクトを選択します。以下の画面は「Project A」という名前のプロジェクトを選択中です。


Google Cloud Consoleでは選択中のプロジェクトが左上に表示され、ここをクリックすると別のプロジェクトに切り替えられます。

上の画像のように、選択中のプロジェクト名の左側にはチェックマークが表示されます。

課金セクションに移動する

左上のナビゲーションメニュー(横三本線のマーク)から「課金」を選択します。

先ほどのダッシュボードだけでなく、ナビゲーションメニューからも利用状況の確認や設定など各種画面に移動できます。

API料金を確認する

以下のような画面に切り替わり、請求金額や詳細な利用状況を確認できます。


複数のプロジェクトを運用している場合は各プロジェクト毎の利用状況も調べられます。


2度目のアクセス以降はワンクリックで確認できるよう、ブックマークしておきましょう。

GeminiのAPI料金を抑える方法7選

Gemini APIは使い方次第で無駄なコストを抑えられます。ここでは初心者でも実践しやすい以下の方法を7つ紹介します。

GeminiのAPI料金を抑える方法7選
  • 無料枠を活用する
  • 軽量モデルを優先して使う
  • 出力のフォーマットを制限する
  • コンテキストキャッシュを利用する
  • バッチモードを活用する
  • アラートを受けとる設定にする
  • 日本語ではなく英語を使う

それぞれ具体的に解説します。

無料枠を活用する

Gemini APIは一部のモデルに制限つきで無料枠が用意されています。まずはこの無料枠のなかで正しく動作するか検証してみましょう。

無料枠の上限はモデルによって異なり、高性能のモデルほど無料で処理できる容量が少なめに設定されています。

テスト段階では無料枠を活用し、実際の稼働時に有料プランに移行すれば不要な支出を防ぐことが可能です。

軽量モデルを優先して使う

すべての処理に高性能のモデルを使う必要はありません。文章の要約や簡単な質問への応答など、シンプルなタスクは軽量モデルでも十分に対応できます。

高性能のモデルほど回答が緻密になり、ユーザー側のリクエストも増加する傾向なのでトークン数を消費しやすいです。そのため、用途に応じてモデルを使い分け、API料金を抑えるようにしましょう。

出力のフォーマットを制限する

Gemini APIの料金はモデルが生成するトークン数(文字の量)によって決まります。そのため、モデルが出す回答を必要な範囲に制限すれば料金を抑えられます。

たとえば、「回答はJSON形式で」「箇条書きで3点以内にして」「100文字以内で」のように出力の形式を明示してプロンプトしましょう。とくに、JSON形式で出力するように設定すると、モデルが自動で付け加える挨拶文や説明などの無駄なテキストを一気に省けます。

このようにプロンプトを見直すだけでもコスト削減につながりますが、もし思いつかない場合は、効果的なプロンプトを通常のGeminiに質問してみるのもおすすめです。

コンテキストキャッシュを利用する

長文を読み込ませたり同じ指示を繰り返したりする場合は「コンテキストキャッシュ」という機能を利用しましょう。

これは、AIに一度送ったリクエストを一時保存して再利用することでコストを抑える仕組みです。

通常、AIは入出力をするたびにすべての会話履歴を読み直すため、同じ情報の処理に多くのトークンを消費します。コンテキストキャッシュを活用すれば、一時的に保存された情報を何度も読み込まずに済むため、トークンを大幅に削減できます。

追加料金がかかる機能ですが、適切に使えばトータルの費用を抑えられる方法です。

バッチモードを活用する

Gemini APIには「バッチモード」と呼ばれる機能もあります。

これは、AIが緊急ではないリクエストに対してすぐに応答せず、時間をかけてまとめて処理する方法です。数千件のデータ分析や大量の記事作成など、あとから結果を一括チェックできる作業の効率化におすすめの機能です。

なお、バッチモードにすると、通常のリアルタイムの応答に比べてAPI料金が半額になります。リクエストから回答までにかかる時間はおよそ24時間と把握しておきましょう。

アラートを受け取る設定にする

Gemini APIは、料金が予算額を超えそうになったときに通知が届くように設定しておけます。

料金の指定はGoogle Cloud Consoleの料金確認画面から行いましょう。


Gemini APIは従量課金制のため、限られたコストで運用する必要があるプロジェクトではアラートが特に役立ちます

初めて利用する際にコストの計算が不安な人にも役立つため、試行錯誤に集中したい場合はぜひ活用してみてください。

日本語ではなく英語を使う

一般的に、APIのテキスト生成は同じ情報量でも日本語のほうが英語に比べてより多くのトークンが消費され、料金が高くなる傾向にあります。

システム内部の処理や自分だけが確認するデータであれば、あえて英語で出力させて消費トークンを節約しましょう。英語が苦手な場合でも、必要な箇所を翻訳ツールで日本語に切り替えるなどの工夫一つでコスト削減が目指せます。

GeminiのAPI利用時の支払い方法の設定

Gemini APIを実際に使う際は、無料枠で試す場合でも初回に支払い方法を設定する必要があります。登録から課金停止までの流れを把握しておけば、予定外の請求をされずに安心して運用できるため、以下で具体的な設定と課金停止の手順についても見ていきましょう。

支払い方法の設定手順

支払い方法を設定していない状態で画面左のナビゲーションメニューから課金セクションに移動すると、以下の画面が表示されます。

次に、「請求先アカウントをリンク」をクリックすると、次の画面に移ります。


次の画面でクレジットカード情報や個人情報の登録を求められるので、画面の指示に従って入力を進めると支払い方法の設定が完了します。

この手順を踏んで初めて、先ほどの請求内容や利用状況を確認できる画面を見ることができます。

課金停止の手順

無料枠の範囲内でAPIを使いたい場合やこれ以上の請求額の増加を防ぎたいのであれば、課金を停止しましょう。課金の停止もナビゲーションメニューの課金セクションから行います。

課金セクション内にも左側にナビゲーションメニューがあるため、「お支払いの管理」内の「アカウント管理」を選択します。

以下の画面が表示されたら、「操作」の下の3点ドットマークをクリックします。

以下で「課金を無効にする」をクリックします。

下記のようにプロジェクト名が空欄になれば、課金が無効になっています。


もし課金を再度有効に戻したい場合は「お支払いの管理」内の「アカウント管理」から設定しましょう。

GeminiのAPI料金に関するよくある質問

Gemini APIの料金については、共通の疑問をもつ人が多くいます。ここではよくある質問をいくつかまとめたので、実際に利用する前に不明点を解消しておきましょう。

Geminiの有料版に入っていればAPIは無料で使えるか

Geminiの有料版とGemini APIの利用料は完全に別物です。 

月額約2,900円のGoogle AI Pro、月額36,400円のGoogle AI Ultraは一般ユーザー向けの定額サービスであり、開発者向けのAPIの料金とは一切関係がありません。Gemini APIは一部のモデルで一定量まで無料で使えますが、無料での処理容量を超えると自動で課金が始まります。

利用した分は、Geminiの月額料金とは別に使った分だけ支払う必要があります。

ひとつのAPIキーを複数のシステムで使い回すと料金はどうなるか

Gemini APIの料金は、APIキーごとではなく紐付いているプロジェクトごとに集計されます。したがって、ひとつのプロジェクトで複数のAPIキーを発行していても、請求はそのプロジェクトで利用したAPIの合算額となります。

同じAPIキーを複数のアプリ使い回すと合算されるため、どのアプリでどれくらいAPIを利用したのかがわかりません。アプリごとに予算を管理したい場合は、プロジェクトを分けて個別にAPIキーを発行するのがおすすめです。

会話が長くなるほど料金が増えるのはなぜか

AIは前回までの会話の内容を記憶しているわけではありません。人間が指示を出すたびに、それまでの会話内容を毎回再読み込みして回答を出しています。

そのため、会話が続くほど送るデータ量が雪だるま式に積み重なっていきます。「1、1+2、1+2+3……」のように処理するデータの合計が膨らむということです。

その結果、消費するトークン量が増えて料金が上がってしまいます。

節約するには、過去のやり取りが不要になったタイミングで会話をリセットして新規チャットに切り替えて質問を送り直してみてください。これにより、積み重なっていた会話履歴がゼロになり、料金を初回リクエスト時の状態に戻せます。

コンテキストキャッシュ機能を活用するのも有効です。

Gemini APIを活用して業務を効率化させよう!

本記事ではGemini APIの料金やコストを抑える方法について解説しました。

Gemini APIの料金はモデル選択や使い方次第で大きく変わります。

【Gemini API導入時のポイント】

  • Gemini APIは一部モデルが制限つきで無料で利用可能
  • 無料枠の終了後は従量課金制
  • プロンプトや設定の工夫次第で料金をコントロールできる

コスト管理の設定も含め、計画的なAPIの運用が重要です。Gemini APIを賢く使い、業務効率化とコストの削減の両立を目指しましょう。

また、AIスキル習得をお考えの場合は、最大75%の研修費を助成金で削減できる生成AI研修サービスがおすすめです。

生成AI研修サービス|株式会社エヌイチ

\ 「業務効率を10倍にする現場ですぐ使えるプロンプト20選」を特別配布中! /

【経営者・事業責任者の方へ】
なぜ、あなたの会社の生産性は上がらないのか?

「現場は頑張っているが、会社全体の生産性が期待したほど上がらない…」
もし、そう感じているなら、原因は次のようなものではないでしょうか。

  • 定型業務に時間を奪われ、付加価値の高い仕事に集中できていない
  • 生成AIを導入したが、一部の社員が使うだけで組織的な活用につながっていない
  • 営業担当者のスキルにバラつきがあり、成果が属人化してしまっている
  • SNSマーケティングや資料作成に、未だに多くの人手と時間を費やしている
  • 部門間の連携が滞り、気づけば無駄な会議や手戻りが発生している

これらの課題は、AIを「個人」の便利ツールとして放置し、「組織」の武器として活用できていないことが原因です。
多くの企業が「最適な活用法が分からない」「AI活用が個人任せ」という壁にぶつかり、AI導入の効果を最大化できずにいます。

株式会社エヌイチでは、AI活用の専門家として、“個人任せ”のAI活用を、“組織の成果”に変えるご支援をしてきました。

とくに「オンボーディングの高速化」「営業プロセスの標準化」「バックオフィス業務の自動化」といった分野で、企業変革を実現してきた実績がございます。

今回、そのノウハウを結集し、明日から現場ですぐに使える「成果実証済みのプロンプト20選」をご用意しました。

「AI活用」を机上の空論で終わらせずに、確かな成果を出すために。
指示の出し方一つで会社の生産性が劇的に変わるという事実を、まずはこちらの資料で体感してみませんか?

\ 「業務効率を10倍にする現場ですぐ使えるプロンプト20選」を無料で受け取る /

よかったらシェアしてね!
  • URLをコピーしました!
  • URLをコピーしました!
目次