Gemini 3.5 Flashとは?Google最新AIモデルの性能・料金・使い方をわかりやすく解説
Googleは2026年5月19日、Gemini 3.5モデルファミリーを発表し、第一弾としてGemini 3.5 Flashの提供を開始しました。今回の主役は「ただ賢いチャットAI」ではなく、コーディングや複数ステップの作業を高速に進めるエージェント向けモデルです。
この記事では、Gemini 3.5 Flashの発表内容、性能、料金、Gemini 3.1 Proとの違い、GPTやClaudeなど他社モデルとの使い分けを、初心者にもわかりやすく整理します。
前提:本記事は2026年5月20日時点で確認できるGoogle公式ブログ、Gemini API公式ドキュメント、GitHub公式情報をもとにしています。Gemini 3.5 Proは「来月提供予定」とされており、この記事では提供開始済みのGemini 3.5 Flashを中心に解説します。
Gemini 3.5 Flashとは?
Gemini 3.5 Flashは、Googleの最新モデルファミリー「Gemini 3.5」の第一弾として公開されたAIモデルです。従来のFlash系モデルと同じく速度とコスト効率を重視しながら、今回は特にAIエージェント、コーディング、長時間の複数ステップ作業に強いモデルとして打ち出されています。
Google公式発表では、Gemini 3.5 FlashはGeminiアプリ、Google検索の「AIモード」、Google Antigravity、Google AI Studio、Android StudioのGemini API、Gemini Enterprise系サービスで利用できるとされています。
一言でいうと:Gemini 3.5 Flashは、文章生成だけでなく「調べる、判断する、コードを書く、ツールを呼び出す、何度も改善する」といった作業を高速に回すためのモデルです。
発表日と提供状況
| 項目 | 内容 |
|---|---|
| 発表日 | 2026年5月19日 |
| 提供開始モデル | Gemini 3.5 Flash |
| 開発者向け | Google Antigravity、Google AI Studio、Android Studio、Gemini API |
| 一般ユーザー向け | Geminiアプリ、Google検索のAIモード |
| 企業向け | Gemini Enterprise Agent Platform、Gemini Enterprise |
| Gemini 3.5 Pro | Googleは開発中と説明。2026年5月20日時点では未提供で、来月展開予定 |
Gemini 3.5 Flashの主な特徴
1. エージェント作業とコーディングに強い
今回のGemini 3.5 Flashで最も重要なのは、チャットの回答品質だけでなく、実際に作業を進める力が重視されている点です。Googleは、複数のサブエージェントを使った作業、長いワークフロー、コードの修正や移行、資料処理などを想定しています。
2. Flashらしい高速性を維持
Googleは、Gemini 3.5 Flashの出力速度について、他の最先端モデルと比べて出力トークン毎秒が4倍速いと説明しています。AIエージェントでは、1回の回答だけでなく、何十回、何百回とモデルを呼び出すことがあります。そのため速度は、体感だけでなく実行コストや作業完了までの時間にも直結します。
3. 大きなコンテキストとマルチモーダル入力
Gemini APIのモデル仕様では、Gemini 3.5 Flashはテキスト、画像、動画、音声、PDFを入力として扱えます。入力トークン上限は1,048,576、出力トークン上限は65,536です。長いPDF、複数ファイル、ログ、仕様書、会議資料をまとめて扱いやすい構成です。
4. ツール利用に向いた機能が多い
Gemini 3.5 Flashは、Function calling、構造化出力、コード実行、URL context、Google検索グラウンディング、Google Mapsグラウンディング、File Search、Batch API、Flex inference、Priority inferenceなどに対応しています。つまり、単体のチャットモデルとしてだけでなく、外部ツールとつないで業務フローに組み込みやすいモデルです。
性能はどのくらい?公開ベンチマークの見方
Google公式発表では、Gemini 3.5 FlashがGemini 3.1 Proを複数の難しいコーディング・エージェント系ベンチマークで上回ったと説明されています。代表的な数値は以下です。
| ベンチマーク | Google公表値 | 読み方 |
|---|---|---|
| Terminal-Bench 2.1 | 76.2% | ターミナル環境での操作、実行、修正能力を見る指標 |
| GDPval-AA | 1,656 Elo | 実務寄りの推論・判断能力を比較する評価 |
| MCP Atlas | 83.6% | MCPや複数ツール利用を含むエージェント能力の評価 |
| CharXiv Reasoning | 84.2% | 図表を含む学術的なマルチモーダル理解の評価 |
ただし、ベンチマークだけで「すべての用途で最強」と判断するのは危険です。Gemini 3.5 Flashは、特にエージェント作業、コード生成、ツール連携、長い入力処理で強みが出やすいモデルと考えるのが現実的です。
料金は高い?安い?
Gemini APIの公式料金表では、Gemini 3.5 FlashのStandard料金は、入力が100万トークンあたり1.50ドル、出力が100万トークンあたり9.00ドルです。BatchやFlexでは入力0.75ドル、出力4.50ドル、Priorityでは入力2.70ドル、出力16.20ドルと掲載されています。
| 区分 | 入力 | 出力 | 向いている使い方 |
|---|---|---|---|
| Standard | $1.50 / 100万トークン | $9.00 / 100万トークン | 通常のAPI利用、アプリ組み込み |
| Batch / Flex | $0.75 / 100万トークン | $4.50 / 100万トークン | 大量処理、柔軟な推論実行 |
| Priority | $2.70 / 100万トークン | $16.20 / 100万トークン | 優先実行や安定した応答速度を重視する用途 |
GoogleはGemini 3.5 Flashについて、他の最先端モデルより多くの場合で半分以下のコストに抑えられると説明しています。一方で、従来のFlash-Lite系のような「最安モデル」ではありません。安さだけで選ぶモデルではなく、速度、品質、ツール連携を含めた費用対効果で判断するモデルです。
Gemini 3.1 Proや他社モデルとの違い
Gemini 3.5 Flashは、従来の「Proが高性能、Flashは高速・安価」という単純な分け方を少し崩すモデルです。Googleは、難しいコーディングやエージェント評価でGemini 3.1 Proを上回ると説明しています。
| モデル | 強み | 注意点 | おすすめ用途 |
|---|---|---|---|
| Gemini 3.5 Flash | 高速、エージェント、コーディング、長い入力、Google検索/Maps連携 | 画像生成やLive APIは非対応。知識カットオフは2025年1月 | 開発支援、業務自動化、PDF/資料処理、AIエージェント |
| Gemini 3.1 Pro | Gemini系の高性能Pro枠。複雑な推論やマルチモーダル作業に強い | 3.5 Flashより遅く高コストになりやすい場面がある | 深い推論、重要文書の検討、高品質な単発回答 |
| OpenAI GPT系モデル | 開発者エコシステム、API、ツール連携、コーディング支援が強い | 用途によって料金や速度のバランスを見極める必要がある | アプリ開発、エージェント実装、汎用AI機能 |
| Anthropic Claude系モデル | 長文読解、文章品質、設計レビュー、Claude Codeとの相性が良い | 大量の高速実行ではコストや速度が課題になる場合がある | 仕様整理、コードレビュー、設計相談、長文資料の分析 |
| xAI Grok系モデル | リアルタイム情報やX連携を重視する用途と相性が良い | 業務導入ではAPI仕様、管理機能、料金を個別確認したい | ニュース性の高い調査、SNS文脈を含む分析 |
選び方の目安:大量のツール呼び出しやコーディング作業を速く回したいならGemini 3.5 Flash、丁寧な文章化や設計レビューならClaude系、OpenAI API中心のアプリ実装ならGPT系も候補、という考え方がわかりやすいです。
どんな人におすすめ?
開発者・エンジニア
Gemini 3.5 Flashは、コード生成だけでなく、既存コードの調査、修正、テスト、移行、UI案の生成などに向いています。GitHub CopilotでもGemini 3.5 Flashが順次利用可能になっており、VS Code、Visual Studio、JetBrains、Xcode、Eclipseなどで選択できると案内されています。
業務自動化を進めたい企業
請求書処理、金融書類の確認、データ分析、顧客オンボーディング、社内ワークフローの自動化など、複数ステップの処理をAIに任せたい企業にも向いています。特に、ツール呼び出しや複数エージェントを前提に設計する場合、速度とコストのバランスが重要になります。
Googleサービスをよく使う人
GeminiアプリやGoogle検索のAIモードで標準的に使われるため、一般ユーザーにとっても体感する機会が多いモデルです。Google検索、Google AI Studio、Android Studio、Gemini Enterpriseなど、Googleのサービス群と近い場所で使える点は大きな強みです。
注意点:Gemini 3.5 Flashだけで全部解決するわけではない
Gemini 3.5 Flashは強力ですが、注意点もあります。まず、API仕様上は画像生成、音声生成、Live API、Computer Useには対応していません。画像を作る、リアルタイム音声対話をする、画面を直接操作する、といった用途では別モデルや別機能を選ぶ必要があります。
また、知識カットオフは2025年1月と掲載されています。最新情報を扱う場合は、Google検索グラウンディングや外部検索、社内データベース、RAGなどと組み合わせるのが前提です。
さらに、エージェント用途では「速いモデルを使う」だけでは不十分です。権限管理、ログ、途中確認、失敗時の戻し方、機密情報の扱い、人間の承認フローまで含めて設計する必要があります。
まとめ:Gemini 3.5 Flashは「速い実行型AI」の本命候補
Gemini 3.5 Flashは、Gemini 3.5シリーズの第一弾として、2026年5月19日に正式発表されたモデルです。特徴は、エージェント作業、コーディング、長いワークフロー、高速応答、Googleサービスとの連携にあります。
従来のFlash系モデルは「速くて安い」印象が強いモデルでしたが、Gemini 3.5 Flashはそこに実務的な作業能力を大きく足したモデルです。AIを文章作成だけでなく、開発や業務の実行役として使いたい人にとって、今後かなり重要な選択肢になるでしょう。
一方で、深い推論、文章品質、画像生成、リアルタイム音声、画面操作などは用途ごとに最適なモデルが変わります。Gemini 3.5 Flashは「高速に何度も動かすエージェント型タスク」に強いモデルとして理解しておくと、選び方を間違えにくくなります。
参考情報
- Google公式ブログ:Gemini 3.5: frontier intelligence with action
- Google AI for Developers:Gemini 3.5 Flash model documentation
- Google AI for Developers:Gemini API pricing
- Google公式ブログ:The Gemini app becomes more agentic
- GitHub Changelog:Gemini 3.5 Flash is generally available for GitHub Copilot
料金や提供範囲は変更される可能性があります。実装や契約前には、必ず各サービスの公式ページで最新情報を確認してください。

