Growth Lab

Gemini API JSON Error Handling Regex

Gemini APIのJSON崩れを絶対に許さない

Growth Lab編集部公開 2026/2/1216分で読める

この記事の作成基準: 編集方針 · AI利用方針

Gemini APIのJSON崩れを絶対に許さない

ショート動画

Comparison選択肢の違いを理解し、自分の条件に合う判断をする

比較軸を先に揃える

不安定なLLMのJSON出力を確実にハンドリングする『3段構えのパース戦略』。正規表現と型ガードを駆使し、どんなに汚い応答からもデータを安全に救出する実戦用コードを公開します。LLM は「JSON を返さない」前提で組むのが、自動化の鉄則

「Gemini APIのJSON崩れを絶対に許さない」は、比較軸 / 向いている条件 / 避ける条件を先に押さえると読みやすい構成です。

Focus

比較軸
向いている条件
避ける条件

比較軸を見る

Comparison

比較軸向いている条件避ける条件

TL;DR

LLM は「JSON を返さない」前提で組むのが、自動化の鉄則
Direct Parse / Code Block / Regex Extraction の 3 段構えで救出
指示を守らせる努力と、守らなかった時の保険を両立させる

The Pain: "Here is the JSON"

LLM（GeminiやChatGPT）に return JSON only と指示しても、彼らは親切心から余計なことをします。

"Sure, here is the JSON you requested:\njson\n{ ... }\n"

これをそのまま JSON.parse() に投げると、当然ながら SyntaxError で落ちます。また、Markdownのコードブロック記法（```json）が含まれていたり、謎の接頭辞がついていることも日常茶飯事です。

The Solution: 3段構えのパース (Triple-Layer Parsing)

LLMの出力は「汚染されている」という前提に立ち、3段階のフィルタで救出を試みます。

Direct Parse: そのままパース（奇跡的に綺麗な場合）。
Code Block Extraction: マークダウン記法（```）の中身を取り出してパース。
Regex Extraction: 文字列中の最初の { から最後の } までを正規表現で無理やり切り出してパース。

これでもダメなら諦めますが、99%はこの網にかかります。

The Implementation: 実際のコード

scripts/generate_gemini.mjs で実際に稼働しているコードです。

javascript

function parseJsonFromGeminiText(text) {
  if (!text) throw new Error("Empty response text");

  // Strategy 1: 素直にパース
  try {
    return JSON.parse(text);
  } catch {}

  // Strategy 2: Code Block (```json ... ```) から抽出
  const jsonCodeBlockMatch = text.match(/```(?:json)?\s*([\s\S]*?)\s*```/i);
  if (jsonCodeBlockMatch) {
    try {
      return JSON.parse(jsonCodeBlockMatch[1].trim());
    } catch (e) {
      console.warn("Failed to parse from code block");
    }
  }

  // Strategy 3: Brute Force ({ ... }) 抽出
  // 最初の '{' と 最後の '}' を見つける
  const jsonMatch = text.match(/\{[\s\S]*\}/);
  if (jsonMatch) {
    try {
      return JSON.parse(jsonMatch[0]);
    } catch (e) {
      console.warn("Failed to parse from fallback extraction");
    }
  }

  throw new Error("JSON parse failed: " + text.slice(0, 100) + "...");
}

プロンプト側での工夫

もちろん、まずプロンプトで釘を刺すことも重要です。

javascript

const prompt = `
...
【出力形式】
必ずJSON形式のみで出力してください。
Markdownのコードブロック（\`\`\`）や、"Here is..." などの説明文は一切含めないでください。
{ で始まり } で終わる有効なJSON文字列のみを出力してください。
...
`;

しかし、LLMは確率モデルである以上、指示を無視する可能性はゼロになりません。「指示を守らせる努力」と「守らなかった時の保険」の両方が必要です。

The Takeaway: 完璧な入力などない

Web APIの世界では「入力値検証（Validation）」は基本ですが、AIエンジニアリングの世界でもそれは同じです。むしろ、相手が人間（ユーザー）よりも「賢いが気まぐれな存在（LLM）」である分、より柔軟で粘り強いパースロジックが求められます。

次回は、これらスクリプトを定期実行するためのインフラ「GitHub Actions」について解説します。

パース戦略の比較表

レイヤー	手法	対象	成功率
Layer 1	Direct Parse	完璧な JSON	低
Layer 2	Code Block	`json ...`	中
Layer 3	Regex	`{ ... }` 抽出	高

2026-05 時点の最新仕様: Structured Output / response_schema

2026 年中頃の Gemini API は Structured Output（responseSchema） が GA となり、本記事の 3 段構え戦略は fallback パターン として位置付けが変わりました[公式値]（Google AI for Developers - Structured Output 公式）。

現行ベストプラクティス（2026-05）

第一選択: responseSchema で JSON Schema を強制（成功率が大幅向上）[公式値]
第二選択: 本記事の 3 段構え（Direct Parse / Code Block / Regex）を fallback として実装
第三選択: response_mime_type: "application/json" を最低限指定[公式値]

OpenAI 側の同等機能は Responses API の text.format[公式値]、Anthropic 側は Tool Use の strict: true[公式値] で同様の構造化出力強制が可能です。詳細は Responses API 時代のツール呼び出し設計を参照。

推奨実装パターン

typescript

// 2026-05 時点の Gemini SDK 例
const result = await model.generateContent({
  contents: [{ role: "user", parts: [{ text: prompt }] }],
  generationConfig: {
    responseMimeType: "application/json",
    responseSchema: {
      type: "object",
      properties: {
        title: { type: "string" },
        tags: { type: "array", items: { type: "string" } },
      },
      required: ["title"],
    },
  },
});

try {
  return JSON.parse(result.response.text());
} catch (e) {
  // 本記事の 3 段構え fallback を呼ぶ
  return tripleLayerParse(result.response.text());
}

実運用では 第一選択 + 本記事の fallback という二重構造で 成功率 95%+ が現実的（経験則）。LLM 出力の幻覚対策の上位設計はエラーハンドリング設計ガイドと Responses API 時代のツール呼び出し設計を参照。

FAQ

Q1. responseSchema を使えば 3 段構えは不要ですか？

不要にはなりません（経験則）。responseSchema でも稀にスキーマ違反が発生するため、fallback として 3 段構えを残すのが現実解。「第一選択は schema、最後の砦は本記事の戦略」という二段構えが安定します。

Q2. OpenAI / Anthropic でも同じ戦略は使えますか？

使えます（経験則）。OpenAI Responses API の text.format[公式値]、Anthropic Tool Use の strict: true[公式値] でも稀にスキーマ違反が起きるため、本記事の 3 段構え fallback を共通実装として持つ価値があります。詳細は Responses API 時代のツール呼び出し設計。

Q3. JSON Schema が複雑だとモデルが混乱しませんか？

混乱します（経験則）。ネストを 2 段以内、プロパティ数を 10 個以内に抑えるのが現実解。それ以上が必要なら、Schema を分割して 複数回呼び出すか、Tool Use で構造化された関数呼び出しに切り替えます。

Q4. レイテンシと正確性のトレードオフは？

responseSchema 使用時は レイテンシが 1.2-1.5 倍になる傾向があります（経験則）。バッチ処理なら許容、リアルタイム応答なら schema を最小化する判断が必要。詳細な観測指標は AIエージェントの可観測性と障害解析を参照。

Q5. テスト・評価はどう設計すべきですか？

3 段構えで設計します（経験則）: (1) 期待 JSON で 成功率の base line、(2) 不正 JSON 注入で fallback の動作確認、(3) 大量 sample で 失敗率モニタリング。詳細な LLM テスト設計は LLM 契約テストとプロンプト回帰検証を参照。

References

関連記事

この記事をシェア

X はてブ LINE

G

Growth Lab編集部

Gemini API / JSON / Error Handling

AI駆動、AIエージェント、仕様駆動、ハーネスエンジニアリングを実装ベースで検証し、再現可能な手順へ落とし込むことを目的に運営しています。

← 前の記事プロンプトからエージェントへ

次の記事 →ブログ完全自動化のインフラ

同じテーマや近い文脈の検証を続けて確認できます。

新着

AI開発オンボーディングエンジニア育成

AI駆動開発チームのオンボーディング設計

AI駆動開発チームへの新人参加時、最初の8週間で何を教えるべきか。AIへの依存リスク・コンテキスト設計・AIコードレビューの3軸で失敗パターンを類型化し、段階的カリキュラムの骨格を提供します。AI駆動開発チームへの新人参加で起きる失敗は「依存過多」「コンテキスト設計不能」「AI生成コードをレビューできない」の3類型に。

Growth Lab編集部

21分公開 2026/6/21

新着

Claude Code セットアップ CLAUDE.md

Claude Code 最速セットアップ2026

Claude Code のインストールから CLAUDE.md・Hooks・MCP 設定まで、最速セットアップ手順を30分で完了できるよう整理した2026年版ガイド。初期設定でつまずきやすいポイントを網羅する。

Growth Lab編集部

22分公開 2026/6/20

新着

LLM 品質評価 Eval

LLM出力の品質ゲート設計：評価指標の選び方とEval自動化

RAGAS・LLM-as-Judge・rule-based evalの使い分けからCI/CDへの組み込みまで、LLM出力品質ゲートの設計手順を実践的に解説。評価→記録→ゲート→通知の自動化パイプラインで品質劣化を早期検知する。

Growth Lab編集部

29分公開 2026/6/19

継続接点

更新を追いかける

新着記事、特集、検証ログをまとめて追える入口として使う。メール購読導線の本実装前でも、継続接点を切らさない。

新着記事をまとめて確認できる
関連記事や特集ページへつながる
実験ログを継続的に追える

記事一覧をフォローする

本実装ではメール購読や通知機能へ差し替え可能。