破綻パターン	起きること
長セッションの忘却	コンテキストが伸びると、冒頭で指定した制約が後半で効かなくなる
workflow 改変	エージェントが「効率化のため」スキップする手順を提案・実行してしまう
監査の不在	「指示は読んだはず」では、後から検証できない

ゲート	タイミング	判断
C-3	計画レビュー後、実装前	APPROVE / CONDITIONAL / REJECT
C-4	AI 実装後、GitHub PR 上	APPROVE / REQUEST CHANGES

中核アイデア	内容
計画先行	PBI から plan / todo / test-cases を作り、承認前の実装を禁止する
ゲート制御	C-3（計画承認）と C-4（PR レビュー）で人間の判断点を固定する
Hook 強制	plan / approval / evidence / scope / review の不変条件を hook と CLI で検査する
検証内蔵	L-0 / V-1〜V-4 により、実装後の検証をワークフローに組み込む
状態の永続化	`docs/working/TASK-NNNN/` に計画、レビュー、検証、handoff を残す

Hook	種別	不変条件	対応 Iron Law
EH-1	PreToolUse	`plan.md` なしの production code 編集を block	#1 / #5
EH-2	PreToolUse	C-3 未承認のまま `exec` フェーズに進むのを block	#1
EH-3	PreToolUse + CLI	`c3.json` の `plan_hash` と `plan.md` sha256 の不一致（承認後改竄）を検知	#5
EH-4	CLI	`test-cases.md` 不在のまま V-1 を実行するのを block	#3
EH-5	CLI	検証 evidence なしの PR 作成を block	#3
EH-6	PreToolUse + CLI	子 PBI YAML の `forbidden_files` glob と編集対象 path を fnmatch で照合し、scope 外編集を block	#2
EH-7	CLI	C-3 + C-4 のいずれかが APPROVED でない状態でのマージを block	#7

Hook	種別	不変条件
EHS-1	CLI（mode 連携）	standard / high-risk / critical で V-3 外部 AI レビュー必須化、light / ultra-light は SKIP
EHS-2	CLI	`handoff.md` 必須 6 要素（要件適合 / 既知課題 / V2 候補 / 妥協点 / 引き継ぎ文書 / テスト結果）の欠落で WF-05 を block
EHS-3	CLI	V-1 FAIL → fix → V-1 のループが 5 回を超過したら ABORT してエスカレーション

モード	環境変数	挙動
default（推奨初期値）	なし	違反検出時は warning のみ。`continue:true` で block しない
strict	`PLANGATE_HOOK_STRICT=1`	違反検出時に block / exit 1。本番運用 / CI で有効化
bypass	`PLANGATE_BYPASS_HOOK=1`	常時 pass。緊急対応のみ。監査ログに必ず記録

区分	内容
保存可	12 カテゴリ（公式値、TASK ID / mode / 時刻 / 件数 / hook 名 / 判定など）
禁止	9 カテゴリ（公式値、file path / stack trace / command output / provider metadata / 個人情報など）
保持期間	90 日（公式値、retention）

指標の読み方

TL;DR

はじめに

1. なぜ「autonomy」より「承認境界」が要るのか

1.1 プロンプト依存の限界

1.2 PlanGate の差分（承認境界・監査可能性・スクラム親和性）

2. 2 ゲート構造（C-3 / C-4）でワークフローを固定する

2.1 ワークフロー全体図

2.2 中核アイデアと Iron Law

3. Hook Enforcement 10 種で何を runtime ブロックするか

3.1 EH-1〜EH-7（基本 7 件）

3.2 EHS-1〜EHS-3（strict プロファイル拡張）

3.3 3 mode 設計と監査ログ

4. v8.6 で何が増えたか — Metrics v1 と Governance

4.1 bin/plangate metrics（11 events / NDJSON）

4.2 Metrics Privacy Policy

4.3 Issue / Label / Milestone Governance

4.4 Baseline 比較の基盤

5. 導入の段階設計（3 ステップ）

5.1 Step 1: default mode で hook を入れる

5.2 Step 2: CI で schema 検証 + eval を回す

5.3 Step 3: strict mode + metrics で改善ループ

6. ガードレール導入チェックリスト

まとめ

FAQ

CI ですでに型チェックや lint があるが、hook と被らないか

Cursor や Codex でも使えるか

既存リポジトリに途中から入れられるか

Iron Law や Hook を独自に増やしてもよいか

Metrics v1 はチーム外に出してよいか

References

あわせて読む

PlanGate実践：計画を先に書いて承認するWF

PlanGateとは：承認なしにコードを書かせない

Claude Code hooks 実践パターン集

更新を追いかける

指標の読み方

TL;DR

はじめに

1. なぜ「autonomy」より「承認境界」が要るのか

1.1 プロンプト依存の限界

1.2 PlanGate の差分（承認境界・監査可能性・スクラム親和性）

2. 2 ゲート構造（C-3 / C-4）でワークフローを固定する

2.1 ワークフロー全体図

2.2 中核アイデアと Iron Law

3. Hook Enforcement 10 種で何を runtime ブロックするか

3.1 EH-1〜EH-7（基本 7 件）

3.2 EHS-1〜EHS-3（strict プロファイル拡張）

3.3 3 mode 設計と監査ログ

4. v8.6 で何が増えたか — Metrics v1 と Governance

4.1 bin/plangate metrics（11 events / NDJSON）

4.2 Metrics Privacy Policy

4.3 Issue / Label / Milestone Governance

4.4 Baseline 比較の基盤

5. 導入の段階設計（3 ステップ）

5.1 Step 1: default mode で hook を入れる

5.2 Step 2: CI で schema 検証 + eval を回す

5.3 Step 3: strict mode + metrics で改善ループ

6. ガードレール導入チェックリスト

まとめ

FAQ

CI ですでに型チェックや lint があるが、hook と被らないか

Cursor や Codex でも使えるか

既存リポジトリに途中から入れられるか

Iron Law や Hook を独自に増やしてもよいか

Metrics v1 はチーム外に出してよいか

References

あわせて読む

PlanGate実践：計画を先に書いて承認するWF

PlanGateとは：承認なしにコードを書かせない

Claude Code hooks 実践パターン集

更新を追いかける

4.1 `bin/plangate metrics`（11 events / NDJSON）

4.1 `bin/plangate metrics`（11 events / NDJSON）