Growth Lab

AI開発 DORA 品質指標リリース運用

AI変更のChange Failure Rateをどう測るか

Growth Lab編集部公開 2026/3/109分で読める

この記事の作成基準: 編集方針 · AI利用方針

AI変更のChange Failure Rateをどう測るか

ショート動画

Hubまず構造を掴み、必要な関連記事へ移動する

このテーマの全体像

AI生成変更を含む開発で Change Failure Rate をどう定義し、速度と品質の両方を見失わずに運用するかを整理する。AI生成コードがチームの変更量に占める割合は、この1年で急速に増えている。GitHub Copilot やカスタムエージ

「AI変更のChange Failure Rateをどう測るか」は、対象領域 / 主要論点 / 読む順番を先に押さえると読みやすい構成です。

Focus

対象領域
主要論点
読む順番

読む順番を決める

Hub

対象領域主要論点読む順番

TL;DR

AI導入後は変更量が増えるぶん、事故率の定義を先に固定する必要がある
Change Failure Rate は「障害件数」だけでなく「切り戻し」「緊急修正」も含めて設計する
指標はチームを責めるためではなく、レビュー強度を調整するために使う

はじめに

AI生成コードがチームの変更量に占める割合は、この1年で急速に増えている。GitHub Copilot やカスタムエージェントが日常的にPRを出すようになると、リリース回数は自然に増加する。しかし「速くなった」だけでは価値を証明できない。事故を起こさずに速度を維持できているかを示す指標が必要になる。

この記事では、DORA Four Keysの1つである Change Failure Rate（CFR） を、AI生成変更を含むチームでどう定義・計測・運用するかを整理する。

:::message DORA指標をそのまま持ち込むのではなく、自チームの事故定義を合わせるところから始めるのがポイントだ。生産性指標全般の選び方は開発生産性指標の歩き方で詳しく解説している。 :::

1. 事故をどう定義するか

Change Failure Rateを測る前に、「何をfailureとカウントするか」をチームで合意する必要がある。DORAの原典では「サービスの低下やサービス停止を引き起こし、修正が必要な変更の割合」と定義されている。しかしAI生成変更を含む開発では、この定義だけでは曖昧さが残る。

failureの3分類

実務上、failureは以下の3つに分類すると計測しやすい。

分類	定義	例
障害（Incident）	ユーザー影響のあるサービス停止・劣化	500エラー増加、レスポンスタイム倍増
切り戻し（Rollback）	デプロイ後にリバートが必要になった変更	機能フラグOFF、git revert
緊急修正（Hotfix）	計画外の修正を即日リリースした変更	バグ修正のfast-track PR

この3分類を使うと「障害は出なかったが切り戻した」ケースも漏れなく拾える。AI生成変更は個々の変更が小粒になりやすいため、Incident だけを数えると実態より低い数値が出やすい点に注意が必要だ。

境界条件：何をカウントしないか

テスト環境だけで検出し、本番に出なかった不具合はカウントしない
意図的なフィーチャーフラグの切り替えはカウントしない
依存ライブラリの脆弱性パッチ適用で機能影響がなかった場合はカウントしない

この境界条件をドキュメントに書いておくだけで、計測担当者間のブレが大きく減る。

2. 速度と品質をどう両立するか

AI導入でデプロイ頻度が上がったチームが陥りやすい罠は、CFRの分母（総変更数）が急増して分子（failure数）も比例的に増えるのに、率だけ見て「横ばいだから問題ない」と判断してしまう ことだ。

リスクスコアとレビュー強度の連動

すべての変更に同じレビュー負荷をかけるのは非現実的だ。変更ごとにリスクスコアを付け、スコアに応じてレビュー強度を変える設計が効果的になる。

ts

// リスクスコアに応じたレビュー強度の割り当て
type RiskLevel = 'low' | 'medium' | 'high'

const reviewPolicy: Record<RiskLevel, { autoMerge: boolean; reviewers: number }> = {
  low:    { autoMerge: true,  reviewers: 0 },
  medium: { autoMerge: false, reviewers: 1 },
  high:   { autoMerge: false, reviewers: 2 },
}

このリスクベースの振り分けを自動化する方法はAI生成PRの品質ゲートを自動化するで詳しく解説している。また、リスク判定基準そのものの設計はリスクベースリリース運用が参考になる。

CFRの計測式

計測式はシンプルに保つ。

CFR = (Incident + Rollback + Hotfix) / 総デプロイ数 × 100

週次で計測し、4週移動平均で傾向を見るのが実用的だ。短期の変動に一喜一憂せず、トレンドの変化をキャッチするために移動平均を使う。

3. ダッシュボード運用の落とし穴

CFRをダッシュボードに載せて「見える化」するチームは増えているが、運用を誤ると逆効果になる。よくある3つの落とし穴を挙げる。

落とし穴1：数値の一人歩き

CFRが上がったとき「誰のせいか」を探す文化ができると、チームは変更を避けるようになる。指標は個人を責めるためではなく、レビュー強度やテスト戦略を調整するためのシグナル として使うべきだ。

落とし穴2：分母の定義ブレ

「1 PR = 1デプロイ」なのか「1回のデプロイパイプライン実行 = 1デプロイ」なのかで数値は大きく変わる。CI/CDパイプラインの構成と合わせて定義を統一する必要がある。パイプラインの最適化についてはCIが遅い原因を分解するも参照してほしい。

落とし穴3：CFR単独での判断

CFRだけを見ていると「変更しなければ事故は起きない」という誤った方向に進む。デプロイ頻度・リードタイム・MTTRと組み合わせて4指標をセットで見ることが重要だ。KPI同士の関係性と学習ループの回し方はAI開発KPIと学習ループで体系的に整理している。

FAQ

Q. AI変更のChange Failure Rateをどう測るかを実践する最初のステップは何ですか？ A. AI変更のChange Failure Rateをどう測るかを始めるには、まず本記事の前提条件と基本概念を確認し、コード例や設計例を実際の環境で試すことをお勧めします。

まとめ

CFRをAI時代のチームで活用するためのステップは3つだ。

failureの定義を揃える -- 障害・切り戻し・緊急修正の3分類をチームで合意する
リスクベースでレビュー強度を変える -- すべてのPRに同じ工数をかけない
4指標セットでトレンドを追う -- CFR単独で判断しない

まずは「何をfailureと呼ぶか」の定義をチームで1回揃えるところから始めてほしい。定義が決まれば計測は自動化できるし、計測できれば改善サイクルが回る。

References

この記事をシェア

X はてブ LINE

G

Growth Lab編集部

AI開発 / DORA / 品質指標

AI駆動、AIエージェント、仕様駆動、ハーネスエンジニアリングを実装ベースで検証し、再現可能な手順へ落とし込むことを目的に運営しています。

← 前の記事人間へのエスカレーション設計

次の記事 →AI記事制作の品質設計

同じテーマや近い文脈の検証を続けて確認できます。

タグ一致

DORA Change Failure Rate AI開発

AI変更後のCFR再定義ガイド：膨らむ失敗率を実務で扱う

AIコーディング導入後に Change Failure Rate（CFR）が膨らむ 3 因子を整理し、AI-augmented と human-authored の failure を分離する 4 ステップの再定義フレームを Tech Lead / EM 向けに提示する。DORA 公式値と 2025-26 観測ベースで CFR を実務に戻す。

Growth Lab編集部

20分公開 2026/5/7

タグ一致

AI開発オンボーディングエンジニア育成

AI駆動開発チームのオンボーディング設計

AI駆動開発チームへの新人参加時、最初の8週間で何を教えるべきか。AIへの依存リスク・コンテキスト設計・AIコードレビューの3軸で失敗パターンを類型化し、段階的カリキュラムの骨格を提供します。AI駆動開発チームへの新人参加で起きる失敗は「依存過多」「コンテキスト設計不能」「AI生成コードをレビューできない」の3類型に。

Growth Lab編集部

21分公開 2026/6/21

タグ一致

AI ペアプログラミング Claude Code

AIとペアプロする実践パターン：コンテキスト設計と引き継ぎの技術

Claude CodeやGitHub CopilotとのAIペアプロで迷いがちなコンテキスト設計・セッション引き継ぎ・人間介入のタイミングを、即使える実践パターン集として体系化。AGENTS.mdテンプレートも収録。

Growth Lab編集部

20分公開 2026/6/16

継続接点

更新を追いかける

新着記事、特集、検証ログをまとめて追える入口として使う。メール購読導線の本実装前でも、継続接点を切らさない。

新着記事をまとめて確認できる
関連記事や特集ページへつながる
実験ログを継続的に追える

記事一覧をフォローする

本実装ではメール購読や通知機能へ差し替え可能。