Growth Lab

AI Agent Agent Engineering Software Development Automation

プロンプトからエージェントへ

Growth Lab編集部公開 2026/2/1122分で読める

この記事の作成基準: 編集方針 · AI利用方針

プロンプトからエージェントへ

ショート動画

Operating Model責任分界、ルール、導線を整理し、チーム運用へ落とし込む

運用設計の前提

プロンプトを工夫するだけの段階は終わりました。AIの真価を引き出すのは、自律的なワークフローを設計する『エージェントエンジニアリング』です。Context/Capability/Critical Thinkingの3要素による次世代の開発パラダイムを解説。

「プロンプトからエージェントへ」は、責任分界 / 判断ルール / 導入ステップを先に押さえると読みやすい構成です。

Focus

責任分界
判断ルール
導入ステップ

設計判断を見る

Operating Model

責任分界判断ルール導入ステップ

プロンプトからエージェントへ：AI駆動開発を加速させる「エージェントエンジニアリング」への転換

TL;DR — プロンプトを磨く時代は終わり、AIに「ゴール・道具・権限」を渡して自律的に動かすエージェントエンジニアリングが主流になった。設計の軸は Context（知識環境）・Capability（実行能力）・Critical Thinking（自己修正） の3つ。まずは小さな自律ループから始めよう。

AIツール（ChatGPT, Gemini, Claude, Cursor）が登場した当初、私たちの関心は「いかに完璧なプロンプトを書くか」にありました。いわゆる「プロンプトエンジニアリング」の時代です。しかし、2026年の現在、開発の最前線ではすでに次のパラダイムシフトが起きています。

それは、「プロンプトエンジニアリング」から「エージェントエンジニアリング」への転換です。このパラダイムシフトの背景と、実践に移すための思考法についてはプロンプトからエージェントエンジニアリングへの転換でも詳しく解説しています。

2026 年中頃の業界状況として、Claude Code 公式 docs では Hooks / Subagents / Skills の 3 拡張レイヤーが標準提供され[公式値]、OpenAI Codex CLI 公式も MultiAgentV2 の sub-agent 並列実行を正式サポート[公式値]、GitHub Copilot coding agent も Self-Review と Security Scanning を内蔵化しました[公式値]。本記事の主張する「Context / Capability / Critical Thinking」の 3 要素は、これら最新ツールの設計思想と整合しています。

1. 「出す」プロンプトから「任せる」エージェントへ

プロンプトエンジニアリングは、AIに対して「何をすべきか」を詳細に、かつ一撃で説明する手法です。しかし、どれほどプロンプトを工夫しても、人間がすべてのステップを手動で指示し、出力を確認し、次のプロンプトを打つというプロセス（Human-in-the-loop）がボトルネックになります。

一方、エージェントエンジニアリングは、AIに**「ゴール」と「道具（ツール）」と「権限」**を与え、目的達成まで自律的に試行錯誤させるワークフローを設計することを指します。もはや人間は「命令者」ではなく、エージェントが円滑に動くための環境を整える「オーケストレーター」となります。

両者の違いを整理すると、次のようになります。

観点	プロンプトエンジニアリング	エージェントエンジニアリング
人間の役割	命令者（都度指示を出す）	オーケストレーター（環境を整える）
AI の動き方	1回の入出力で完結	ゴールに向かって自律的にループ
ボトルネック	人間の指示速度	ワークフロー設計の質
成果物	単発のテキスト/コード	継続的に動く自動化パイプライン

2. エージェントエンジニアリングの3要素

優れたエージェントワークフローを構築するためには、以下の3つの要素を設計する必要があります。

① Context（知識と環境の接続）

エージェントが判断を下すために必要な「背景情報」をいかに過不足なく与えるかです。

リポジトリのルール: .claudecodeignore や CLAUDE.md による制約。CLAUDE.md / AGENTS.md / Skill の役割分担は CLAUDE.md 最適化と Skill との分担を参照
ドメイン知識: 過去の設計書やドキュメントとの動的な接続。仕様駆動開発の落とし穴は仕様駆動開発の落とし穴と対策で扱う
現在のステート: エージェントが現在どのタスクを処理中で、何が未完了かを把握する仕組み（task.md 等）。観測基盤の設計は AIエージェントの可観測性と障害解析を参照

② Capability（実行可能な能力の定義）

エージェントが「何ができるか」をツール（Skill）として定義することです。具体的なスキル定義ファイルの書き方は「スキル定義ファイル」でプロンプトを再利用可能な資産にする方法を参照してください。Skill と Subagent の使い分け基準は Skills対Subagents使い分け5軸で整理しています。

ファイル操作: コードを読み書きする能力
ターミナル実行: テストを走らせ、エラーを確認する能力。Hook による deterministic 制御は Claude Code hooks の実践パターン集を参照
Web検索/ブラウザ操作: 最新情報を取得し、外部サービスを操作する能力
MCP 経由の外部ツール接続: tool 粒度の決め方と権限設計は MCPサーバー設計パターン集と MCP権限設計の判断軸で扱う
Responses API / Tool Use: ツール呼び出しの API 設計判断は Responses API 時代のツール呼び出し設計を参照

これらの能力を「一塊のスキル」としてパッケージ化することで、エージェントの行動範囲が明確になります。承認ゲートを Hook で強制する運用例は PlanGate v8.6 Hook Enforcement を参照してください。

③ Critical Thinking（自己修正とループ）

失敗を前提とし、自ら軌道修正するロジックを組み込むことです。このループ設計の詳細はSkillとToolを結合して「勝手に仕事を見つける」自律エージェントを作るで掘り下げています。

テスト駆動: コードを書いた後に自動でテストを回し、失敗したら自分で修正するループ。durable workflow による安定化は agent loop を durable workflow で安定化する実装を参照
セルフレビュー: 書き終えた成果物を、別の視点（Reviewer役割）から検証するステップ。GitHub Copilot coding agent の Self-Review もこの思想で実装されています[公式値]
プランニング: 実行前に手順を構成し、人間と合意形成するプロセス。レビュー運用設計は AI時代のレビュー運用設計を参照

典型的な自律ループのフローは次のとおりです。

Plan → Execute → Test → (失敗?) → Self-Fix → Re-Test → Review → Done

エラーハンドリングと観測指標は別軸で必須です。retry / idempotency / circuit breaker の実装パターンはエラーハンドリング設計ガイドを、長時間運用時の疲弊回避はオンコール疲弊を防ぐ運用設計を参照してください。

3. 実戦：小さなタスクからエージェントに委ねる方法

いきなり大規模な開発をすべて任せるのは困難です。まずは以下のような「小さな自律ループ」から設計を始めましょう。

ブログ記事のSEO最適化: 記事を読み込み、SEOタイトルを生成し、フロントマターを書き換える
Lintエラーの自動修正: 静的解析ツールを走らせ、指摘された箇所を自動で修正し、再度検証する
ドキュメントの相互参照チェック: 仕様書とコードの不整合を見つけ、修正提案を行う

これらを「単なるプロンプト」ではなく、一連の**スキル（Skill）**として定義し、ボタン一つ（あるいは自動トリガー）で完走するように設計するのがエージェントエンジニアリングの第一歩です。

4. 未来のエンジニア像：エージェントのオーケストレーター

これからのエンジニアに求められるのは、優れたコードを自ら書く力以上に、「24時間365日、高品質なコードを書き続けるエージェントチーム」をマネジメントする能力です。

コードを書く作業はエージェントに委ねられ、人間はアーキテクチャの戦略、品質の最終定義、そしてエージェント同士の「通信プロトコル（意思疎通）」の設計に注力することになります。複数エージェントの役割分担や権限設計の実践パターンはAIをチームメンバーとして働かせる運用プレイブックにまとめています。

サブエージェントの粒度や責務分離をどう設計するかについてはClaude Code subagents の実運用パターンも参考になります。

まとめ：今日から始めるエージェントとのチーム開発

「プロンプトエンジニアリング」がAIとの会話の基礎だとすれば、「エージェントエンジニアリング」はAIと共に生きるためのインフラ設計です。

まずは、あなたのリポジトリに CLAUDE.md や task.md を作成し、エージェントが「自ら次の一歩を考えられる環境」を作ってみてください。一撃の魔法の言葉を探すのをやめ、自走する仕組みを設計し始めた瞬間、あなたの生産性は劇的な変化を遂げるはずです。

次に読む記事

FAQ

Q1. プロンプトエンジニアリングとエージェントエンジニアリングは別物ですか？

別物ではなく、前者を内包する上位概念です。優れたエージェントワークフロー設計でも、エージェント内部のプロンプトは依然として重要ですが、ボトルネックがプロンプト品質から「Context / Capability / Critical Thinking の設計品質」に移った、というのが本記事の主張です（経験則）。

Q2. Claude Code / OpenAI Codex CLI / GitHub Copilot のうち、エージェントエンジニアリングに最適なツールは？

単一最適解はなく、役割分担が現実解です。Claude Code は Hooks / Subagents / Skills の再利用性で長期運用に強く[公式値]、OpenAI Codex CLI は MultiAgentV2 で並列タスクに強く[公式値]、GitHub Copilot coding agent は Issue → PR の閉ループで組織運用に強い[公式値]、というのが 2026-05 時点の傾向です。詳細は 2026年の AIコーディング自動運転最前線を参照。

Q3. 「小さな自律ループ」から始めるとは、具体的にどのくらいの粒度ですか？

実務目安として 「1 タスク 5〜30 分で完走するループ」 が現実解（経験則）。SEO 最適化、Lint エラー修正、ドキュメント整合性チェック等、確実に検証可能なタスクを選びます。詳細は SkillとToolで自律ループを構築するを参照。

Q4. エージェントの暴走や事故をどう防ぎますか？

Hook による deterministic な制御 + 権限境界（MCP / OAuth）+ 観測（agent-observability）の 3 層で防ぎます。具体的な実装パターンは Claude Code hooks の実践パターン集、権限設計は MCP権限設計の判断軸、承認境界の強制は PlanGate v8.6 を参照[公式値]。

Q5. 組織全体に展開する手順は？

Skills（最初）→ Hooks（次）→ Subagents（最後） の順で段階導入するのが現実解です（経験則）。組織展開の具体的な段階設計は AIコーディング組織展開の段階設計を参照してください。

References

この記事をシェア

X はてブ LINE

G

Growth Lab編集部

AI Agent / Agent Engineering / Software Development

AI駆動、AIエージェント、仕様駆動、ハーネスエンジニアリングを実装ベースで検証し、再現可能な手順へ落とし込むことを目的に運営しています。

← 前の記事AIエージェントチーム設計

次の記事 →Gemini APIのJSON崩れを絶対に許さない

同じテーマや近い文脈の検証を続けて確認できます。

タグ一致

AI Agent 認可 OAuth 2.1

AI Agent 認可境界の設計パターン4モデル

AI コーディング時代の「人間 + Agent + Tool」3 者間の認可境界を、user × agent / agent × tool / agent × agent / agent × data の 4 モデルで整理。OAuth 2.1 / MCP scope / Capability token / OWASP LLM Top 10 を参照しながら、AI Agent の transient 権限を扱う実装パターンを Backend / Security / EM 向けに提示する。

Growth Lab編集部

22分公開 2026/5/7

タグ一致

Platform Engineering IDP Backstage

自社IDP構築の現実的なロードマップ

Backstage 単独導入では止まる IDP を、AI Agent 時代の catalog / permission / golden path 設計と 4 段階ロードマップで Platform Team・EM・CTO 向けに整理した実務テンプレ。

Growth Lab編集部

43分公開 2026/5/1

タグ一致

Multimodal Content Strategy Automation

マルチモーダル・ブログ戦略

テキスト・図解・動画を『1回の思考』で生成するマルチモーダル戦略の全体像を解説。AIエージェントを繋ぎ込み、エンジニアの発信力を最大化する未来型パイプラインを紹介します。コンテンツ発信の分散化：テキスト、画像、動画など、現代におけるエンジニアの発信媒体は多岐にわたります

Growth Lab編集部

10分公開 2026/2/22

継続接点

更新を追いかける

新着記事、特集、検証ログをまとめて追える入口として使う。メール購読導線の本実装前でも、継続接点を切らさない。

新着記事をまとめて確認できる
関連記事や特集ページへつながる
実験ログを継続的に追える

記事一覧をフォローする

本実装ではメール購読や通知機能へ差し替え可能。