OpenAI Codex Field Guide 2026

OpenAI Codex 実践ガイド

App・CLI・IDE・Cloud の使い分けから、AGENTS.md、MCP、skills、worktree、automation、review 運用まで。公式 docs と GitHub 実例をもとに、実務で崩れにくい使い方へ整理した日本語ガイドです。

4

surface choices

7

workflow recipes

5

operation layers

13

sections

1

AGENTS system

Mobile Nav

全て / 13 セクション表示

00初級

全体像

Codex を使いこなすための最短地図

Section 00

Codex は「チャットで質問する道具」ではなく、コードを読み、編集し、検証し、必要なら複数の作業面に分割して進める実務用エージェントです。強いのは回答の美しさより、手順の再現性と運用の積み上げです。

このページを貫く 5 層

Layer 1
Surface

App / CLI / IDE / Cloud のどこで走らせるかを先に決める。

Layer 2
Prompt

Goal・Context・Constraints・Done を揃えて依頼する。

Layer 3
Persistent Context

会話ではなく AGENTS.md に恒常ルールを書く。

Layer 4
Capability

MCP と skills で「触れられる世界」と「再利用知識」を増やす。

Layer 5
Operation

worktree・review・automation で並列運用と安全性を設計する。

最初に理解しておくこと

01初級

どこで使うか

App / CLI / IDE / Cloud の使い分け

Section 01
01
App

複数スレッド管理、worktree、automation、レビュー整理まで含めて運用したいとき。

02
CLI

端末中心で速く回したいとき。ローカルコマンド実行や小さな修正に強い。

03
IDE

編集中のファイルを軸に対話したいとき。既存エディタ導線を崩したくないチーム向け。

04
Cloud

バックグラウンド実行や PR 単位の作業に寄せたいとき。ローカルを閉じても流せる。

使い分けの基準

最初に「どこで回すか」を決めるだけで、プロンプト・権限・検証方法が一気に整理されます。Codex は万能 UI ではなく、作業モードごとに最適面が違う道具です。

迷ったときの選び方

  • 単発の修正や探索は CLI
  • 複数案件を平行で持つなら App
  • 既存の IDE 体験を崩したくないなら IDE extension
  • 長時間作業や PR 単位の実行は Cloud を候補にする
02初級

最初の 30 分

初回セットアップでやることを固定する

Section 02

初回はコードを書かせるより、リポジトリの制約を認識させる方が重要です。インストール後すぐに実装依頼へ行くと、プロジェクト前提のない雑な差分が増えます。

最初の 30 分で叩く流れ

bash

codex

# まずは現状把握
> このリポジトリの構成、ビルド方法、主要な制約を要約してください

# ルールを外出し
touch AGENTS.md

# 次に AGENTS.md の初稿作成を依頼
> このリポジトリ向けに AGENTS.md の初稿を作ってください。
> 含めたいのは coding rules、test command、deploy 禁止事項、review 観点です。

初回セットアップの完了条件

03初級

依頼テンプレート

Goal / Context / Constraints / Done で書く

Section 03
G
Goal

何を実現したいか。機能追加か、バグ修正か、レビューかを明示する。

C
Context

対象ファイル、関連仕様、既存制約、周辺機能を先に渡す。

C
Constraints

触ってよい範囲、触ってはいけない範囲、使ってよい技術を指定する。

D
Done

完了条件と検証方法を書く。lint、type-check、手動確認もここに入れる。

Codex に渡す最初の依頼の型

markdown

Goal:
会員ダッシュボードの請求カードに「次回請求日」を表示したい

Context:
- Next.js App Router
- 対象は src/components/dashboard/BillingCard.tsx
- 既存 API は変更しない

Constraints:
- UI の大幅改変はしない
- 型 safety を崩さない
- 既存の loading / error 状態を維持する

Done when:
1. 表示ロジックが追加されている
2. type-check が通る
3. 影響範囲を短く説明できる

悪い依頼を防ぐための確認

04初級

AGENTS.md 完全ガイド

恒常ルールは会話でなくファイルに置く

Section 04

OpenAI 公式 docs でも、Codex の継続運用は AGENTS.md が中心です。会話に毎回書くと抜け落ちるルールを、ホームディレクトリ・プロジェクト root・配下ディレクトリの階層で管理します。

01
Global

~/.codex/AGENTS.md。個人の共通作法や言語設定を書く。

02
Project

repo root の AGENTS.md。テストコマンド、レビュー観点、禁止事項を書く。

03
Nested

特定ディレクトリだけ別ルールがあるときに配下へ追加する。

04
Override

一時的に上書きしたいなら AGENTS.override.md を使う。

最初の AGENTS.md テンプレート

markdown

# Project Rules
- Use TypeScript and preserve existing App Router patterns
- Prefer small diffs over broad rewrites
- Run `npm run type-check` after touching app code
- Do not change deploy scripts or production env files

# Review Checklist
- Check loading / empty / error states
- Keep metadata and navigation intact
- Do not edit unrelated files

# Communication
- Explain impact before editing
- Summarize changed files and verification at the end

AGENTS.md の書き方

  • 理想論より、機械が解釈できる短いルールを書く
  • 長文化しすぎない。公式 docs でも既定の読み込み上限がある
  • プロンプトと重複する一時要求は AGENTS ではなく会話に置く
  • プロジェクトルールと個人ルールを混ぜない
05中級

実務ワークフロー集

代表的な依頼をレシピ化する

Section 05

まずテンプレ化したい 7 パターン

01
コード理解

構成整理、依存関係、危険箇所の把握。

02
バグ修正

再現条件、原因仮説、最小修正の流れ。

03
UI 改修

対象コンポーネントと維持条件を固定する。

04
テスト追加

何を担保したいかを先に決める。

05
リファクタ

挙動不変と差分範囲を明記する。

06
レビュー

変更内容より、リスクと回帰を探させる。

07
文書更新

コード差分と docs のズレを埋める。

バグ修正レシピ

markdown

Goal:
特定条件でモーダルが閉じない不具合を修正したい

Context:
- 再現手順: ...
- 対象候補: src/components/.../Modal.tsx
- 関連 state: isOpen, pendingAction

Ask:
1. 原因仮説を 3 つ
2. 最も筋の良い修正方針
3. 影響範囲
4. 修正後に実行する確認項目

Code only after the plan is accepted.

どのワークフローでも共通の枠

06中級

設定と安全性

権限は最小から始める

Section 06

Codex の品質はモデルだけでなく、approval mode と sandbox 設計に大きく依存します。便利さを優先して最初から広い権限を与えると、事故が起きたときに再現不能になります。

01
Approval

コマンド実行や外部アクセスの承認をどう扱うか。最初は慎重寄りがよい。

02
Sandbox

どこまでファイルやネットワークを触らせるか。用途ごとに変える。

03
Reasoning

深い推論が必要な場面だけ上げる。常時最大にしない。

04
Verification

生成より検証が重要。type-check、lint、manual QA を先に決める。

安全に始めるための原則

  • 最初は default permissions から入る
  • デプロイ、env、決済、認証は AGENTS.md で明示的に保護する
  • 危険なコマンドは実行前に理由を出させる
  • レビュー用セッションと実装用セッションを分ける

本番系リポジトリに入れる前の確認

07中級

MCP 活用

repo の外へ安全に触れさせる

Section 07

MCP は Codex の知能を上げるものではなく、アクセスできる世界を広げる仕組みです。だから導入の判断基準は「便利そう」ではなく「手動ループをどれだけ消せるか」で考えるべきです。

01
Docs MCP

最新仕様や SDK docs を引かせたいとき。ライブラリ更新の影響調査に強い。

02
Browser MCP

画面確認や DOM/console の確認を Codex から行いたいとき。

03
Design MCP

Figma やデザインソースから UI 情報を取る導線に向く。

04
Data MCP

DB、社内 docs、外部システムなど限定的なデータ参照に使う。

MCP 導入時に先に決めること

markdown

1. 何の手作業を消すのか
2. 読み取り専用で足りるか
3. どの surface から使うか
4. 失敗時に人間がどう介入するか
5. AGENTS.md に利用方針を書くか

MCP を入れる前の確認

08中級

Skills 設計

繰り返す知識を部品化する

Section 08
01
AGENTS.md

常に読むべきルール。

02
Skill

特定タスクでだけ呼び出す再利用知識。

03
MCP

外部ツールやデータへの接続。

切り分けの原則

全員が毎回知るべきことは AGENTS.md。ある種の仕事でだけ効く知識は skill。repo 外に触れる必要があるなら MCP。ここを混ぜると運用が破綻します。

skill 化しやすいテーマ

text

- design review
- migration checklist
- API contract review
- accessibility pass
- deployment verification
- analytics QA

良い skill の条件

  • description が具体的で呼び出し条件が明確
  • 長いプロンプトの丸写しではなく、手順化されている
  • 参照ファイルが最小限で済む
  • 出力形式まで規定されている
09高級

Worktree と並列運用

複数エージェントを物理的に分ける

Section 09

同じ checkout 上で複数の Codex セッションを同時に動かすと、どの差分がどの意図で入ったか追えなくなります。並列運用するなら、最初から worktree で作業面を分ける方が安全です。

01
Main

仕様確認と統合作業。ここで最終判断を持つ。

02
Research

調査だけを切り離す。依存更新や仕様把握向け。

03
Implementation

機能追加や UI 改修など、差分を作る面。

04
Review

別視点でリスク確認を回す。確証バイアスを減らせる。

worktree の最小パターン

bash

git worktree add ../quadnewweb-review codex/review-pass
git worktree add ../quadnewweb-feature codex/dashboard-billing

# review 用 Codex
cd ../quadnewweb-review && codex

# implementation 用 Codex
cd ../quadnewweb-feature && codex

並列運用のルール

10高級

Automations

定型タスクを夜間・定時運用へ移す

Section 10

Automation は「便利だから入れる」ものではなく、既に手動で安定している手順を定期実行に移すための層です。いきなり本番タスクを自動化するのではなく、まずはレビューや整理のような低リスク業務から始めるべきです。

01
Morning Triage

前日の PR、issue、失敗ジョブを朝に整理する。

02
Release Check

main への変更と deploy 手順の齟齬を検査する。

03
Doc Drift

コードと docs のズレを洗い出す。

automation に向く依頼文の型

markdown

対象:
昨日 merge された変更

やること:
1. 差分を要約
2. リスクを 3 点抽出
3. docs 更新漏れを確認
4. 必要なら inbox item を作る

禁止:
- 自動 commit しない
- deploy しない
- 本番設定を変えない

最初の automation 候補

  • PR 要約
  • docs 更新漏れ検知
  • テスト失敗の整理
  • 日次の review inbox 作成
11中級

Review と GitHub 連携

実装役とレビュー役を分ける

Section 11

Codex は生成 agent としてだけでなく、レビュー agent としても強いです。特に GitHub 上の変更を前提に「壊れやすい箇所」「仕様に対する欠落」「テスト不足」を見つけさせる使い方が有効です。

01
Diff Review

変更差分を読ませて回帰と設計崩れを確認する。

02
PR Summary

意図、影響範囲、要確認点を短く再構成する。

03
Test Gap

変更に対して不足しているテスト観点を洗い出す。

04
Deploy Risk

本番フローに影響する変更かどうかを事前判定する。

レビュー依頼のテンプレート

markdown

この変更をコードレビューしてください。

重点観点:
1. バグや回帰
2. 型・状態管理の不整合
3. エッジケース漏れ
4. テスト不足

出力形式:
- Findings を重要度順に
- Open questions
- 変更概要は最後に短く

レビューで外したくない観点

12初級

よくある失敗

Codex 導入が崩れる典型パターン

Section 12
01
会話に全部書く

毎回長文で説明し、恒常ルールを AGENTS.md に出していない。

02
いきなり実装させる

計画なしで手を動かさせ、差分が太くなる。

03
権限を広げすぎる

検証設計より先にフルアクセスを与える。

04
同一 checkout で並列実行

複数タスクが混線してレビュー不能になる。

崩れない運用の本質

Codex の失敗はモデル性能より、運用境界の曖昧さから起きます。どこまで任せるか、何を固定化するか、どう検証するかを先に決めるだけで品質は大きく変わります。

運用を立て直すときに戻る場所