AI Dev Agent v1
はじめに
AI Dev Agent v1はAutonomous Engineerシステムの最初の実践的な実装です。
v1の目標は、仕様駆動開発(SDD)に基づいた構造化されたソフトウェア開発ワークフローを実行できる単一の自律開発エージェントを構築することです。
自律エンジニアリング組織の完全な長期ビジョンを実装するのではなく、v1は信頼性が高く拡張可能な基盤の構築に焦点を当てています。
このバージョンは自律開発ワークフローに必要なコアインフラストラクチャを確立します。
将来のバージョンはこのシステムをマルチエージェントアーキテクチャへと拡張します。
目標
AI Dev Agent v1の主な目標は、単一の仕様に対するエンドツーエンドの開発ワークフローを自動化することです。
システムは以下のライフサイクルを実行できる必要があります:
- 仕様の初期化
- 要件の生成
- システム設計の作成
- 設計の検証
- 実装タスクの生成
- タスクの実装
- 生成されたコードのレビューと改善
- 変更のコミット
- プルリクエストの作成
このワークフローは最小限の人間の介入で実行されるべきです。
開発ワークフロー
エージェントは決定論的なワークフローを実行します。
典型的な実行フロー:
SPEC_INIT (llm slash command: `/kiro:spec-init <spec-name>`)
↓
HUMAN_INTERACTION (user input minimum requirements on `requirements.md` manually)
↓
VALIDATE_PREREQUISITES (llm prompt)
↓
SPEC_REQUIREMENTS (llm slash command: `/kiro:spec-requirements <spec-name>`)
↓
VALIDATE_REQUIREMENTS (llm prompt)
↓
REFLECT_ON_EXISTING_INFORMATION (llm prompt)
↓
VALIDATE_GAP (llm slash command: `/kiro:validate-gap <spec-name>` optional)
↓
CLEAR_CONTEXT (llm slash command: `/clear`)
↓
SPEC_DESIGN (llm slash command: `/kiro:spec-design -y <spec-name>`)
↓
VALIDATE_DESIGN (llm slash command: `/kiro:validate-design <spec-name>` optional)
↓
REFLECT_ON_EXISTING_INFORMATION (llm prompt)
↓
CLEAR_CONTEXT (llm slash command: `/clear`)
↓
SPEC_TASKS (TASK_GENERATION) (llm slash command: `/kiro:spec-tasks -y <spec-name>`)
↓
VALIDATE_TASK (llm prompt)
↓
CLEAR_CONTEXT (llm slash command: `/clear`)
↓
IMPLEMENTATION LOOP (repeat per task group):
SPEC_IMPL (llm slash command: `/kiro:spec-impl <spec-name> [task-ids]`)
↓
VALIDATE_IMPL (llm prompt)
↓
COMMIT (git command)
↓
CLEAR_CONTEXT (llm slash command: `/clear`)
↓
PULL_REQUEST (git command)各ステージは次のステージを導く構造化されたアーティファクトを生成します。
(llm) マークのフェーズは人間の承認ゲートなしにオーケストレーター内で自動実行されます。reflect-on-existing-information ステップは完了したフェーズを振り返り、ステアリングドキュメント、ルール、コマンドなどのエージェントリソースの改善ヒントを洗い出すポストフェーズ振り返りです。
この構造はAIの推論を改善し曖昧さを削減します。
サポートされる仕様フレームワーク
システムは複数の仕様駆動開発フレームワークをサポートしなければなりません。
v1の主なターゲット:
cc-sddしかし、アーキテクチャは将来的に追加フレームワークをサポートしなければなりません。
潜在的なフレームワーク:
OpenSpec
SpecKit統合はアダプターを使用して実装しなければなりません。
コア機能
AI Dev Agent v1はいくつかの主要な機能を導入します。
ワークフロー自動化
ワークフローエンジンが開発フェーズを調整します。
エンジンは以下を管理します:
- フェーズ遷移
- 実行順序
- コンテキスト分離
ワークフローエンジンはシステムの中央コーディネーターとして機能します。
仕様実行
エージェントは仕様駆動開発システムと対話して開発アーティファクトを生成します。
典型的な仕様アーティファクト:
- 要件ドキュメント
- 設計ドキュメント
- タスク定義
これらのアーティファクトは実装の基盤となります。
タスク実装ループ
仕様フェーズ中に生成されたタスクは順次実行されます。
各タスクセクションは構造化されたループに従います:
実装
↓
レビュー
↓
改善
↓
コミットこのループは出力がレビュー基準を満たすまで継続されます。
自動コードレビュー
システムは開発中に自動レビューサイクルを実行します。
レビュープロセスは以下を確認します:
- 設計との整合性
- 要件の充足
- コード品質
- アーキテクチャの一貫性
レビューからのフィードバックは生成された出力の改善に使用されます。
Git統合
エージェントはリポジトリ操作を自動的に管理します。
典型的なアクション:
フィーチャーブランチの作成
タスクの実装
変更のコミット
ブランチのプッシュ
プルリクエストの作成これにより完全自動化された開発パイプラインが可能になります。
コンテキスト管理
LLMコンテキストを効率的に管理することは重要です。
システムはコンテキストの汚染と不必要なトークン使用を避けなければなりません。
いくつかの戦略が使用されます。
フェーズベースのコンテキストリセット
ワークフローが新しいフェーズに入るとき、コンテキストはリセットされるべきです。
例:
requirements → design前のフェーズの会話コンテキストは持続すべきではありません。
タスクベースのコンテキスト分離
各タスクセクションは最小限のコンテキストで実行されるべきです。
関連するファイルとドキュメントのみが含まれるべきです。
アーティファクトベースのプロンプティング
長い会話ではなく、プロンプトは構造化されたアーティファクトを参照すべきです。
例:
- 仕様ドキュメント
- 設計ドキュメント
- 関連するコードファイル
これにより、プロンプトが簡潔で集中したものになります。
メモリ(初期バージョン)
AI Dev Agent v1は基本的な永続メモリシステムを導入します。
メモリはリポジトリレベルで保存されます。
例:
.memory/
project_rules.md
coding_patterns.md
review_feedback.mdこれにより、エージェントが時間とともに知識を蓄積できます。
v1のメモリシステムは意図的にシンプルです。
将来のバージョンはより高度な知識ストレージシステムを導入します。
自己修復ループ
AIが問題の解決に苦労している場合、システムは自分自身の動作を改善しようとすべきです。
自己修復プロセス:
実行の困難
↓
失敗分析
↓
欠けている知識の特定
↓
ルールの更新出力例:
rules/
coding_rules.md
review_rules.md
implementation_patterns.mdこのメカニズムにより、エージェントは徐々にパフォーマンスを向上させることができます。
AIモデルサポート
システムは抽象化を通じて複数のAIプロバイダーをサポートしなければなりません。
初期プロバイダー:
Claude将来のプロバイダー:
OpenAI Codex
Cursor
GitHub Copilotコアシステムは特定のプロバイダーAPIに直接依存してはなりません。
システムスコープ
AI Dev Agent v1は単一エージェントオーケストレーションに焦点を当てています。
エージェントはすべての開発アクティビティを順次実行します。
責務:
- 仕様実行
- タスク実装
- コードレビュー
- 改善
- Git操作
システムはまだ協調エージェントをサポートしていません。
スコープ外
いくつかの高度な機能はv1から意図的に除外されています。
これらの機能は将来のバージョンで計画されています。
例:
- マルチエージェント調整
- 高度な知識グラフ
- 分散開発ワークフロー
- マルチリポジトリオーケストレーション
- 大規模プロジェクト計画
これらの機能は将来のバージョンのシステムに属します。
将来のバージョンとの関係
AI Dev Agent v1は将来の自律エンジニアリングシステムの基盤です。
将来のバージョンでは専門エージェントが導入される可能性があります。
例:
プランナーエージェント
仕様エージェント
実装エージェント
レビューエージェント
アーキテクチャエージェントこれらのエージェントが協力してAIエンジニアリングチームを形成します。
AI Dev Agent v1はこの進化に必要なインフラストラクチャを提供します。
成功基準
AI Dev Agent v1は以下ができれば成功とみなされます:
- 完全な仕様駆動開発ワークフローの実行
- タスクの自律的な実装
- レビューループの実行
- 変更の自動コミット
- プルリクエストの作成
- LLMコンテキストの効率的な管理
- 時間とともにプロジェクト知識を蓄積
これらの目標を達成することで、自律ソフトウェアエンジニアリングの強固な基盤が確立されます。
実装戦略
システムは複数の仕様を通じてインクリメンタルに実装されます。
各仕様は明確な境界、依存関係、受け入れ基準を持つ特定の開発マイルストーンを定義します。
完全な仕様の詳細は docs/agent/dev-agent-v1-specs.md に維持されています。
v1仕様計画の概要:
| 仕様 | 名前 | フォーカス |
|---|---|---|
| spec1 | orchestrator-core | CLI、ワークフローステートマシン、cc-sddアダプター、LLM抽象化 |
| spec2 | tool-system | ツールインターフェース、レジストリ、エグゼキューター、5ツールカテゴリー |
| spec3 | agent-safety | ワークスペース分離、ガードレール、サンドボックス、人間承認 |
| spec4 | agent-loop | PLAN→ACT→OBSERVE→REFLECT→UPDATE、エージェント状態、イテレーション制御 |
| spec5 | memory-system | プロジェクトメモリ、知識メモリ、失敗メモリ、取得 |
| spec6 | context-engine | 7レイヤーコンテキスト、プランナー、トークンバジェット、圧縮 |
| spec7 | task-planning | Goal→task→steps階層、動的修正、永続化 |
| spec8 | git-integration | ブランチ、コミット、プッシュ、プルリクエスト |
| spec9 | implementation-loop | Implement→review→improve→commit、品質ゲート |
| spec10 | self-healing-loop | 失敗分析、ルール更新、再試行 |
| spec11 (v1.x) | codebase-intelligence | ファイルスキャナー、パーサー、シンボルインデックス、依存グラフ、セマンティック検索 |
この段階的アプローチにより、各仕様が独立して使用可能な機能を提供しながら、システムが制御可能でテスト可能な方法で進化します。
まとめ
AI Dev Agent v1は自律ソフトウェア開発の実践的な実装を導入します。
主要機能:
- 仕様駆動ワークフロー
- 自動タスク実行
- 反復レビューループ
- Git統合
- コンテキスト対応AIオーケストレーション
- 基本的な永続メモリ
このバージョンは自律開発システムのコアエンジンの構築に焦点を当てています。
将来のバージョンはこれを複雑なソフトウェアエコシステムを処理できるマルチエージェントエンジニアリングプラットフォームへと拡張します。