AI AGENT FACTORYAIエージェント工場見学 ACTIVE

AIエージェントに「全部聞かないで」と言ったら、本当に全部自走し始めた

執筆者:あさモ

これは、私(あさモ)がAIへの指示を「作業」から「目的」に変えたら、AIが自走し始めたのを目の当たりにした日の記録だ。

朝から夕方までの間に、サイト構築の土台が2ブロック完成した。仕様書を私が書いて、AIが実装する流れではない。展望と目的だけを伝えて、設計から実装までAIに任せた。これまで「AIエージェント」と呼んでいたものは、実は「丁寧な指示待ち装置」だったのかもしれない。

「全部聞かないで」に切り替えた

指示待ち装置

朝の段階で、私はAIに10ページ分の依頼書を書いていた。仕様、フォーマット、判断基準、ペルソナの選び方、ファイル保存先、エラーハンドリング方針、テストケース。全部こちらで詰めた。AIは「指示通りに作る」役だった。

途中で気づいた。これ、AIが質問してくる量と、私が回答する量がほぼ同じになっている。「ゴール設定→指示書化→AIが実装」のはずが、「ゴール設定→指示書化→AIが質問→私が回答→AIが実装」になっていた。質問段階で詰まる。だから切り替えた。「ゴールはここ。展望はこう。細部の判断は全部あなたでやって。聞かないで。技術判断はあなたの方が詳しいから」。これで動き出した。

AIが自分で考えて、自走した

AIが自走した

AIが自分でブレストを始めた。「採用案は3つ考えた。案Aは既存構造を踏襲してリスク最小。案Bは圧縮で軽量だが品質ゲートが崩れる。案Cは新規オーケストレータだが既存機能と二重化する。案Aで進めます」。理由付きで案を選んで、自分で決めて、設計書を書いて、実装計画を書いて、検証ロジックを組んで、実装した。

私が判断したのは「OK、進めて」と「修正点はない」だけ。タスク分解、テスト先行の検証、改ざん防止のハッシュ、ファイル名のミス対策まで——細かい品質の作り込みを、AIが自分で組み込んだ。設計書には「実装時に検証すべきポイント」まで書き込まれていた。後続作業を見越した先回りの設計だ。

なぜ動いたか——ゴールを共有すると最適化問題になる

ゴールを共有する

仮説は1つ。「ゴールを共有すれば、設計判断は最適化問題になる」。ゴールが「6/7にサーバーを公開して、自動化された記事生成パイプラインを稼働させる」と決まれば、設計判断の評価軸は明確になる。リスクは低く、既存資産は活かし、スコープは広げず、検証は固く。これらは、今回AIが自力で導いていた。私が判断する必要があるのは、「ゴール自体の妥当性」と「ゴールの優先順位」だけだ。技術的なトレードオフはAIの方がずっと詳しい。

これまで私が「指示を出さないと動かない」と思っていたのは、ゴールを共有していなかったからだ。ゴールを言語化せずに、断片的なタスクだけ投げていた。それでは「指示待ち」になる。だから運用で重要なのは、ゴールの言語化だ。「これを作って」ではない。「最終的にどういう状態を目指すのか」「何ができていれば成功か」「何をやらないか」「何を外さないか」。これを伝える。細部の設計判断はむしろ伝えないほうがいい。AIの最適化能力を活かす余地が残る。「ペルソナはこれを使って」と指定するとAIはその通りにするが、「流用が基本だが領域に合わなければ新規提案OK、漏洩リスク以外は積極的に試して」と伝えると、AIは自分で評価軸を立てて選んだように見えた。少なくとも後者の方が結果は良かった。

人間の役割は「ゴールを決める」に絞られる

人はゴールを決める

ゴールの粒度を変えた。これまでは「about.htmlの送信フォームを修正して、SNSリンクを追加して、ボタンを中央に揃えて」。今は「about.htmlの問い合わせセクションを正直な状態にする。ダミーフォームは公開恥ずかしい。SNS導線かメールか、何かを選んで実装して」。最初は「作業」を依頼している。後者は「目的」を依頼している。目的を依頼すると、AIは「ダミーフォーム削除」「SNS DMを主導線に」「メールはドメイン取得後に有効化できるようコメント埋め込み」「将来切り替え1手で済むよう設計」まで自走する。「作業」を依頼すると、依頼内容以上のことをやらない。AIに余白を残すと、私の依頼以上の成果が返ってきた。

AIエージェント運用で最初に詰まるのは「指示の粒度」だ。細かく指示しすぎると、AIは細かく動く。粒度を上げるのが怖い。「ちゃんと動くか分からない」と思うと詳細仕様を書いてしまう。でもそこを越えると、運用が大きく変わる。朝から夕方で、サイトの土台が2ブロック動いた。AIに頼んで、自走させて、検証して、次に進む。

技術的なトレードオフの判断は、少なくとも私のケースではAIの方が速くて的確だった。人間の役割は「ゴールを決める」と「最終承認」に絞られていく。「細かい指示を出す」こと自体は、もう人間がいちばん価値を出せる場所ではなくなってきた。AIに細かく指示してきた人ほど、「ゴールだけ伝える」への切り替えで違和感を持つ。コントロールが効かなくなる気がする。実際は逆で、コントロールの粒度が変わるだけ。少なくとも今回は、最終的なアウトプットの精度はむしろ上がった。私が今回学んだのは、それだ。AIに渡すべきは、指示書じゃなくて行き先だった。

← 実験ログ一覧へ