임원 회의에서 에이전트 과제는 빠르게 승인된다. 데모는 그럴듯하고, 외부 팀은 빠르게 만든다. 문제는 그다음이다. 현업 정책이 바뀌고, 모델이 바뀌고, 연결된 시스템 권한이 바뀌는 순간 내부 팀은 다시 외주사를 부른다. 이 상태는 도입이 아니라 임대다.
에이전트의 본체는 코드가 아니라 운영 반복문이다
에이전트는 화면 하나나 프롬프트 묶음이 아니다. 컨텍스트를 어떻게 넣고, 어떤 도구를 어떤 순서로 호출하며, 실패했을 때 어디까지 되돌리고, 사람에게 언제 넘길지 정한 운영 체계다.
최근 플랫폼 흐름도 같은 방향이다. OpenAI는 2026년 4월 Agents SDK에 파일·도구·컴퓨터 작업을 다루는 model-native harness와 sandbox 실행을 추가했다고 발표했다. Anthropic도 Claude Agent SDK를 Claude Code의 기반 harness로 설명하며 subagents, background tasks, plugins를 강조했다. 에이전트 경쟁의 초점이 모델 호출에서 harness, tool, sandbox, eval로 이동했다는 뜻이다. (openai.com)
내재화의 대상은 소스코드가 아니라 판단·검증·복구·배포의 반복문이다.
그래서 외주 계약의 산출물을 코드 저장소로만 정의하면 실패한다. AX 관점의 산출물은 task trace, tool schema, eval set, 권한 정책, 운영 로그, 장애 복구 기준까지 포함한다.
외주는 출발점이고, 자립은 설계해야 한다
외주 개발 자체가 문제는 아니다. 초기 속도, 아키텍처 선택, 위험 검토에는 외부 전문성이 필요하다. 문제는 외주사가 계속 뇌와 손을 모두 쥐는 구조다.
| 구간 | 외주 중심 접근 | 자립형 AX 접근 |
|---|---|---|
| 기획 | 요구사항 전달 | 업무 판단 기준 공동 작성 |
| 개발 | 기능 구현 | 내부 담당자와 co-build |
| 검증 | 납품 테스트 | eval suite와 trace 리뷰 |
| 운영 | 장애 시 호출 | 내부 AgentOps로 수정·배포 |
Anthropic은 장시간 에이전트 작업에서 context window를 넘나드는 문제가 핵심이며, initializer agent와 coding agent가 다음 세션을 위한 구조화 산출물을 남기는 방식을 설명했다. 이 관찰은 기업 내재화에도 그대로 적용된다. 교대 근무자가 인수인계 없이 출근하면 공장이 멈추듯, 에이전트도 메모리와 작업 산출물 없이 운영되지 않는다. (anthropic.com)
로드맵은 네 구간으로 끊어야 한다
첫째, 외주 산출물을 해체한다. 프롬프트, 도구, 데이터, 권한, 로그, 실패 케이스를 분리해 내부 언어로 다시 쓴다.
둘째, co-build로 전환한다. 외부 팀은 만드는 사람이 아니라 만드는 방식을 옮기는 사람이어야 한다. 내부 PO, 보안, 데이터, 현업 SME가 같은 backlog를 본다.
셋째, 공통 harness를 만든다. MCP는 2025년 12월 Linux Foundation 산하 Agentic AI Foundation으로 기부되며 벤더 중립 표준으로 확장됐다. A2A 역시 2025년 6월 Linux Foundation 프로젝트로 출범해 agent-to-agent 통신과 협업을 다룬다. 표준을 쓰는 이유는 유행을 따르기 위해서가 아니다. 내부 팀이 특정 벤더 구현에 갇히지 않고 tool orchestration을 통제하기 위해서다. (anthropic.com)
넷째, eval과 AgentOps를 운영 KPI에 붙인다. Anthropic은 에이전트 평가에서 task, trial, grader, transcript를 구분하고, 초기에는 성공 기준을 명시하며 이후에는 regression을 잡는 방식의 eval을 설명했다. 기업 내부 팀도 같은 구조를 가져야 모델 교체와 업무 변경을 두려워하지 않는다. (anthropic.com)
경영진은 납품보다 운영권을 사야 한다
Gartner는 2025년 8월 발표에서 2026년 말까지 enterprise application의 40%가 task-specific AI agents를 포함할 것으로 전망했다. IBM은 2026년 6월 조사에서 AI agent 배포 규모에 완전히 준비됐다고 답한 응답자가 11%라고 밝혔다. 숫자의 메시지는 단순하다. 에이전트는 늘어나고, 통제 역량은 부족하다. (gartner.com)
따라서 AX 컨설팅의 목표는 멋진 첫 에이전트를 납품하는 데 있지 않다. 외주로 속도를 얻고, co-build로 지식을 옮기고, AX Ops로 운영권을 회수하는 데 있다.
참고
- OpenAI, The next evolution of the Agents SDK, 2026: https://openai.com/index/the-next-evolution-of-the-agents-sdk/
- OpenAI, Equipping the Responses API with a computer environment, 2026: https://openai.com/index/equip-responses-api-computer-environment/
- Anthropic, Apple’s Xcode now supports the Claude Agent SDK, 2026: https://www.anthropic.com/news/apple-xcode-claude-agent-sdk
- Anthropic, Effective harnesses for long-running agents, 2025: https://www.anthropic.com/engineering/effective-harnesses-for-long-running-agents
- Anthropic, Demystifying evals for AI agents, 2026: https://www.anthropic.com/engineering/demystifying-evals-for-ai-agents
- Anthropic, Donating MCP and establishing AAIF, 2025: https://www.anthropic.com/news/donating-the-model-context-protocol-and-establishing-of-the-agentic-ai-foundation
- Linux Foundation, Agent2Agent Protocol Project announcement, 2025: https://www.prnewswire.com/news-releases/linux-foundation-launches-the-agent2agent-protocol-project-to-enable-secure-intelligent-communication-between-ai-agents-302488265.html
외주에서 자립으로 넘어가는 설계가 필요하다면 AX Ops 방법론 →
