임원회의에서 에이전트 도입 과제가 열리면 후보가 끝없이 나온다. 고객 응대, 영업 제안, 구매 검토, 품질 분석, 회의록, 보고서, 개발 지원. 모두 그럴듯하다. 그래서 결론이 늦어진다. 문제는 아이디어 부족이 아니다. 자동화할 업무를 고르는 기준이 없다는 점이다.
효과가 큰 업무부터 시작하면 실패한다
에이전트는 챗봇이 아니다. 목표를 받고, 맥락을 읽고, 도구를 호출하고, 중간 결과를 남기며, 다음 행동을 정한다. OpenAI는 2026년 Agents SDK 업데이트에서 에이전트가 파일을 살피고, 명령을 실행하고, 긴 작업을 통제된 샌드박스에서 수행하도록 하는 harness를 강조했다. 핵심은 모델이 아니라 실행 환경이다. https://openai.com/index/the-next-evolution-of-the-agents-sdk/
Anthropic도 Claude Agent SDK 설명에서 파일 구조, 도구, MCP, context engineering을 에이전트 성능의 핵심으로 다룬다. 즉 “어떤 모델을 쓸 것인가”보다 “어떤 업무가 도구·데이터·검수 구조를 갖췄는가”가 먼저다. https://claude.com/blog/building-agents-with-the-claude-agent-sdk
그래서 첫 우선순위는 ROI 추정표 맨 위가 아니다. 운영 가능성이 높은 업무다.
에이전트 자동화의 첫 대상은 사람이 싫어하는 일이 아니라, 조직이 위임 경계를 명확히 그을 수 있는 일이다.
첫 후보는 네 조건을 통과해야 한다.
- 시작 조건이 명확하다.
- 필요한 데이터와 도구 접근이 가능하다.
- 결과가 되돌릴 수 있거나 검수 후 실행된다.
- 실패 로그를 읽고 고칠 업무 책임자가 있다.
이 네 가지가 없으면 PoC는 된다. 운영은 안 된다.
먼저 자동화할 일은 닫힌 루프다
닫힌 루프 업무는 시작, 입력, 판단, 출력, 예외, 검수가 한 장에 그려지는 업무다. 이런 업무는 agent harness engineering에 적합하다. context engineering, memory 전략, tool orchestration, AgentOps, 평가 세트를 붙일 수 있기 때문이다.
| 업무 유형 | 우선순위 | 이유 |
|---|---|---|
| 문서·메일·티켓 분류 | 높음 | 반복 규칙이 있고, 오분류를 사람이 고칠 수 있다 |
| 자료 수집 후 초안 작성 | 높음 | 결과물이 실행이 아니라 검토 대상이다 |
| 내부 지식 검색과 근거 정리 | 높음 | 출처·검색 로그를 남기기 쉽다 |
| 고객 약속, 가격 변경, 계약 확정 | 낮음 | 외부 영향이 크고 권한 경계가 복잡하다 |
| 승인, 지급, 인사 평가 | 낮음 | 설명 책임과 감사 추적이 먼저 설계돼야 한다 |
많은 조직이 반대로 간다. 눈에 잘 보이는 대형 업무부터 잡는다. 그러면 부서 간 권한, 보안 예외, 데이터 품질, 승인 라인 논쟁이 한꺼번에 터진다. 에이전트 문제가 아니라 운영 설계 문제다.
ROI보다 권한 지도가 먼저다
우선순위 회의에서 “얼마나 줄일 수 있나”만 묻는 순간 판단이 흐려진다. 초기에는 정밀한 ROI보다 권한 지도가 중요하다. 에이전트가 어디까지 읽고, 어디까지 쓰고, 어디서 멈추며, 누가 재개시키는지 정해야 한다.
다음 다섯 질문으로 후보를 자른다.
| 판단 질문 | 먼저 할 업무의 답 |
|---|---|
| 반복 빈도는 높은가 | 높다 |
| 실패 시 복구 가능한가 | 가능하다 |
| 데이터 접근권이 열려 있는가 | 열 수 있다 |
| 판단 기준이 문서화돼 있는가 | 최소한 있다 |
| 검수자가 로그를 볼 시간이 있는가 | 있다 |
Deloitte는 2026 State of AI in the Enterprise 관련 글에서 agentic AI governance가 성숙했다고 답한 조직이 일부에 그친다고 밝혔다. 동시에 에이전트 사용은 빠르게 늘고 있다고 설명한다. 이 간극이 현장의 병목이다. 자동화 후보를 고르는 일은 기술 로드맵이 아니라 거버넌스 설계다. https://www.deloitte.com/us/en/insights/topics/emerging-technologies/ai-agents-scaling-faster.html
BCG도 2025년 agentic AI 글에서 시스템 상호운용성, 고품질 데이터, 적절한 자율성·제약·목표 설계를 구현 난제로 짚었다. 대형 과제를 먼저 잡으면 이 난제가 한꺼번에 온다. 작은 닫힌 루프를 먼저 잡으면 하나씩 고친다. https://www.bcg.com/publications/2025/how-agentic-ai-is-transforming-enterprise-platforms
참고와 다음 행동은 한 장으로 끝낸다
참고한 최근 자료는 아래 네 가지다.
- OpenAI, The next evolution of the Agents SDK, 2026: https://openai.com/index/the-next-evolution-of-the-agents-sdk/
- OpenAI, From model to agent: Equipping the Responses API with a computer environment, 2026: https://openai.com/index/equip-responses-api-computer-environment
- Anthropic, Building agents with the Claude Agent SDK, 2025: https://claude.com/blog/building-agents-with-the-claude-agent-sdk
- Deloitte Insights, Agentic AI is scaling faster than guardrails, 2026: https://www.deloitte.com/us/en/insights/topics/emerging-technologies/ai-agents-scaling-faster.html
- BCG, How Agentic AI Is Transforming Enterprise Platforms, 2025: https://www.bcg.com/publications/2025/how-agentic-ai-is-transforming-enterprise-platforms
다음 회의에서는 자동화 후보를 더 모으지 말아야 한다. 후보를 줄여야 한다. 각 후보마다 시작 조건, 도구 접근, 복구 가능성, 검수 책임자, 로그 설계를 적어야 한다. 이 표를 통과한 업무가 첫 에이전트가 된다.
AX LABS는 이 우선순위 결정을 전략 문서에서 끝내지 않는다. 도입 이후 운영 로그, 평가, 권한 재설계까지 한 사이클로 묶어 AX Ops로 정착시킨다. 에이전트 자동화의 첫 업무를 고르는 기준부터 정리하려면 AX Ops 방법론 →
