블로그
AI 전환(AX), 에이전트 도입, AX Ops 방법론에 대한 현장 기록.
-

에이전트는 네 지표로 산다
trace보다 운영 지표가 먼저다
프로덕션 에이전트 observability는 로그 수집이 아니다. 업무 완료, 도구 실행, 컨텍스트 품질, 실행 예산을 한 흐름으로 잡아야 운영 판단이 선다.
읽기 → -

AgentOps는 MLOps 이후다
모델 관리에서 행동 관리로 전환한다
AgentOps는 MLOps 도구를 하나 더 붙이는 일이 아니다. 모델 산출물 관리에서 에이전트 행동, 도구 호출, 사람 개입, 실패 복구를 운영하는 체계로 넘어가는 일이다.
읽기 → -

팀 설정이 에이전트를 지킨다
settings.json은 개인 취향 파일이 아니라 운영 규약이다
Claude Code를 팀에 풀면 성과보다 먼저 설정 편차가 드러난다. settings.json은 권한, hook, plugin, sandbox를 팀 운영 단위로 고정하는 에이전트 통제면이다.
읽기 → -

권한 없는 에이전트는 사고다
도구·데이터·예산은 실행 전에 잘라야 한다
에이전트 실패는 답변 품질 문제가 아니라 권한 경계 문제로 터진다. 운영 에이전트는 도구, 데이터, 예산을 같은 통제면에서 설계해야 한다.
읽기 → -

멀티 에이전트는 연결에서 무너진다
역할보다 계약, 검증, 운영 경계가 먼저다
멀티 에이전트 실패는 모델 성능 부족보다 설계 실패에서 시작된다. 병렬화 착각, 느슨한 핸드오프, 검증 없는 종료가 운영을 무너뜨린다.
읽기 → -

툴 조율이 에이전트 품질이다
순서보다 실패 경로를 먼저 설계한다
에이전트의 품질은 모델 성능보다 tool orchestration에서 갈린다. 순차·병렬·재시도·파이프라인은 기술 패턴이 아니라 업무 책임을 배치하는 방식이다.
읽기 → -

세 SDK는 같은 물건이 아니다
2026년 선택 기준은 모델이 아니라 운영 하네스다
Claude Agent SDK, OpenAI Agents SDK, Google ADK는 모두 에이전트를 만든다. 그러나 실제 선택 기준은 모델 성능이 아니라 컨텍스트, 도구, 권한, 배포를 누가 책임지느냐다.
읽기 → -

프레임워크보다 하네스가 먼저다
에이전트 성패는 루프 바깥에서 갈린다
Agent framework를 고르기 전에 먼저 정해야 할 것은 harness다. context, tool, memory, 권한, 평가의 운영 원칙이 없으면 어떤 프레임워크도 PoC 밖으로 나가지 못한다.
읽기 → -

프롬프트는 설계가 아니다
context는 실행 구조로 다뤄야 한다
프롬프트 개선은 데모를 통과시킨다. 운영 에이전트는 context의 수집, 압축, 격리, 검증 구조가 있어야 버틴다.
읽기 → -

MCP 서버는 API 포장이 아니다
에이전트 권한 경계부터 다시 설계해야 한다
MCP 서버를 사내 API 어댑터로만 만들면 곧바로 위험해진다. 도구 정의, 권한, 감사, 실패 처리까지 포함한 에이전트용 운영 경계로 설계해야 한다.
읽기 → -

Subagent는 context 방화벽이다
장기 작업은 기억을 나누지 않으면 무너진다
Claude Subagents의 핵심은 병렬 처리보다 context 분리다. 장기 작업에서 탐색, 검토, 실행의 기억을 섞는 순간 에이전트 품질은 흔들린다.
읽기 → -

Skill은 프롬프트가 아니다
재사용되는 에이전트 행동은 파일로 설계된다
Claude Skills는 긴 프롬프트를 저장하는 기능이 아니다. 반복 업무의 발동 조건, 절차, 산출물, 도구 사용을 묶어 에이전트가 같은 방식으로 실행하게 만드는 행동 단위다.
읽기 →