블로그
AI 전환(AX), 에이전트 도입, AX Ops 방법론에 대한 현장 기록.
-

품질 게이트는 프롬프트가 아니라 hooks다
Claude Code 운영은 모델 성능보다 실행 직전 통제가 먼저다
코드 생성 품질은 모델이 아니라 게이트에서 갈린다. Claude Code hooks를 커밋 직전 품질 게이트로 설계하면, 팀은 리뷰어의 감각 대신 실행 가능한 규칙으로 품질을 고정할 수 있다.
읽기 → -

킥오프 첫 2주에 12문항을 고정하라
AI 프로젝트의 성패는 2주차 결정이 좌우한다
AI 프로젝트는 킥오프 2주에 무엇을 고정했는지로 결과가 갈린다. 비즈니스·데이터·기술·거버넌스 4축에서 12문항을 합의하고 문서화하라. 운영 KPI(uptime 99.9%, p95 800ms)와 RACI·의사소통·데이터 소유권·계약 조항까지 이때 잠그면 이후는 실행이다.
읽기 → -

AX 로드맵은 6개월마다 무너진다
기술 목록+날짜는 로드맵이 아니다
반기마다 슬라이드를 갈아끼우는데 성과는 고정된 채다. 이유는 5가지 구조적 결함 때문이다. 경영진 정렬, 데이터 기반, 비즈니스 전환 관점, 스폰서십 지속, 문제 우선 설계로 재구성해야 한다.
읽기 → -

RAG 평가는 색인·검색·생성 3단계가 답
단계별 지표와 CI 게이트로 품질 변동을 고정한다
RAG를 배포만 하고 평가를 빼면 품질이 어디로 움직이는지 모른다. 색인→검색→생성 각각에 표준 지표를 묶고 CI에 게이트를 건다. 이것이 2025년 현장 표준이다.
읽기 → -

AX 챔피언은 교육이 아니라 확산 엔진
사람·권한·루프·보상으로 사용률을 움직인다
챔피언을 ‘교육 담당자’에 가두면 현장은 변하지 않는다. 선발·권한·운영 루프·보상을 갖춘 ‘확산 엔진’으로 설계해야 실제 사용률과 워크플로 재설계가 움직인다. 필요한 구조와 데이터 포인트를 정리했다.
읽기 → -

LLM 에이전트 메모리는 컨텍스트로 끝나지 않는다
2-tier 메모리와 Context Engineering이 필수다
컨텍스트 윈도우는 200K, 10M+까지 커졌다. 그러나 지연과 잊힘은 남는다. 실전 에이전트는 core/archival 2-tier 메모리와 Context Engineering으로 설계해야 한다.
읽기 → -

MLOps의 한계, AgentOps로 넘어가라
모델 배포와 에이전트 배포는 완전히 다르다
모델은 입력에 답을 내지만, 에이전트는 목표에 도달하기 위해 실행 중 경로를 만든다. 이 차이는 운영을 갈아엎는다. Control Plane, Reasoning Observability, Permission Boundary 없이 프로덕션은 무너진다.
읽기 → -

AI 시대, 주니어를 얇은 시니어로 만들지 말자
멘토링·훈련·평가 체계를 즉시 재설계하라
AI는 주니어를 대체하지 않는다. 문제는 학습 회로가 줄어들며 ‘얇은 시니어’를 양산하는 것이다. 멘토링·훈련·온보딩·평가를 재설계해 설명 가능한 엔지니어로 성장시키자.
읽기 → -

HITL 에스컬레이션, 임계값은 부족하다
복합 신호와 리스크 차등이 트리거를 완성한다
“신뢰도 85% 미만이면 사람”으로는 운영이 무너진다. 과신 편향, 맥락 요인, 리스크 차등, 에스컬레이션 비율 제어를 묶은 복합 트리거가 필요하다. 목표는 10~15%만 사람 개입이다.
읽기 → -

MCP 표준이 바꾼 도구 통합의 경제학
N×M에서 N+M으로, 선택의 기본값이 바뀌었다
에이전트에 도구를 붙이는 방식은 2025년을 기점으로 재편됐다. MCP로 N×M 통합 비용이 구조적으로 줄었고, 커스텀 통합은 예외 처리로 남긴다. OpenAI의 공식 지원으로 표준 위에서 설계하는 편이 이득이다.
읽기 → -

AI ROI 계산의 함정, 단위로 본다
부서 예산이 아닌 단위 업무당 원가로 결정
부서 단위 ROI는 지표를 흐린다. 거래·문서·의사결정 같은 단위 업무로 내려가 원가 변화를 계산해야 재무 보드가 움직인다. 송장 1건당 40–65% 절감, 안정화 후 60–90일 내 ROI 전환 같은 수치가 운영 승인을 만든다. 데이터 준비가 전체 시간·비용의 60–80%를 차지한다는 사실도 TCO에 반영해야 한다.
읽기 → -

생성형 AI 거버넌스는 3층이다
정책·운영·배포를 리스크 단계로 묶어라
거버넌스를 법무 체크리스트로 몰아넣으면 현장이 멈춘다. 3층 구조(정책·운영·배포)에 리스크 단계별 차등 통제를 얹어야 속도와 안전을 동시에 확보한다. EU AI Act와 NIST 기준을 내부 규칙으로 번역하라.
읽기 → -

AI 파이프라인은 데이터 계약 없인 무너진다
스키마 드리프트를 원천에서 차단하라
PoC는 돌지만 6개월 뒤 모델이 흔들리는 이유는 대부분 상류 스키마다. 데이터 계약은 스키마·의미·SLA를 API처럼 고정하고, Shift Left로 배포 전에 위반을 막는다. 관건은 기술이 아니라 조직 채택이다.
읽기 → -

AX 교육, 툴 수업이면 실패한다
성인 학습 6원칙으로 업무를 다시 설계
대부분의 AX 교육이 정착되지 않는 이유는 간단하다. 성인은 도구가 아니라 자기 업무 성과를 배우기 때문이다. Andragogy 6원칙에 맞춘 사전→실습→후속 점검 구조로 워크숍을 재설계하라.
읽기 → -

88% 도입, 23% 스케일의 역설
대부분은 아직 가치 실현 전 단계다
해외 리포트는 ‘도입’이 보편화됐지만 ‘스케일’은 소수라고 못 박는다. 88% 도입, 23% 스케일의 간극은 PoC 습관과 운영 부재에서 생긴다. KPI 연결, MLOps, 70% 법칙, 데이터 품질이 돌파구다.
읽기 → -

정확도 대신 신뢰도를 평가하라
ARS·RGC·ACR·PAAS와 에스컬레이션을 기본값으로
오프라인 정확도 92%로는 배포 안전을 보장하지 못한다. 런타임 신뢰 지표(ARS/RGC/ACR/PAAS), 사전 hallucination 확률 예측, 명시적 에스컬레이션 정책을 함께 설계해야 운영에서 버틴다.
읽기 → -

정확도 집착은 AI 운영을 막는다
PoC 지표를 버리고 운영 지표로 재설계하라
정확도와 도입률은 PoC를 통과시키는 숫자일 뿐 운영을 움직이지 않는다. 선행지표와 비즈니스 KPI의 2축으로 재설계해야 파일럿 연옥을 벗어난다. 라이선스 수가 아니라 흐름·비용·리스크를 보라.
읽기 →