AX Labs · Insights
에이전트 제품 설계
에이전트 제품 설계 카테고리의 글 모음.
-

품질 게이트는 프롬프트가 아니라 hooks다
Claude Code 운영은 모델 성능보다 실행 직전 통제가 먼저다
코드 생성 품질은 모델이 아니라 게이트에서 갈린다. Claude Code hooks를 커밋 직전 품질 게이트로 설계하면, 팀은 리뷰어의 감각 대신 실행 가능한 규칙으로 품질을 고정할 수 있다.
읽기 → -

LLM 에이전트 메모리는 컨텍스트로 끝나지 않는다
2-tier 메모리와 Context Engineering이 필수다
컨텍스트 윈도우는 200K, 10M+까지 커졌다. 그러나 지연과 잊힘은 남는다. 실전 에이전트는 core/archival 2-tier 메모리와 Context Engineering으로 설계해야 한다.
읽기 → -

HITL 에스컬레이션, 임계값은 부족하다
복합 신호와 리스크 차등이 트리거를 완성한다
“신뢰도 85% 미만이면 사람”으로는 운영이 무너진다. 과신 편향, 맥락 요인, 리스크 차등, 에스컬레이션 비율 제어를 묶은 복합 트리거가 필요하다. 목표는 10~15%만 사람 개입이다.
읽기 → -

MCP 표준이 바꾼 도구 통합의 경제학
N×M에서 N+M으로, 선택의 기본값이 바뀌었다
에이전트에 도구를 붙이는 방식은 2025년을 기점으로 재편됐다. MCP로 N×M 통합 비용이 구조적으로 줄었고, 커스텀 통합은 예외 처리로 남긴다. OpenAI의 공식 지원으로 표준 위에서 설계하는 편이 이득이다.
읽기 → -

정확도 대신 신뢰도를 평가하라
ARS·RGC·ACR·PAAS와 에스컬레이션을 기본값으로
오프라인 정확도 92%로는 배포 안전을 보장하지 못한다. 런타임 신뢰 지표(ARS/RGC/ACR/PAAS), 사전 hallucination 확률 예측, 명시적 에스컬레이션 정책을 함께 설계해야 운영에서 버틴다.
읽기 →