현장에서 Claude를 쓰는 팀을 보면 같은 장면이 반복된다. 처음에는 긴 프롬프트를 잘 만든 사람이 성과를 낸다. 몇 주 뒤에는 그 프롬프트가 Slack, Notion, 개인 메모장, CLAUDE.md에 흩어진다. 새로 합류한 사람은 같은 품질을 재현하지 못한다. 문제는 모델이 아니다. 행동 단위가 설계되지 않은 것이다.
Anthropic이 2025년 10월 공개한 Claude Skills는 이 지점을 정확히 겨냥한다. 공식 설명에서 Skill은 지시문, 스크립트, 리소스를 담은 폴더이며 Claude가 필요한 시점에 동적으로 불러오는 단위다. Claude Code 문서도 같은 방향을 말한다. 같은 플레이북, 체크리스트, 다단계 절차를 반복해서 붙여 넣고 있다면 Skill로 분리해야 한다.
Skill은 지식이 아니라 반복 행동이다
Skill을 “저장된 프롬프트”로 이해하면 실패한다. 프롬프트는 한 번의 대화에 붙는 말이다. Skill은 에이전트가 특정 업무를 만났을 때 어떤 순서로 판단하고, 어떤 파일을 읽고, 어떤 도구를 쓰고, 어떤 형식으로 끝낼지 정하는 실행 규약이다.
좋은 Skill은 모델에게 더 많은 말을 시키지 않는다. 같은 일을 매번 같은 품질로 끝내게 한다.
Claude Code 기준으로 Skill은 SKILL.md를 중심으로 구성된다. YAML frontmatter에는 name과 description이 들어가고, 본문에는 실행 지시가 들어간다. 필요하면 reference, examples, scripts를 같은 폴더에 둔다. 핵심은 progressive disclosure다. 메타데이터는 항상 보이지만, 본문과 보조 파일은 필요할 때만 들어온다. 긴 지침을 매번 컨텍스트에 밀어 넣는 방식과 다르다.
| 구분 | 잘못된 설계 | 좋은 Skill 설계 |
|---|---|---|
| 범위 | “보고서 잘 써줘” | “월간 운영 리뷰 초안 작성” |
| 발동 조건 | 사람이 매번 설명 | description에 사용 시점 명시 |
| 절차 | 장문의 당부 | 단계, 판단 기준, 예외 처리 |
| 산출물 | 매번 달라짐 | 템플릿과 검증 기준 고정 |
| 도구 | 모델이 즉흥 선택 | 필요한 스크립트와 파일을 명시 |
좁은 단위가 재사용된다
기업 업무용 Skill은 크게 만들수록 약해진다. “IR 자료 작성 Skill”보다 “실적 표를 CFO 리뷰용 문장으로 변환하는 Skill”이 강하다. “고객 대응 Skill”보다 “장애 공지 1차 초안 작성 Skill”이 운영에 붙는다.
우리가 설계할 때 보는 기준은 네 가지다.
- Trigger: 어떤 요청, 파일, 업무 상황에서 켜지는가.
- Procedure: 에이전트가 어떤 순서로 일하는가.
- Artifact: 최종 산출물이 어떤 구조를 가져야 하는가.
- Guardrail: 어디서 멈추고 사람에게 물어야 하는가.
이 네 가지가 없으면 Skill은 또 하나의 긴 프롬프트가 된다. 특히 description을 대충 쓰면 자동 호출이 흔들린다. “도움이 되는 분석을 수행” 같은 문장은 버려야 한다. “분기 실적 CSV를 읽고, 전년 대비 변동 요인을 CFO 보고 문장으로 요약할 때 사용”처럼 업무 조건을 박아야 한다.
복잡한 Skill은 본문을 길게 늘리지 않는다. Anthropic의 skill-creator 지침도 SKILL.md를 가볍게 유지하고, 큰 참조 자료는 별도 파일로 분리하라고 안내한다. 이는 문서 정리가 아니라 에이전트 하네스 설계다. 모델이 당장 필요한 지식만 가져오게 만들어야 런타임 품질이 안정된다.
실행 권한은 Skill 안에서 먼저 제한된다
Skill은 강력한 만큼 위험하다. Anthropic 공식 블로그는 Skills가 코드 실행 접근을 줄 수 있으므로 신뢰할 수 있는 출처를 사용하라고 경고한다. Claude Code의 2026년 4월 릴리스 노트에는 disableSkillShellExecution 설정처럼 Skill, slash command, plugin command의 inline shell 실행을 막는 옵션도 포함됐다.
따라서 업무용 Skill에는 보안 문장이 아니라 권한 구조가 들어가야 한다. 배포, 결재, 외부 발송, 데이터 삭제처럼 상태를 바꾸는 Skill은 자동 호출을 막는다. Claude Code 문서의 disable-model-invocation: true는 이런 상황에 맞다. 반대로 레거시 시스템 설명처럼 배경 지식만 주는 Skill은 사용자가 직접 실행할 명령이 아니다.
Skill 설계 리뷰에서는 다음 질문을 먼저 던진다.
- 이 Skill이 파일을 쓰거나 외부 시스템을 바꾸는가.
- 사람이 확인해야 할 중간 판단이 있는가.
- 실패했을 때 되돌릴 수 있는가.
- 로그와 산출물이 남는가.
이 질문에 답하지 못하면 아직 배포할 Skill이 아니다. PoC 데모에서는 돌아가도 운영에서는 막힌다.
참고와 다음 행동
Claude Skills의 본질은 재사용 가능한 에이전트 행동 단위다. 프롬프트를 잘 쓰는 개인의 기량을 조직의 실행 자산으로 바꾸려면 Skill을 좁게 나누고, 발동 조건을 정확히 쓰고, 산출물과 권한을 함께 설계해야 한다.
참고 자료:
- Anthropic, “Introducing Agent Skills”, 2025.10.16 — https://claude.com/blog/skills
- Claude Code Docs, “Agent Skills”, 2026년 현재 문서 — https://code.claude.com/docs/en/skills
- Claude API Docs, “Using Agent Skills with the API”, 2026년 현재 문서 — https://platform.claude.com/docs/en/build-with-claude/skills-guide
- Anthropic GitHub, “anthropics/skills”, 2026년 현재 저장소 — https://github.com/anthropics/skills
- Ling, Zhong, Huang, “Agent Skills: A Data-Driven Analysis of Claude Skills for Extending Large Language Model Functionality”, arXiv, 2026.02 — https://arxiv.org/abs/2602.08004
AX Ops에서는 Skill을 교육 자료가 아니라 운영 가능한 에이전트 행동 자산으로 설계한다. 반복 업무를 Skill 단위로 쪼개고 운영 권한까지 묶는 방식은 AX Ops 방법론 →에서 다룬다.
