AI 예산 회의에서 같은 장면이 반복된다. 현업은 “빨리 써야 한다”고 말하고, IT는 “내부 구축이 안전하다”고 말한다. 구매 부서는 벤더 제안서를 비교하고, 보안 조직은 데이터 반출을 묻는다. 그런데 정작 빠지는 질문이 있다. 이 AI 스택을 누가 매일 운영할 것인가.
2026년의 딜레마는 내부 구축 vs 외부 벤더가 아니다. 벤더가 제공하는 기능은 빠르게 넓어졌다. OpenAI는 AgentKit과 Responses API를 통해 에이전트 설계, 도구 호출, 평가, UI 구성까지 한 플랫폼으로 묶고 있다. Microsoft는 Agent 365와 Foundry 쪽에서 에이전트 거버넌스와 운영 관찰성을 전면에 내세운다. Google Cloud는 Gemini Enterprise를 조직의 AI 진입점으로 포지셔닝한다. Anthropic은 MCP, Files API, code execution, Agent SDK 계열을 통해 도구 연결과 에이전트 실행 환경을 넓혔다.
문제는 기능 부족이 아니다. 기능이 너무 빨리 바뀌기 때문에, 전부 내부에서 만들겠다는 결정도 위험하고 전부 벤더에 맡기겠다는 결정도 위험하다.
외부 벤더는 실행 속도를 산다
외부 벤더를 쓰는 이유는 명확하다. 모델 업데이트, 보안 패치, 도구 연결, 평가 기능, 사용량 관리, 관리자 콘솔을 기업 내부 팀이 매번 따라잡지 않아도 된다. 특히 범용 업무, 문서 검색, 회의 요약, 코드 보조, 고객 응대 초안처럼 차별화보다 확산 속도가 중요한 영역에서는 벤더 플랫폼이 맞다.
하지만 외부 벤더는 기업의 업무 책임까지 대신 지지 않는다. 벤더는 API와 콘솔을 제공한다. 결재선, 예외 처리, 금지 데이터, 현장별 용어, 감사 로그 해석, 실패 시 복구 절차는 고객 조직 안에 남는다.
AI 스택의 핵심 자산은 모델이 아니라, 모델이 움직이는 업무 운영권이다.
그래서 외부 벤더 도입의 첫 질문은 “어느 모델이 더 좋은가”가 아니다. “이 플랫폼이 우리 권한 체계, 데이터 경계, 평가 루프, 장애 대응에 들어올 수 있는가”다.
내부 구축은 차별화 영역에만 남긴다
내부 구축은 여전히 필요하다. 다만 범위를 좁혀야 한다. 모델을 직접 만들겠다는 뜻이 아니다. 기업 고유의 업무 맥락, 판단 기준, 권한 체계, 시스템 연결부, 평가 데이터를 내부 자산으로 만든다는 뜻이다.
구분은 단순하다.
| 영역 | 외부 벤더 우선 | 내부 구축 우선 |
|---|---|---|
| 모델·기본 추론 | 빠른 업데이트가 중요 | 자체 모델 필요성이 명확할 때만 |
| 범용 생산성 | 표준 기능 활용 | 별도 구축 금지에 가깝다 |
| 핵심 업무 판단 | 벤더 단독 불가 | 룰·데이터·평가 기준 내재화 |
| 시스템 연결 | 표준 커넥터 활용 | 권한·감사·예외 로직은 내부 통제 |
| 운영 지표 | 플랫폼 지표 참고 | 업무 KPI와 실패 비용으로 재정의 |
내부 구축의 대상은 ‘AI 전체’가 아니라 ‘우리 회사에서 틀리면 안 되는 부분’이다. 가격 추천, 생산 계획 변경, 고객 보상 판단, 계약 리스크 검토처럼 실패 비용이 큰 업무는 내부 운영 설계가 필요하다. 반대로 사내 공지 초안이나 일반 문서 요약을 내부 플랫폼으로 처음부터 다시 만드는 것은 자원 낭비다.
2026년 선택지는 하이브리드 통제 모델이다
2026년 AI 스택은 한 벤더로 닫히지 않는다. MCP와 A2A 같은 연결 표준 논의가 커진 이유도 같다. 에이전트는 단일 화면 안에서 끝나지 않는다. 문서 저장소, ERP, CRM, 데이터 웨어하우스, 티켓 시스템, 협업 도구를 오간다.
따라서 기업은 ‘벤더 포트폴리오’를 사는 동시에 ‘내부 control plane’을 가져야 한다. 여기서 control plane은 거창한 플랫폼명이 아니다. 네 가지 운영 장치다.
- 어떤 업무에 어떤 모델과 도구를 허용하는가
- 어떤 데이터는 검색·학습·전송에서 제외하는가
- 에이전트 실패를 어떻게 탐지하고 사람에게 넘기는가
- 성능을 벤치마크가 아니라 실제 업무 결과로 어떻게 평가하는가
이 네 가지가 없으면 내부 구축도 그림자 IT가 되고, 외부 벤더 도입도 파일럿 전시물이 된다. 반대로 이 네 가지가 있으면 벤더는 교체 가능해지고, 내부 자산은 누적된다.
경영진의 질문은 구매가 아니라 운영이다
이사회나 투자심의에서 물어야 할 질문도 바뀌어야 한다. “만들 것인가, 살 것인가”는 늦은 질문이다. 먼저 “무엇을 통제할 것인가”를 정해야 한다.
AX LABS가 보는 의사결정 순서는 이렇다. 첫째, 업무를 범용 생산성·운영 보조·핵심 판단으로 나눈다. 둘째, 각 업무의 실패 비용과 데이터 민감도를 정한다. 셋째, 외부 벤더가 맡을 계층과 내부에 남길 계층을 분리한다. 넷째, 도입 후 운영 지표와 책임자를 먼저 세운다.
AI 스택 전략은 기술 구매 전략이 아니다. 운영권 배분 전략이다. 2026년에는 더 그렇다. 벤더 기능은 계속 바뀐다. 내부 조직의 판단 기준과 책임 구조는 대신 만들어지지 않는다. AX Ops는 이 경계를 먼저 긋고, 도입 이후 운영까지 같은 사이클로 설계한다. 더 구체적인 설계 방식은 AX Ops 방법론 →
참고
- OpenAI, “Introducing AgentKit,” 2025: https://openai.com/index/introducing-agentkit/
- OpenAI, “From model to agent: equipping the Responses API with a computer environment,” 2026: https://openai.com/index/equip-responses-api-computer-environment/
- Microsoft, “Introducing the First Frontier Suite built on Intelligence + Trust,” 2026: https://blogs.microsoft.com/blog/2026/03/09/introducing-the-first-frontier-suite-built-on-intelligence-trust/
- Microsoft, “New solutions for Microsoft Foundry, Azure AI infrastructure and Physical AI,” 2026: https://blogs.microsoft.com/blog/2026/03/16/microsoft-at-nvidia-gtc-new-solutions-for-microsoft-foundry-azure-ai-infrastructure-and-physical-ai/
- Google Cloud, “Introducing Gemini Enterprise,” 2025: https://cloud.google.com/blog/products/ai-machine-learning/introducing-gemini-enterprise
- Anthropic, “New capabilities for building agents on the Anthropic API,” 2025: https://www.anthropic.com/news/agent-capabilities-api
