Anthropic과 OpenAI는 PMF를 찾았다: 구독이 아니라 '에이전트 토큰'에서 (Simon Willison)
원문 정보
- 제목: I think Anthropic and OpenAI have found product-market fit
- 출처: Simon Willison (simonwillison.net)
- 발행: 2026-05-27 · 약 6분 분량
- 원문 링크: https://simonwillison.net/2026/May/27/product-market-fit/
AI 랩의 “수익화는 실패했다”는 서사가 끊이지 않는다. 이 글은 그 서사를 정면으로 반박하며, 진짜 제품-시장 적합성(PMF)이 어디서 나타났는지를 본인의 청구서와 공개 신호로 짚는다. AI가 산업·비즈니스를 바꾸는 방식을 다루므로 Articles의 AI-Industry에 담는다.
한 줄 요약 (TL;DR)
Anthropic과 OpenAI의 PMF는 9억 주간 활성 사용자의 소비자 구독이 아니라, 코딩 에이전트가 막대한 토큰을 태우고 그 비용을 엔터프라이즈가 풀 API 가격으로 지불하기 시작한 지점에서 나타났다. 2025년 11월~2026년 4월의 가격제 전환(좌석 정액제 → 사용량 기반)이 그 변곡점이며, 기업들의 “AI 예산 초과” 비명과 엔터프라이즈 영업 채용 폭증이 그 증거다.
한눈에 보기
flowchart TB
A["2025.11<br/>Anthropic 가격제 전환<br/>(좌석 정액제 → 사용량 기반)"] --> B["모델이 에이전트를<br/>'진짜 쓸모 있게' 만듦"]
B --> C["에이전트가 토큰 폭증<br/>(긴 루프·도구 호출·재시도)"]
C --> D["2026.4<br/>OpenAI Codex<br/>사용량 기반 전환"]
D --> E["엔터프라이즈가<br/>풀 API 가격 지불"]
E --> F["예산 초과 '비명'<br/>+ 엔터프라이즈 영업 채용 폭증"]
F --> G["실질 매출 = PMF"]
A -. "옆가지: 매출 안 남" .-> X["소비자 구독<br/>(900M 주간 활성 중<br/>유료 50M = 5.6%)"]
X --> Y["월 $10~20 단가로는<br/>1조 달러 인프라 비용<br/>못 댐"]
왜 이 글을 골랐나
이 위키의 Articles에는 “AI가 정말 가치를 만드는가, 그 가치는 어디에 귀속되는가”를 다투는 글이 여럿 있다. 소프트웨어 종말론을 해부한 글은 해자(moat)가 어디로 이동하는지를, 죽은 경제 이론은 AI가 만든 부가 어디로 집중되는지를 묻는다. Willison의 이 글은 그 한 단계 앞, “랩들이 실제로 돈을 버는가, 번다면 어느 고객·어느 제품에서 버는가”라는 가장 기초적인 질문에 본인의 청구서로 답한다.
특히 개발자에게 와닿는 이유는, 이 변곡점의 주인공이 추상적인 ‘AI’가 아니라 우리가 매일 쓰는 코딩 에이전트(Claude Code, Codex)라는 점이다. 우리의 ccusage 숫자가 곧 랩의 손익계산서다.
핵심 내용
1. 출발점: “수익화 실패”가 아니라 “첫 흑자 분기”
글은 두 가지 시중의 이야기에서 출발한다. 하나는 Anthropic이 첫 흑자 분기를 앞두고 있다는 소문(TechCrunch), 다른 하나는 여러 기업이 직원들의 LLM 사용으로 청구서가 예상보다 비싸졌다며 놀라고 있다는 이야기다. Willison은 이 두 신호를 하나로 묶는다 — OpenAI와 Anthropic이 PMF를 찾았기 때문이라고.
2. 본인 청구서: $200로 $2,180어치 토큰을 쓰고 있다
논증의 핵심 증거는 저자 자신의 사용량이다. 그는 Anthropic Max($100/월)와 OpenAI Pro($100/월), 합쳐 월 $200를 구독한다. 그런데 ccusage 도구로 지난 30일을 API 토큰 가격으로 환산해보니,
- Claude Code: $1,199.79
- OpenAI Codex: $980.37
- 합계: $2,180.16어치 토큰을 $200에 쓰고 있었다.
핵심은 “구독이 싸서 좋다”가 아니다. 엔터프라이즈가 이 토큰을 풀 API 가격으로 지불하기 시작하면 랩이 포착하는 가치(value capture)가 10배 단위로 커진다는 것이다. 파워 유저는 이미 벤더당 월 $1,000에 근접한다.
3. 변곡점: 좌석 정액제 → 사용량 기반 가격제
그 가치 포착을 현실로 만든 것이 가격제 전환이다.
- Anthropic: 2025년 11월부터 엔터프라이즈 플랜을 좌석 정액제에서 API 사용량 기반으로 전환(The Information).
- OpenAI: 2026년 4월 2일부터 Codex 가격을 메시지당 과금에서 API 토큰 사용량 기반으로 정렬(Codex rate card).
이전까지 엔터프라이즈는 좌석당 정액으로 토큰을 사실상 할인받아 썼다. 전환 이후엔 쓰는 만큼 낸다. 이것이 기업들의 “예산 초과” 비명의 직접 원인이자, 랩 매출의 변곡점이다.
4. 왜 지금인가: 에이전트가 “진짜 쓸모 있게” 됐기 때문
가격제만으로는 부족하다. 쓸 이유가 있어야 한다. 글은 2025년 11월 즈음의 모델들이 에이전트를 비로소 진짜 쓸모 있게 만들었다고 본다. 에이전트는
- 훨씬 더 많은 토큰을 태우고(긴 루프, 도구 호출, 재시도),
- 고연봉 전문직의 업무를 자동화하며,
- 그 적용 범위가 소프트웨어 엔지니어를 넘어 훨씬 더 넓은 숙련 지식 노동자로 확장된다.
토큰을 많이 태우는 것이 비용이 아니라 매출인 모델 — 이것이 소비자 챗봇과 결정적으로 다른 점이다.
5. 소비자 구독으로는 인프라 비용을 못 댄다
글은 “실패 서사”의 근거였던 소비자 숫자를 뒤집어 읽는다. OpenAI는 ChatGPT 주간 활성 사용자 9억 명 이상을 자랑하지만, 유료 소비자 구독자는 5,000만 명, 즉 5.6%뿐이다(Yahoo Finance). 월 $10~20짜리 구독 5,000만으로는 거론되는 1조 달러 규모 인프라 투자를 정당화할 수 없다.
하지만 사용자당 월 $200+를 쓰는 회사들은 그 지점에 훨씬 빨리 데려다준다.
즉 같은 사용자 수라도 누가 어떤 단가로 쓰는가가 손익을 가른다. ChatGPT가 “역사상 가장 빠르게 성장한 소비자 앱”(Reuters)이라는 사실은 PMF의 증거가 아니라, 매출이 나는 곳은 다른 데라는 사실을 가린 착시였다는 것이다.
6. 채용이라는 누설 신호
마지막 증거는 채용 공고다. 진심으로 엔터프라이즈에 베팅하는 회사는 사람을 그쪽으로 뽑는다.
- OpenAI: 공개 채용 703건 중 229건(32.6%)이 엔터프라이즈 영업·지원.
- Anthropic: 390건 중 105건(26.9%)이 엔터프라이즈 중심.
이 “인간 노동에 대한 무거운 수요”가 엔터프라이즈 매출에 대한 진지한 커밋먼트를 드러낸다는 것이다.
7. 좋은 가격의 규칙: “이를 악물고, 그래도 예스”
글이 인용하는 가격 결정의 격언 하나.
내가 들은 최고의 가격 조언은, 고객이 (가격을 보고) 이를 악물며 숨을 들이켰다가, 그래도 ‘예스’라고 말하게 하라는 것이었다.
엔터프라이즈가 Claude Code 청구서를 보고 비명을 지르면서도 계속 결제한다는 사실 — 그것이 바로 좋은 가격이자 PMF의 정의에 부합한다.
분석과 인사이트
여기서부터는 원문 요약이 아니라 내 관점이다.
“PMF를 찾았다”의 진짜 의미는 ‘비용이 곧 매출인 제품’을 찾았다는 것이다. 소비자 챗봇은 토큰을 많이 쓸수록 적자가 깊어지는 구조였다(정액 구독 + 추론 비용). 에이전트는 정반대다. 사용량 기반 과금에서는 토큰을 많이 태우는 워크로드가 곧 고마진 매출이 된다. Willison이 짚은 변곡점은 “모델이 좋아진 시점”이라기보다, 랩이 비용 센터를 매출 센터로 뒤집는 가격 구조를 장착한 시점이라고 읽는 게 더 정확하다.
그러나 “비명을 지르며 결제한다”가 영원히 지속될지는 이 글의 범위 밖이다. 가격이 좋다는 것과 ROI가 증명됐다는 것은 다르다. Willison 본인도 인용하는 Uber 사례 — “지난 분기 코드 커밋의 25%가 Claude Code를 통했다”면서도 COO가 “실제로 출시한 유용한 기능과 직접 선을 긋지 못하면 그 거래는 정당화하기 어려워진다”고 인정한 대목 — 이 핵심이다. 이를 악물고 예스를 한 고객이, 다음 분기에 ROI를 못 찾으면 노(No)로 돌아설 수 있다. PMF의 증거(지금 결제한다)와 지속가능성의 증거(가치를 회수한다)는 분리해서 봐야 한다. 이 글은 전자를 설득력 있게 보였지만, 후자는 미해결로 남긴다.
개발자에게 주는 함의는 두 가지다. 첫째, 에이전트는 이제 명백한 비용 항목이다. 내 ccusage가 회사 손익에 직접 잡히는 시대다. “토큰을 태운 만큼 가치를 돌려준다”를 증명하지 못하는 사용은 다음 예산 협상에서 잘린다 — 이는 의도 부채(Intent Debt)나 agentic 분석의 검증 계층 같은 “결과 품질” 논의와 곧장 이어진다. 둘째, 랩의 인센티브가 어디 있는지 보인다. 매출은 엔터프라이즈 에이전트 토큰에서 난다. 따라서 모델·도구·가격은 점점 더 “토큰을 많이, 그러나 정당화 가능하게 태우는 엔터프라이즈 워크로드”를 향해 최적화될 것이다.
한계도 분명히 해두자. 이 글은 본인 청구서 + 공개 보도 + 채용 통계에 기반한 추론(thesis)이지, 랩의 감사받은 재무제표가 아니다. “첫 흑자 분기”는 소문이고, 인프라 1조 달러도 거론되는 수치다. Willison 자신이 제목에 “I think”를 붙였다. 강한 정황이되 확정은 아니라는 톤을 유지해 읽는 게 맞다.
적용 포인트
ccusage(또는 동등 도구)로 본인 토큰 사용량을 API 가격으로 환산해보라. 구독으로 가려진 진짜 단가를 알아야 회사 차원의 비용 대화가 가능하다.- 에이전트 사용을 “출시한 가치”와 연결하는 지표를 만들어라. “커밋의 N%가 에이전트”가 아니라 “출시한 기능 M개”로. ROI를 못 그으면 다음 예산에서 잘린다.
- 좌석 정액제가 끝났다고 가정하고 비용을 설계하라. 사용량 기반에서는 무절제한 긴 루프·재시도가 곧 청구서다. 컨텍스트·루프 효율이 비용 최적화다.
- 벤더의 인센티브를 읽어라. 매출이 엔터프라이즈 에이전트에서 나므로, 가격·기능·정책 변화는 그 방향으로 기운다. 소비자 플랜의 관대함을 영구적이라 믿지 말 것.
- PMF 신호와 지속가능성 신호를 분리해 추적하라. “지금 비명 지르며 결제한다”(가격 좋음)와 “다음 분기에도 결제한다”(ROI 증명됨)는 다른 데이터다.
마무리
Willison의 진단은 단순하면서 강하다 — AI 랩의 PMF는 9억 명의 무료 챗봇 사용자가 아니라, 코딩 에이전트가 태우는 토큰을 풀 가격에 지불하기 시작한 소수의 엔터프라이즈에서 나타났다. 변곡점은 모델이 좋아진 것이 아니라, 비용이 매출로 뒤집히는 가격 구조가 장착된 것이다. 다만 “이를 악물고도 예스”가 “ROI를 회수했다”와 같지 않다는 점, 그리고 이 모든 게 감사받은 재무제표가 아닌 정황 추론이라는 점은 독자가 직접 보정해야 한다. 우리 개발자에게 남는 한 줄은 이것이다 — 이제 당신의 토큰 사용량은 누군가의 손익계산서에 적힌다.
더 읽어보기
- 원문 — I think Anthropic and OpenAI have found product-market fit (Simon Willison)
- 소프트웨어는 죽는 게 아니라 재평가된다 — AI 시대 해자(moat)가 어디로 이동하는지, 가치 귀속의 다른 면
- 죽은 경제 이론(The Dead Economy Theory) — AI가 만든 부가 어디로 집중되는가, 매크로 관점의 짝패
- AI는 왜 소프트웨어 엔지니어를 대체하지 못했나 — “AI가 일을 한다”는 서사를 비용·결과 관점에서 검증
- Intent Debt: 에이전트가 대신 갚아줄 수 없는 부채 — 토큰을 태운 만큼 가치를 돌려주려면 무엇이 필요한가
- 데이터는 소프트웨어가 아니다 — Anthropic의 셀프서비스 분석 — 엔터프라이즈가 에이전트로 실제 가치를 뽑아내는 구조