비즈니스 제116호 ·

연봉 절반을 토큰에 쓰라더니... 그 결과는?

우버가 4개월 만에 1년 예산을 태운 뒤 벌어진 일

연봉 절반을 토큰에 쓰라더니... 그 결과는?

들어가며

올해 3월, 엔비디아 GTC 무대에서 젠슨 황이 이런 말을 했어요. “연봉 50만 달러짜리 개발자가 연말에 토큰을 5,000달러밖에 안 썼다면, 저는 미쳐버릴 겁니다.”최소 25만 달러, 연봉의 절반은 써야 한다고요. 토큰을 안 쓰는 건 “종이와 연필로 반도체를 설계하겠다는 것”과 같다는 비유까지 덧붙였어요.

3개월 뒤인 이번 주, 그 조언을 가장 충실히 따른 회사에서 예상 밖의 일이 벌어졌어요. 우버가 AI 코딩 도구에 직원 1인당 월 1,500달러 사용 상한을 걸었어요. 연간 AI 예산을 4개월 만에 전액 소진한 뒤 내린 결정이에요. 결론부터 말씀드리면, “토큰을 얼마나 쓰느냐”는 이미 지난 질문이에요. 다음 게임은 “무엇을 위해 쓰느냐”와 “효과를 어떻게 증명하느냐”예요.

🎯 젠슨 황의 토큰 독트린

올해 GTC에서 젠슨 황이 제시한 공식은 단순했어요. “토큰을 많이 쓸수록, 개발자는 더 생산적이 된다.”

구체적인 숫자로 바꾸면 이래요. 연봉 50만 달러(약 7억 원)를 받는 엔지니어라면, 연간 토큰1​ 예산이 최소 25만 달러(약 3.5억 원)는 되어야 한다는 거예요. 월로 환산하면 약 2만 달러, 한화 2,800만 원 수준이에요. 그는 한발 더 나아가서 토큰 예산을 연봉 위에 얹는 일종의 복리후생으로 제안하기까지 했어요. 기본급의 절반 규모를 토큰 예산으로 추가 지급해서 엔지니어를 10배 더 생산적으로 만들겠다고요.

이 발언이 나온 맥락을 짚어야 해요. 엔비디아의 사업 모델 자체가 “토큰을 생산하는 공장”이거든요. 젠슨 황 스스로 GTC에서 “Revenue = Tokens per Watt × Available Gigawatts”라는 공식을 제시했어요. 토큰 소비가 늘수록 GPU 수요가 늘고, 엔비디아의 매출이 올라가요. 젠슨 황에게 토큰은 제품이에요.

하지만 우버나 월마트 같은 기업에게 토큰은 원자재에 가까워요. 제품이 아니라 비용이에요. Constellation Research의 래리 디그넌이 정확히 집었어요.

“JP모건은 금융 서비스를 팔고, 월마트는 소매를 팔고, GM은 자동차를 팔아요. 이 회사들의 CIO가 원하는 건 더 싼 추론 비용, 더 나은 ROI, 그리고 AI 투자가 언제 회수되는지에 대한 명확한 답이에요.”

토큰을 파는 사람과 토큰을 사는 사람의 최적 전략은 정반대예요. 그런데 젠슨 황의 이 선언은 실리콘밸리 전체에 하나의 문화를 만들어냈어요. 이른바 ‘토큰맥싱’2​이에요. “토큰을 최대한 많이 소비하는 게 곧 생산성”이라는 믿음이요. 일부 기업은 개발자별 토큰 사용량을 리더보드로 만들어 내부 경쟁까지 유도했어요. 메타도 내부 대시보드로 직원별 토큰 소비량을 랭킹했다는 보도가 있었어요.

🔥 우버의 실험, 그리고 4개월의 결산

우버는 토큰맥싱의 가장 충실한 실행자였어요.

2025년 12월, 우버는 약 5,000명의 엔지니어에게 앤트로픽의 Claude Code3​를 배포했어요. Cursor4​도 함께 도입했고요. 젠슨 황의 플레이북 그대로, 내부 리더보드를 만들어 직원들의 토큰 사용량을 랭킹으로 보여줬어요. 결과는 숫자로만 보면 대성공이었어요.

올해 2월까지 사용량이 2배로 뛰었고, 엔지니어의 95%가 매월 AI 도구를 사용하게 됐어요. 코드 커밋의 70%가 AI 기반으로 전환됐고, AI 기반 기능 활용률은 2월 32%에서 3월 84%로 급등했어요. CEO 다라 코스로샤히는 지난달 “전체 코드의 약 10%가 AI 에이전트에 의해 자율적으로 작성·제출된다”고 발표했어요. 법무팀과 마케팅팀에서도 AI 사용이 빠르게 늘고 있다고 했고요. 소위 말하는 “AI-Native”회사가 된 거에요.

문제는 4월에 터졌어요. 연간 AI 예산이 4개월 만에 전부 소진됐어요. CTO 프라빈 네팔리 나가가 직접 인정한 사실이에요. 엔지니어 1인당 월 API 비용이 500달러에서 2,000달러까지 분포했는데, 이걸 5,000명에 곱하면 매달 수백만 달러가 증발한 셈이에요. 우버의 R&D 지출은 2025년 34억 달러(전년비 9% 증가)였는데, 2026년 1분기에만 9.5억 달러(전년비 17% 증가)를 기록했어요.

CTO는 “처음부터 다시 설계해야 한다(back to the drawing board)“고 말했어요. 그리고 이번 주 블룸버그 보도에 따르면, 우버는 에이전틱 코딩5​ 도구에 한해 직원 1인당, 도구 1개당 월 1,500달러의 사용 상한을 도입했어요. 도구별 독립 한도라서 Claude Code에 1,500달러, Cursor에 1,500달러를 각각 쓸 수는 있지만, 젠슨 황이 제시한 월 약 2만 달러의 비전과 비교하면 7.5% 수준이에요.

하지만 진짜 폭탄은 비용이 아니에요. COO 앤드루 맥도널드가 지난달 Rapid Response 팟캐스트에서 한 이 말이에요.

“AI 사용 지표가 천문학적인 방향으로 좋아지고 있다는 건 알아요. 그런데 그 수치 하나하나와 ‘우리가 실제로 소비자에게 25% 더 유용한 기능을 만들고 있다’는 것 사이에 선을 긋기가 매우 어려워요.”

엔지니어의 95%가 쓰고, 코드의 70%를 AI가 작성하는데, 그게 고객에게 어떤 가치로 돌아가는지 증명할 수 없다는 고백이에요. 이 발언 이후 우버 주가는 2.9% 하락했어요.

📐 빠진 퍼즐 : 측정이라는 다음 게임

우버만의 문제가 아니에요.

월마트는 이번 주 내부 AI 에이전트 ‘Code Puppy’의 사용 토큰을 직원별 배급제로 전환했어요. 아마존은 내부 AI 사용 리더보드를 운영했다가, 직원들이 실제 업무 성과 대신 토큰 소비량 경쟁에만 몰두하자 리더보드 자체를 철거했어요. 한 이름 미공개 기업은 지출 상한을 아예 설정하지 않아서 한 달에 5억 달러(약 7,000억 원)의 AI 토큰 비용이 발생한 사례까지 보도됐어요.

규모를 보면 왜 이런 일이 벌어지는지 알 수 있어요. Menlo Ventures 분석에 따르면, 기업의 부서별 AI 지출 중 55%가 코딩 도구에 집중되어 있어요. 2024년 5.5억 달러에서 2025년 40억 달러로, 1년 만에 7배 성장한 수치예요. Gartner는 2026년 AI 에이전트 소프트웨어 지출이 2,070억 달러에 달할 것으로 전망하고 있고요. 전년비 139% 증가예요.

돈은 쏟아지고 있어요. 그런데 효과를 측정하는 인프라는 쏟아지지 않고 있어요.

CloudBees가 올해 발표한 ‘코드 풍요 시대(Code Abundance)’ 보고서가 이 간극을 선명하게 보여줘요. 기업 리더의 83%가 “우리는 AI 도입 준비가 잘 되어 있다”고 자가 평가했어요. 그런데 동시에 81%가 “AI 생성 코드로 인한 프로덕션 이슈가 증가했다”고 응답했어요. 자신감과 현실 사이의 괴리가 이렇게 큰 거예요.

개발자 생산성 벤치마크 연구도 같은 결론을 내리고 있어요. 기존에 쓰던 지표들인 주간 PR6​ 수, 코드 라인 수, 커밋 수 등 이 2026년에는 더 이상 신뢰할 수 없게 됐어요. AI가 코드 볼륨을 부풀리기 때문이에요. 양이 늘었는지는 알 수 있지만, 가치가 늘었는지는 기존 계기판으로 알 수 없어요. AI 코딩 도구는 진짜 생산성 향상도 만들지만, 동시에 생산성 향상의 환상도 만들어내요. 그리고 기존 지표로는 그 둘을 구분할 수 없다는 게 핵심 문제예요.

오스왈드의 시선

솔직히 말씀드리면, 저는 젠슨 황의 토큰 독트린을 들었을 때부터 이런 일이 올 거라고 예상했어요.

기술 전략을 수립하면서 봐온 패턴이 있어요. 새로운 도구가 등장하면 기업은 항상 열광적 도입 → 비용 충격 → 그제야 ROI 측정 순서를 밟아요. CRM이 그랬고, 클라우드가 그랬고, 이제 AI 코딩 도구도 같은 길을 가고 있어요. 매번 측정이 마지막에 와요.

이번에 측정이 특히 어려운 구조적 이유가 있어요. 코드 작성은 소프트웨어 개발 파이프라인의 일부일 뿐이거든요. AI가 코딩 구간을 10배 빠르게 만들어도, 병목이 설계나 테스트에 있으면 전체 속도는 변하지 않아요. 제조업의 ‘제약 이론’7​과 같은 원리예요. 게다가 토큰을 많이 쓴다는 건 AI를 “많이” 쓴다는 뜻이지 “잘” 쓴다는 뜻은 아니에요. 통화 횟수와 계약 체결이 다른 지표이듯이요.

다만 AI 코딩 도구의 가치 자체를 부정하긴 어려워요. 우버도 사용을 중단한 게 아니라 상한을 건 거예요. 토큰맥싱의 끝은 AI 도구 시대의 끝이 아니라, 측정의 시대가 시작된다는 뜻이에요.

마치며

젠슨 황은 “많이 쓰라”고 했고(정), 우버는 충실히 따르다 4개월 만에 연간 예산을 태웠어요(반). 기업들이 지금 깨닫고 있는 건, 토큰 사용량이 아니라 AI와 비즈니스 성과 사이의 연결고리를 증명하는 능력이 진짜 경쟁력이라는 거예요(합). 도입 속도보다 측정 설계가 먼저예요.

구독자님의 조직에서는 AI 도구의 효과를 어떻게 측정하고 계신가요? 혹시 ‘토큰맥싱’을 경험하고 계신 건 아닌지, 댓글로 이야기 나눠봐요.

참고자료 & 더 읽기

핵심 출처

배경 지식

필자 안광섭은 세종대학교 경영학과 교수이자 OBF(Oswarld Boutique Consulting Firm) 리드 컨설턴트이다. 대학에서 경영데이터 관리, 비즈니스 애널리틱스 등 통계 및 데이터 분석을 가르치는 한편, 현장에서는 GTM 전략과 인공지능 전략 컨설팅을 이끌며 기술과 비즈니스의 접점을 설계하고 있다. AI 대화 시스템의 기억 아키텍처(HEMA) 연구로 학술 논문을 발표했으며, 매일 글로벌 AI 논문을 큐레이션하는 Daily Arxiv 프로젝트를 운영하고 있다. 고려대학교 기술경영전문대 석사과정와 KMBA을 졸업했다. 지은 책으로 《생각을 맡기는 사람들: 호모 브레인리스》가 있다.

각주

  1. 토큰(Token): AI가 텍스트를 처리할 때 사용하는 기본 단위예요. 대략 한글 1글자, 영어 0.75단어에 해당해요. AI 서비스 비용은 보통 이 토큰 소비량 기준으로 매겨져요.

  2. 토큰맥싱(Tokenmaxxing): AI 토큰 사용량을 최대한 끌어올리는 기업 문화를 뜻하는 신조어예요. “많이 쓸수록 생산적”이라는 가정 아래, 일부 기업은 사용량 리더보드까지 운영했어요.

  3. Claude Code: 앤트로픽이 만든 에이전틱 코딩 도구예요. 단순 코드 제안을 넘어 터미널에서 자율적으로 코드를 작성·수정·실행하는 기능을 갖추고 있어요.

  4. Cursor: AI를 코드 에디터에 직접 통합한 개발 도구예요. VS Code를 기반으로 만들어졌고, AI가 전체 파일 단위로 코드를 분석하고 수정할 수 있어요.

  5. 에이전틱 코딩(Agentic Coding): AI가 단순히 코드 한 줄을 제안하는 것을 넘어, 여러 단계의 작업을 자율적으로 계획하고 실행하는 코딩 방식이에요. 파일 생성, 테스트 실행, 오류 수정까지 스스로 수행해요.

  6. PR(Pull Request): 개발자가 작성한 코드를 팀에 검토 요청하는 절차예요. 코드가 본 프로젝트에 합쳐지기 전 동료 검토를 거치는 과정이에요.

  7. 제약 이론(Theory of Constraints): 시스템 전체의 성과는 가장 느린 병목 구간에 의해 결정된다는 이론이에요. 한 구간만 빠르게 만들어도 다른 곳이 막혀 있으면 전체 속도는 변하지 않아요.