Caveman: "원시인처럼 말해"로 토큰 75% 줄이기 가능?

Claude Code 및 Codex용 플러그인으로, LLM의 응답을 '원시인 말투'로 변환해 출력 토큰을 약 65~75% 절감한다는 프로젝트. GitHub에 올라오자마자 HN에서 논쟁이 붙었다.

제거 대상 (필러 표현들)

"Sure, I'd be happy to help" (8토큰)
"The reason this is happening is because" (7토큰)
"I would recommend that you consider" (7토큰)

유지 대상: 코드 블록, 기술 용어, 에러 메시지

세 가지 강도	레벨 트리거	특징
Lite	/caveman lite	문법 유지, 불필요 단어만 제거
Full	/caveman full	관사·서두 제거
Ultra	/caveman ultra	전보체, 최대 압축

벤치마크 결과

React 리렌더링 버그 설명은 87%(3454→456토큰) 절감됐지만, 콜백을 async/await로 리팩토링하는 태스크는 22%(387→301토큰)밖에 줄지 않았다. 설명이 많이 필요한 태스크일수록 절감 효과가 크고, 코드 위주 태스크에서는 줄일 여지 자체가 적다.

핵심 논쟁: 토큰은 "말"인가 "생각"인가

Transformer 아키텍처에서 각 토큰 생성은 모델이 수행할 수 있는 하나의 연산 스텝이다. 토큰 수를 줄이면 모델이 중간 추론 과정을 거칠 공간이 줄어든다. 원시인 말투를 강제하면 "어떻게 말할지"에 연산 자원이 빠지면서 "무엇을 말할지"의 품질이 떨어질 수 있다는 의미다.

반대 방향의 근거도 있다. 2026년 3월 발표된 논문에서, 대형 모델에 간결하게 답하라는 제약을 걸었더니 특정 벤치마크에서 정확도가 26%p 향상되고 모델 간 성능 서열이 뒤집어졌다. 장황한 응답은 "확신 없는 영역을 말로 메우는" 행동과 관련 있고, 간결성을 강제하면 이런 "말로 때우기"가 차단되면서 모델이 가장 확신하는 핵심 정보만 출력하게 된다.

실무 관점에서의 반론

에이전트 코딩 환경에서 Claude가 삼키는 건 스킬 정의, 디렉토리 트리, 코드 파일, 도구 출력 결과 같은 입력 컨텍스트다. Claude Code 같은 에이전트 환경에서 입력 토큰이 출력 토큰의 수십 배에 달하는 경우가 흔하다. 게다가 Caveman 스킬 자체도 컨텍스트에 로드되면서 입력 토큰을 소비한다. 즉, 출력 몇백 토큰 아끼려다 입력에서 더 쓰는 역설이 생길 수 있다는 것.

이 프로젝트가 진짜 말해주는 것

현재 LLM들은 RLHF 학습 과정에서 "친절하고 상세하게" 응답하도록 과도하게 튜닝되어 있다. "Sure, I'd be happy to help you with that"은 모델이 정말 기뻐서 하는 말이 아니라, 학습 데이터에서 높은 보상을 받은 패턴이 반복되는 것이다.

Caveman이 던지는 근본적인 질문은 이것이다. LLM 출력의 최적점은 어디인가? 너무 간결하면 추론 품질이 떨어지고, 너무 장황하면 정보 밀도가 낮아진다. 현재 대부분의 모델은 장황한 쪽으로 과적합되어 있고, Caveman은 그 반대쪽 극단을 실험하는 프로젝트다.

RLHF로 과잉 친절해진 LLM의 빈말 토큰이 얼마나 많은지 보여주는 실험 프로젝트. 실용성 논쟁은 있지만, 질문 자체는 유효하다.

Caveman - 원시인 말투로 Claude/Codex 토큰 절약하기 | GeekNews

원시인 말투로 응답하도록 강제해 평균 65~75%의 출력 토큰을 절감하는 스킬Lite·Full·Ultra 세 단계로 압축 강도를 조절하며, 기술적 정확성을 유지한 채 짧고 효율적인 답변 생성실제 벤치마크에

news.hada.io

LLM에게 "원시인처럼 말해"라고 시키면 토큰 75%가 줄어든다, 근데 정말 괜찮을까?

wikidocs.net

'Clipping articles' 카테고리의 다른 글

에이전트가 UI를 못생기게 만드는 이유, 그리고 해결 방법 (4)	2026.05.02
클라우드 인프라 확산과 의존 리스크 알아보기: Cloudflare 장애 사례 중심으로 (0)	2025.11.19
"연말까지 칩 랠리"…외국인, 환율 아랑곳 않고 5조 넘게 쓸어담아 (0)	2025.10.10
셧다운 불확실성과 AI 거품론 속에서도 — 삼성전자 9만 원 돌파, 투자심리는 어디로? (0)	2025.10.05
AI 기본법 시행령, 과도한 규제? (0)	2025.10.04

하면 뭐든 되겠지

Caveman: "원시인처럼 말해"로 토큰 75% 줄이기 가능?

벤치마크 결과

핵심 논쟁: 토큰은 "말"인가 "생각"인가

실무 관점에서의 반론

이 프로젝트가 진짜 말해주는 것

'Clipping articles' 카테고리의 다른 글

티스토리툴바

Caveman: "원시인처럼 말해"로 토큰 75% 줄이기 가능?

벤치마크 결과

핵심 논쟁: 토큰은 "말"인가 "생각"인가

실무 관점에서의 반론

이 프로젝트가 진짜 말해주는 것

'Clipping articles' 카테고리의 다른 글

관련글

티스토리툴바