AIに「原始人みたいな片言」でしゃべらせて、利用料を減らそうとする動きが広がっています。ふだんは「なるほど、おっしゃる通りですね」と丁寧に前置きしてくれるAIに、あえて余計な言葉を削らせて、いわば「ウホ、直った」くらいの短さで返させる。冗談のような話ですが、背景には企業のAI利用料が跳ね上がっているという、かなり切実な事情があります。しかもこの仕組みには、OpenAIの現役社員までコードを寄せているというのです。
トークン課金という新しい悩み
まず、なぜ「言葉を削る」ことが節約になるのかという話から。生成AIの利用料は、多くの場合「トークン」という単位で計算されます。トークンは、ざっくり言えば単語のかけら(英語だと1トークンで4分の3語くらい)で、AIに送った文章(入力)と、AIが返してきた文章(出力)の両方が課金の対象になります。つまりAIが丁寧に、長々と答えるほど、そのぶん料金がかさむわけです。「承知しました、喜んでお手伝いします」という一言も、大規模に使えば本物のお金になります。
この負担が、いま企業の現場で無視できない大きさになっています。GitHubは2026年4月、コーディング支援「Copilot」の課金を、定額の月額制からトークンごとの従量課金へ切り替えると発表しました。配車大手のUberは、AIツールの利用に上限を設けたと報じられ、同社のCTOは1年ぶんのAI予算をわずか4か月で使い切ったと明かしています。ウォルマートも同様に利用の上限を設けました。つまり「便利だから使っていたら、想定より桁違いに高くついた」という事態が、あちこちで起きているということです。
「caveman(原始人)」プロジェクトの中身
そこで登場したのが、caveman(ケイブマン=原始人)と名づけられたツールです。作者のJulius Brussee氏が2026年4月初めに作ったもので、AIコーディングツールのClaude CodeやCodex、Geminiなどに追加すると、AIの返答から「丁寧な言い回し・言葉を濁す表現・話のつなぎ・雑談っぽい前置き」といった、作業のうえでは中身に関係のない部分をそぎ落としてくれます。
大事なのは、なんでもかんでも削るわけではない点です。プログラムのコード、コマンド、ファイルの場所(パス)、URL、数値、関数の名前といった「一字でも間違えたら困る部分」はそのまま残し、その周りを取り巻く言葉づかいだけを圧縮する設計になっています。作者はこれを「礼儀正しいチャットボットというより、そっけない道具のようにしゃべらせる」と説明しています。中身は同じで、言葉数だけを減らす、というわけです。
削り具合は4段階から選べます。軽く前置きを落とすだけの「lite」、標準の「full」、電報のように切り詰める「ultra」、そして返答そのものを古典中国語(漢文)に変換してさらに短くする「wenyan(文言)」まであります。導入もコマンド一行で済むようになっていて、対応するAIツールは30種類を超えます。

どれくらい言葉を削れるのか
気になるのは「本当に安くなるのか」です。作者が公開しているベンチマーク(Claude APIで実際のトークン数を数えたもの)では、10種類の作業の平均で出力トークンが65%減ったとされています。ばらつきは大きく、よく効いた例では87%、あまり効かなかった例では22%でした。作者自身の評価では、標準状態と比べて出力トークンをおよそ65〜75%削減でき、単に「簡潔に答えて」と指示した場合よりも短くなったといいます。
報じた404 Media自身がClaude Codeで試したときも、返答は目に見えて短くなりました。書いたコードを見直させると「Want changes to it?(変える?)」、コードの仕組みを説明する場面でも「Uses official API, not scraping(公式APIを使用、スクレイピングではない)」といった具合です。このセッションでは約5,800トークン、割合にして65%が節約できたと表示されたとのことです。数字だけ見ると地味ですが、AIを1日中、何百回と動かす現場では、この積み重ねが効いてきます。
OpenAI社員も加わった広がり
おもしろいのは、このツールを使っているのが個人の物好きだけではないという点です。作者によれば、OpenAI・Nvidia・GitHubといった名だたる企業の開発者からも「使っている」「試している」という声が届いているそうです。さらにGitHub上の記録では、OpenAIでエンジニアリング部門の責任者を務めるShayne Sweeney氏が、自社のCodexに対応させるためのコードをcavemanに寄せています。自分たちのAIツールのおしゃべりを、外部の有志ツールで削っているというのは、なかなか象徴的な光景です。
企業ぐるみで取り入れている例もあります。電気・データセンター関連の設備を手がけるLegrand(ルグラン)社は、社内メモで「請求方式が変わって新しい上限ができたので、予算を早く使い切らないよう全員がAIの使い方に気をつける必要がある」と呼びかけ、効果の大きい対策の一つとしてcavemanの利用を挙げていたと報じられています。ほかにも「いつも一番強いモデルを使わない」「常に高い推論設定にしない」といった項目と並んでの記載でした。
知能は落ちるのかという論点
ここで当然、「言葉を削らせたら、AIの頭も悪くなるのでは?」という疑問がわきます。この点は見方が分かれています。
作者側の主張は「口を小さくするだけで、脳は小さくしていない」というものです。cavemanが削るのはあくまで表に出てくる出力の部分で、AIが答えを出すまでに内部で使う「考えるための処理(思考トークン)」には手を触れていない、という説明です。実際、2026年3月に公開された論文では、大きなモデルに短い返答を強いると、一部のテストではかえって正答率が上がった(26ポイント改善した例もある)と報告されています。長ければ良いというものでもない、というわけです。
一方で、慎重な見方もあります。AIに「原始人」のような単純なしゃべり方を強いると、その制約が受け答えの質そのものににじみ出て、考える力まで落ちるのではないか、という懸念です。こちらはまだはっきり決着がついておらず、結果を見るときには頭の片隅に置いておいたほうがよさそうです。
効果の限界と注意点
盛り上がっている話ではありますが、cavemanを万能の節約術と受け取るのは早計です。専門家からは「出力トークンは、実はコスト全体の中では小さい部分にすぎない」という指摘も出ています。むしろAIの利用料を大きく押し上げているのは、長々とした入力(これまでのやり取りの履歴など)や、AIが裏で自動的に何度も動き続ける処理のほうだ、という見方です。この見立てに立つなら、出力の言葉を削るより、そうした仕組みそのものを見直すほうが効くことになります。
作者自身も、cavemanの一番の利点はコスト削減というより「読みやすさと速さ」で、費用が浮くのはおまけだ、と位置づけています。つまりこれは劇的な解決策というより、膨らむAIコストに現場が編み出した工夫の一つ、と捉えておくのがちょうどよさそうです。それでも、ふだん私たちがAIに向ける「ありがとう」の一言にすら電気代がかかっている(かつてOpenAIのサム・アルトマン氏が、利用者の「please」「thank you」で数千万ドルの電気代がかかっていると述べたことがあります)ことを思うと、「言葉のぜい肉をどう減らすか」が真面目な課題になっている今の空気が、よく伝わってくる話ではあります。
出典・もっと知りたい人へ
この話題は、テクノロジー系メディアの404 Media(英語)が報じたものです。cavemanプロジェクトそのものはGitHub(英語・MITライセンス)で公開されており、削減量のベンチマークや導入方法もそちらで確認できます。数値は執筆時点で作者や報道が公開しているもので、実際の効果は使い方によって変わります。


コメント