OpenAI、自社初のAIチップ「ハラペーニョ」を発表——推論に特化し、Nvidia依存を薄める狙い

OpenAIが、自分たちのAIを「動かす側」に特化した独自チップ「Jalapeño（ハラペーニョ）」を発表しました。半導体大手のBroadcom（ブロードコム）と組んで作ったもので、汎用のGPUではなく、ChatGPTやCodexのような大規模言語モデルを動かすことだけに絞って一から設計してあります。しかも設計の一部にはOpenAI自身のAIモデルを使い、構想から製造に回すところまでをわずか9か月でやってのけた、というのが今回の目玉です。

「推論」に特化した独自チップ

まず押さえておきたいのが、AIの仕事には大きく2つの工程があるということです。1つはモデルそのものを作る「学習（トレーニング）」。膨大なデータを読み込ませて賢くしていく段階で、ここはとにかく計算パワーが要ります。もう1つが、できあがったモデルを実際に動かして、ユーザーの質問に答えを返す「推論（インファレンス）」。ChatGPTに何か聞いて返事が来るのは、この推論が裏で走っているからです。

Jalapeñoは、このうち推論だけに狙いを定めたチップです。OpenAIはこれを「インテリジェンス・プロセッサー」と呼んでいて、自社にとって初めての独自AIチップになります。種類としてはASIC（エーシック）と呼ばれるもので、これは特定の用途だけに絞って設計した専用チップのこと。なんでもこなせるGPUと違って融通は利きませんが、用途を割り切るぶん、その仕事に対しては効率よく・安く作れるのが持ち味です。学習用の汎用ハードが背負っている余計な機能をそぎ落とし、推論という一点に最適化した、というわけです。

推論にこだわる理由

なぜ学習ではなく推論なのか。OpenAIの言い分はシンプルで、「推論こそAIがユーザーに届く場所だから」です。週に8億人を超える人がChatGPTを使うようになると、毎回の応答を返すための推論コストが、そのまま会社の運営コストにのしかかってきます。ここを少しでも下げられれば、その効果は「ChatGPTの返事が速くなる」「Codexがもっと多くの手順を、待ち時間少なくこなせる」「APIで作るサービスが安くなる」といった形で、利用者側にも返ってくる——というのが今回のストーリーです。

設計の特徴としては、チップ内でのデータの移動を減らし、計算・メモリ・通信のバランスを取ることで、理論上の最大性能に近いところまで実際の処理性能を引き上げることを狙っているとしています。チップ同士をつなぐ部分にはBroadcomの「Tomahawk（トマホーク）」というネットワーク用シリコンを使い、サーバーのラックやボードへの組み込みはカナダのCelestica（セレスティカ）が担当します。チップ単体を売るのではなく、ラックごと仕上げたシステムとして展開する形です。

9か月という異例の開発速度

今回いちばん業界を驚かせているのが、開発の速さです。OpenAIとBroadcomは、最初の設計から「テープアウト」——チップの設計を確定して工場に製造を回す段階——までを、わずか9か月でやり遂げたとしています。新しいチップを一から起こす場合、ふつうは1年半から2年ほどかかるとされるので、その半分以下です。OpenAIは「高性能な先端半導体としては、史上最速のASIC開発サイクルではないか」と自負しています。提携そのものが公表されたのが2025年10月なので、発表からの流れもかなり速い。

この速さの理由としてOpenAIが挙げているのが、ソフトとハードを密に並走させた共同開発に加えて、設計・最適化の一部にOpenAI自身のAIモデルを使ったという点です。どのモデルを使ったかは明言していませんが、自社のAIがチップ設計の作業を肩代わりして開発を縮めた、という構図になります。

AIがチップ設計を助ける循環

この「AIがチップを設計する」という話には、もう一段の含みがあります。OpenAIは、ユーザーに提供しているのと同じモデルが、次世代のモデルを動かすための土台（インフラ）づくりにも役立っている、と説明しています。つまり、AIがより速くより良いチップを設計できるようになれば、計算のコストが業界全体で下がり、その安くなった計算資源でまた次のAIを育てられる——という循環です。

ちなみに、できあがったエンジニアリング・サンプル（試作段階のチップ）は、すでにラボで実際の機械学習の処理を動かしているとのこと。そこにはOpenAIのコーディング向けモデル「GPT-5.3-Codex-Spark」も含まれている、と公式は具体名を挙げています。

狙いはコストとNvidia依存の軽減

戦略面で見ると、今回のチップにはGPUの調達制約とコストから少しでも抜け出したい、という思惑がはっきり出ています。生成AIブームが始まって以来、OpenAIはGPU最大手Nvidia（エヌビディア）の上得意客であり続けてきました。ただ、計算資源は「いくらあっても足りない」状態が続いていて、OpenAIのGreg Brockman社長はCNBCの取材に「計算資源を十分な速さで手に入れられない」と語っています。自前のチップを持てば、この供給とコストの両面で、自分たちでコントロールできる余地が広がります。

もっとも、これでNvidiaが要らなくなるわけではありません。Jalapeñoはあくまで推論に絞った専用チップで、計算負荷の重い学習のほうは、引き続きNvidiaのハードに頼ると見られています。GoogleやAmazon、Metaがすでに自社向けの専用チップ（AIアクセラレーター）を持っているのと同じ流れに、OpenAIも乗った、という整理がいちばん近いところです。なお、BroadcomはこれまでもGoogleやMetaの専用チップを手がけてきた実績があり、その意味では順当な座組みでもあります。

性能の独立検証という留意点

ここは冷静に見ておきたいところです。「推論コストを約50%下げる」「コスト効率が約50%良い」といった数字が一部で報じられていますが、これはBloombergの報道やBroadcom側の発言にもとづくもので、具体的な仕様やベンチマークは公開されておらず、第三者による独立した検証はまだ出ていません。

OpenAI自身が公式に言っているのは、「初期テストの段階で、電力あたりの性能（パフォーマンス・パー・ワット）が現行の最先端より大幅に良くなりそうだ」というところまでで、最終的な性能はまだ計測中だとしています。詳しい技術レポートは数か月後に出す予定とのこと。実機の本格展開は2026年末に始まり、その先の数年で規模を広げていく計画で、Broadcomのホック・タンCEOは「2026年末にまず小規模なプロトタイプ展開があり、そこから拡大していく」と説明しています。つまり、いま手元にあるのは「速く作れた試作チップと、強気の見通し」の段階であって、本当に期待どおりの効率が出るかどうかは、これからの検証待ち、ということになります。

とはいえ、推論のコストはAIサービスの採算を左右する大きな要素です。そこを自前のチップで握りにいったこと自体が、AIの会社が「ソフトとモデルを作る会社」から「土台のハードまで自分で設計する会社」へ踏み込んだ動きとして、注目に値する一手だと言えそうです。