AI半導体

『買う』から『作る』へ——OpenAIも自前の推論チップ、広がる脱NVIDIAの波

2026/7/3

🤖 AIが下書き・人間が編集

AIの推論（全計算の約2/3）を大手各社が自前チップで動かし始めている関係図。Google=TPU、Amazon=Trainium、Microsoft=Maia、Meta=MTIA に、OpenAI の Jalapeño（6/24発表・新規）が加わった。NVIDIA は学習では依然優位だが推論のシェアは今後下がると予測。性能・コストは各社/分析側の主張。 — ※ 概念図（関係）・作図：AI。推論用の自前チップを持つ顔ぶれに、OpenAI が加わった。

要点： 大きなモデルを作る会社の中で、最後まで計算資源を買う側に徹していた OpenAI が、ついに自前のチップを出した。6月24日、OpenAI は Broadcom と組んだ初の独自チップ Jalapeño を公開した——LLM の推論（inference）に特化した設計で、早期のラボ試験では NVIDIA の Blackwell や Google の TPU と同等の性能を示し、推論トークンあたり約5割安いともいう（このコスト値は OpenAI の公式発表ではなく、Broadcom の CEO の発言や各社報道による）¹。これは一社の話にとどまらない。Google・Amazon・Microsoft・Meta はすでに自前の推論チップを持っており、推論の計算がNVIDIA の GPU から各社の専用チップ（ASIC）へ割れていく流れの、最新の一手だ²。

何が発表されたか

Jalapeño は OpenAI にとって初の独自シリコンで、汎用ではなく推論のために設計された点が肝だ——頻出する演算（カーネル）、メモリの動き、ネットワーク、モデルの配信パターンといった、推論で効く部分に最適化したという¹。設計はエンドツーエンドで約9か月と速く、OpenAI は自社の AI モデルの助けを借りて設計したと述べている¹。

数字は現時点では早期段階の主張として読むべきものだ（実運用での検証はこれから）。早期のラボ試験で、電力あたり性能が現行の最先端より大きく良く、Blackwell／TPU と同等とされる¹。よく引かれる推論トークンあたり約50%のコスト削減は、OpenAI の公式発表ではなく Broadcom の CEO が Bloomberg に語った数字だ¹。実際の展開は2026年末に小規模から始まり、2027〜2028年に本格化する見込みで、最大の出資者かつクラウド提携先の Microsoft が初期生産の約4割を購入すると報じられている¹。

なぜこれが一つの流れなのか

Jalapeño が「点」でなく「流れ」の一部なのは、顔ぶれがすでに揃っているからだ。Google の TPU、Amazon の Trainium、Microsoft の Maia、Meta の MTIA——主要各社はとうに自前の推論チップを走らせている²。背景には二つの事実がある。第一に、推論はいまや AI 計算の約3分の2を占め、学習より量が大きい²。第二に、その大きな塊で NVIDIA の GPU に払い続けるより、自社の負荷に合わせた ASIC を作るほうが単価を下げやすい。分析筋は、NVIDIA が学習では優位を保ちつつ、推論でのシェアは今後下がると見ている²。OpenAI の参入は、この「推論を自前シリコンへ」の動きに、最後の大物が加わったことを意味する。

作る側にとって何が変わるか

AI の上に何かを作る立場で、見るべき点は絞れる。

推論コストは、モデルの効率だけの話ではなくなる。 同じモデルでも、どのチップで動くかでトークン単価が変わる¹²。効率化の努力に加えて、推論がどのシリコンに載るかが価格と可用性を左右し始める。
垂直統合が進む。 モデルを作る会社がチップまで設計すると、モデル・ソフト・ハードが一体で最適化される。速さと安さの一方で、そのスタックへの囲い込みも強まりうる（自前チップの割安さは、そのプラットフォーム内での話になりやすい）。
ただし、まだ『発表』段階だ。 Jalapeño の性能・コストは早期段階の主張（コスト比は Broadcom CEO・各社報道による）で、量産は2027〜2028年¹。学習では NVIDIA が依然優位でもある²。過大評価も過小評価も早い。確かなのは、推論の土台が単一ベンダーの GPU から割れ始めたという向きのほうだ。

出典

OpenAI, “OpenAI and Broadcom unveil … Jalapeño inference chip”（公式ブログ, 2026-06-24, openai.com/index/openai-broadcom-jalapeno-inference-chip/）。OpenAI 初の独自チップ・LLM 推論特化・約9か月でエンドツーエンド設計（自社モデルの助力）・早期テストで Blackwell／TPU 同等・2026年末に初期展開。推論トークンあたり約50%コスト減は OpenAI の公式発表ではなく、Broadcom CEO（Hock Tan, Bloomberg）／各社報道による。Microsoft が初期生産の約40%購入も報道ベース（TechCrunch/CNBC/Tom’s Hardware/VentureBeat, 2026-06-24）。https://openai.com/index/openai-broadcom-jalapeno-inference-chip/ ↩ ↩² ↩³ ↩⁴ ↩⁵ ↩⁶ ↩⁷ ↩⁸
自前推論シリコンへの構造的シフト——Google TPU（v7 Ironwood）／Amazon Trainium 3／Microsoft Maia 200／Meta MTIA が既に稼働。推論は AI 計算の約2/3を占め、NVIDIA は学習で優位を保ちつつ推論シェアは低下すると分析される。https://www.cnbc.com/2026/04/22/google-launches-training-and-inference-tpus-in-latest-shot-at-nvidia.html ↩ ↩² ↩³ ↩⁴ ↩⁵ ↩⁶

この記事はAIが下書きし、人間が編集・公開しています。