AI半導体
『買う』から『作る』へ——OpenAIも自前の推論チップ、広がる脱NVIDIAの波
要点: 大きなモデルを作る会社の中で、最後まで計算資源を買う側に徹していた OpenAI が、ついに自前のチップを出した。6月24日、OpenAI は Broadcom と組んだ初の独自チップ Jalapeño を公開した——LLM の推論(inference)に特化した設計で、早期のラボ試験では NVIDIA の Blackwell や Google の TPU と同等の性能を示し、推論トークンあたり約5割安いともいう(このコスト値は OpenAI の公式発表ではなく、Broadcom の CEO の発言や各社報道による)1。これは一社の話にとどまらない。Google・Amazon・Microsoft・Meta はすでに自前の推論チップを持っており、推論の計算がNVIDIA の GPU から各社の専用チップ(ASIC)へ割れていく流れの、最新の一手だ2。
何が発表されたか
Jalapeño は OpenAI にとって初の独自シリコンで、汎用ではなく推論のために設計された点が肝だ——頻出する演算(カーネル)、メモリの動き、ネットワーク、モデルの配信パターンといった、推論で効く部分に最適化したという1。設計はエンドツーエンドで約9か月と速く、OpenAI は自社の AI モデルの助けを借りて設計したと述べている1。
数字は現時点では早期段階の主張として読むべきものだ(実運用での検証はこれから)。早期のラボ試験で、電力あたり性能が現行の最先端より大きく良く、Blackwell/TPU と同等とされる1。よく引かれる推論トークンあたり約50%のコスト削減は、OpenAI の公式発表ではなく Broadcom の CEO が Bloomberg に語った数字だ1。実際の展開は2026年末に小規模から始まり、2027〜2028年に本格化する見込みで、最大の出資者かつクラウド提携先の Microsoft が初期生産の約4割を購入すると報じられている1。
なぜこれが一つの流れなのか
Jalapeño が「点」でなく「流れ」の一部なのは、顔ぶれがすでに揃っているからだ。Google の TPU、Amazon の Trainium、Microsoft の Maia、Meta の MTIA——主要各社はとうに自前の推論チップを走らせている2。背景には二つの事実がある。第一に、推論はいまや AI 計算の約3分の2を占め、学習より量が大きい2。第二に、その大きな塊で NVIDIA の GPU に払い続けるより、自社の負荷に合わせた ASIC を作るほうが単価を下げやすい。分析筋は、NVIDIA が学習では優位を保ちつつ、推論でのシェアは今後下がると見ている2。OpenAI の参入は、この「推論を自前シリコンへ」の動きに、最後の大物が加わったことを意味する。
作る側にとって何が変わるか
AI の上に何かを作る立場で、見るべき点は絞れる。
- 推論コストは、モデルの効率だけの話ではなくなる。 同じモデルでも、どのチップで動くかでトークン単価が変わる12。効率化の努力に加えて、推論がどのシリコンに載るかが価格と可用性を左右し始める。
- 垂直統合が進む。 モデルを作る会社がチップまで設計すると、モデル・ソフト・ハードが一体で最適化される。速さと安さの一方で、そのスタックへの囲い込みも強まりうる(自前チップの割安さは、そのプラットフォーム内での話になりやすい)。
- ただし、まだ『発表』段階だ。 Jalapeño の性能・コストは早期段階の主張(コスト比は Broadcom CEO・各社報道による)で、量産は2027〜2028年1。学習では NVIDIA が依然優位でもある2。過大評価も過小評価も早い。確かなのは、推論の土台が単一ベンダーの GPU から割れ始めたという向きのほうだ。
出典
-
OpenAI, “OpenAI and Broadcom unveil … Jalapeño inference chip”(公式ブログ, 2026-06-24,
openai.com/index/openai-broadcom-jalapeno-inference-chip/)。OpenAI 初の独自チップ・LLM 推論特化・約9か月でエンドツーエンド設計(自社モデルの助力)・早期テストで Blackwell/TPU 同等・2026年末に初期展開。推論トークンあたり約50%コスト減は OpenAI の公式発表ではなく、Broadcom CEO(Hock Tan, Bloomberg)/各社報道による。Microsoft が初期生産の約40%購入も報道ベース(TechCrunch/CNBC/Tom’s Hardware/VentureBeat, 2026-06-24)。https://openai.com/index/openai-broadcom-jalapeno-inference-chip/ ↩ ↩2 ↩3 ↩4 ↩5 ↩6 ↩7 ↩8 -
自前推論シリコンへの構造的シフト——Google TPU(v7 Ironwood)/Amazon Trainium 3/Microsoft Maia 200/Meta MTIA が既に稼働。推論は AI 計算の約2/3を占め、NVIDIA は学習で優位を保ちつつ推論シェアは低下すると分析される。https://www.cnbc.com/2026/04/22/google-launches-training-and-inference-tpus-in-latest-shot-at-nvidia.html ↩ ↩2 ↩3 ↩4 ↩5 ↩6
この記事はAIが下書きし、人間が編集・公開しています。