In Silico

AI半導体

『買う』から『作る』へ——OpenAIも自前の推論チップ、広がる脱NVIDIAの波

2026/7/3

AIの推論(全計算の約2/3)を大手各社が自前チップで動かし始めている関係図。Google=TPU、Amazon=Trainium、Microsoft=Maia、Meta=MTIA に、OpenAI の Jalapeño(6/24発表・新規)が加わった。NVIDIA は学習では依然優位だが推論のシェアは今後下がると予測。性能・コストは各社/分析側の主張。
※ 概念図(関係)・作図:AI。推論用の自前チップを持つ顔ぶれに、OpenAI が加わった。

要点: 大きなモデルを作る会社の中で、最後まで計算資源を買う側に徹していた OpenAI が、ついに自前のチップを出した。6月24日、OpenAI は Broadcom と組んだ初の独自チップ Jalapeño を公開した——LLM の推論(inference)に特化した設計で、早期のラボ試験では NVIDIA の Blackwell や Google の TPU と同等の性能を示し、推論トークンあたり約5割安いともいう(このコスト値は OpenAI の公式発表ではなく、Broadcom の CEO の発言や各社報道による)1。これは一社の話にとどまらない。Google・Amazon・Microsoft・Meta はすでに自前の推論チップを持っており、推論の計算がNVIDIA の GPU から各社の専用チップ(ASIC)へ割れていく流れの、最新の一手だ2

何が発表されたか

Jalapeño は OpenAI にとって初の独自シリコンで、汎用ではなく推論のために設計された点が肝だ——頻出する演算(カーネル)、メモリの動き、ネットワーク、モデルの配信パターンといった、推論で効く部分に最適化したという1。設計はエンドツーエンドで約9か月と速く、OpenAI は自社の AI モデルの助けを借りて設計したと述べている1

数字は現時点では早期段階の主張として読むべきものだ(実運用での検証はこれから)。早期のラボ試験で、電力あたり性能が現行の最先端より大きく良く、Blackwell/TPU と同等とされる1。よく引かれる推論トークンあたり約50%のコスト削減は、OpenAI の公式発表ではなく Broadcom の CEO が Bloomberg に語った数字だ1。実際の展開は2026年末に小規模から始まり、2027〜2028年に本格化する見込みで、最大の出資者かつクラウド提携先の Microsoft が初期生産の約4割を購入すると報じられている1

なぜこれが一つの流れなのか

Jalapeño が「点」でなく「流れ」の一部なのは、顔ぶれがすでに揃っているからだ。Google の TPU、Amazon の Trainium、Microsoft の Maia、Meta の MTIA——主要各社はとうに自前の推論チップを走らせている2。背景には二つの事実がある。第一に、推論はいまや AI 計算の約3分の2を占め、学習より量が大きい2。第二に、その大きな塊で NVIDIA の GPU に払い続けるより、自社の負荷に合わせた ASIC を作るほうが単価を下げやすい。分析筋は、NVIDIA が学習では優位を保ちつつ、推論でのシェアは今後下がると見ている2。OpenAI の参入は、この「推論を自前シリコンへ」の動きに、最後の大物が加わったことを意味する。

作る側にとって何が変わるか

AI の上に何かを作る立場で、見るべき点は絞れる。


出典

  1. OpenAI, “OpenAI and Broadcom unveil … Jalapeño inference chip”(公式ブログ, 2026-06-24, openai.com/index/openai-broadcom-jalapeno-inference-chip/)。OpenAI 初の独自チップ・LLM 推論特化・約9か月でエンドツーエンド設計(自社モデルの助力)・早期テストで Blackwell/TPU 同等・2026年末に初期展開。推論トークンあたり約50%コスト減は OpenAI の公式発表ではなく、Broadcom CEO(Hock Tan, Bloomberg)/各社報道による。Microsoft が初期生産の約40%購入も報道ベース(TechCrunch/CNBC/Tom’s Hardware/VentureBeat, 2026-06-24)。https://openai.com/index/openai-broadcom-jalapeno-inference-chip/ 2 3 4 5 6 7 8

  2. 自前推論シリコンへの構造的シフト——Google TPU(v7 Ironwood)/Amazon Trainium 3/Microsoft Maia 200/Meta MTIA が既に稼働。推論は AI 計算の約2/3を占め、NVIDIA は学習で優位を保ちつつ推論シェアは低下すると分析される。https://www.cnbc.com/2026/04/22/google-launches-training-and-inference-tpus-in-latest-shot-at-nvidia.html 2 3 4 5 6

この記事はAIが下書きし、人間が編集・公開しています。