Kina har nettopp bygget en stor AI-modell uten Nvidia-brikker. Nå har OpenAI funnet måter å kjøre på langt færre av dem, og kutter kostnadene for inference med over halvparten. Likevel steg Nvidia-aksjen.
Det er det som er gåten. OpenAI er en av Nvidias (NVDA) største kunder. Likevel steg aksjen, selv om de trenger færre brikker.
OpenAI kutter inference-kostnader på to fronter
Den første fronten er programvare. The Information rapporterte at OpenAI-ingeniører har kuttet inference-kostnader med over halvparten ved å bruke nye optimaliseringsmetoder. OpenAI har ikke offentliggjort de tekniske detaljene.
Besparelsene reduserer antallet Nvidia-brikker som trengs for å håndtere noe av ChatGPT-trafikken. Det kan også gi OpenAI mulighet til å senke prisene eller øke brukslimitene.
Den andre fronten er maskinvare. 24. juni lanserte OpenAI og Broadcom (AVGO) Jalapeño, deres første egendesignede brikke. OpenAI sier tidlige tester tyder på vesentlig bedre ytelse per watt enn dagens ledende brikker, med en designperiode på ni måneder.
De første brikkene skal rulles ut i gigawatt-skala innen utgangen av 2026, med Microsoft som hovedpartner. Nvidia driver fortsatt mesteparten av OpenAIs inference, selv om OpenAI finansierer sitt Broadcom-brikke partnerskap.
Big Tech kappes om å lage egne brikker
OpenAI er ikke alene. Google har laget tensor-prosessorenheter siden 2016, og Amazon fulgte opp med sine egne. Analysebyrået TrendForce forventer at ASIC-baserte systemer vil stå for 27,8 % av AI serverleveranser i 2026, det høyeste siden 2023.
Ifølge TrendForce ser det ut til at egendesignede brikker vil vokse raskere enn Nvidias GPU-er for første gang. Leverandører som Broadcom og Marvell har blitt nøkkelaktører innen egendesignede brikker i utbyggingen.
Sanksjoner fører til samme trend i Kina. Meituan trente nylig sin LongCat-2.0-modell med 1,6 billioner parametere på kinesiske innenlandske brikker, helt uten Nvidia-maskinvare.
Hvorfor Nvidia-aksjen fortsetter å stige
Trusselen er reell, men tallene forklarer roen. Nvidia-aksjen steg nesten 2 % 30. juni, nær en verdi på $ 4,8 billioner. Nvidias siste resultater viste at inntektene fra datasenter økte med 75 % til rekordhøye $ 62,3 milliarder på ett kvartal.
Mesteparten av presset ligger på inference, ikke trening. Nvidia dominerer fortsatt modelltrening, der deres CUDA-programvare har bundet til seg utviklere siden 2006. Egendesignede brikker matcher sjelden den fleksibiliteten.
Nvidia forsvarer også inference-laget de anklages for å tape. På GTC sa Nvidia at deres kommende Rubin-plattform kutter inference-kostnadene per token med opptil 10 ganger sammenlignet med Blackwell. Billigere inference gir også som regel økt bruk og total datakraft.
Ikke alle er overbevist. Noen investorer har rotert til konkurrerende brikkeaksjer, i tro på at inference-skiftet skal styrke over tid. Likevel har Nvidia lagt til grunn dette kvartalet uten å ta med salg til Kina, og ser fortsatt rekordetterspørsel.
Nvidia selger fortsatt hver brikke de klarer å lage. Den virkelige testen er om deres største kunder klarer å kutte Nvidia ut raskere enn markedet vokser.









