OpenAI en Broadcom introduceren AI-inferentiechip ‘Jalapeño’


Key takeaways

  • OpenAI en Broadcom hebben ‘Jalapeño’ gelanceerd, een chip die de snelheid en kosten van LLM-inferentie optimaliseert.
  • De op maat gemaakte hardwarearchitectuur maximaliseert de energie-efficiëntie door gegevensverplaatsing tot een minimum te beperken.
  • AI-modellen hebben de ontwerpcyclus van de chip versneld, waardoor de chip binnen negen maanden in productie kon worden genomen.

OpenAI en Broadcom hebben ‘Jalapeño’ geïntroduceerd, een gespecialiseerde processor die de inferentie van grote taalmodellen (LLM’s) optimaliseert. De chip vormt de eerste stap in een langetermijnstrategie voor meerdere generaties hardware, gericht op het verbeteren van de snelheid, betrouwbaarheid en betaalbaarheid van geavanceerde artificiële intelligentie.

Het project is een samenwerkingsverband waarbij de expertise van Broadcom op het gebied van halfgeleiders en netwerken wordt gecombineerd met de systeemintegratie- en productiecapaciteiten van Celestica.

Optimalisatie van energieverbruik

In tegenstelling tot versnellers voor algemeen gebruik is Jalapeño vanaf de basis ontworpen op basis van OpenAI’s interne gegevens over modelkernels, dienstensystemen en geheugenvereisten. De architectuur is ontworpen om gegevensverplaatsing tot een minimum te beperken en een evenwicht te vinden tussen netwerk- en rekenbronnen, waardoor de hardware dichter bij zijn theoretische maximale prestaties kan opereren.

Hoewel de definitieve benchmarks nog moeten worden uitgevoerd, wijzen voorlopige tests erop dat de chip een aanzienlijk betere energie-efficiëntie biedt dan de huidige industrienormen. De hardware wordt momenteel al getest in laboratoriumomgevingen met complexe workloads, waaronder GPT-5.3-Codex-Spark.

Volledige controle over technische stack

Dit initiatief staat centraal in het doel van OpenAI om de volledige technische stack onder eigen beheer te houden. Door de onderliggende infrastructuur te ontwerpen – van de silicium- en geheugensystemen tot de plannings- en implementatielagen – kan het bedrijf ervoor zorgen dat elke component is afgestemd op maximale efficiëntie.

Greg Brockman, president van OpenAI, merkte op dat die strategie bedoeld is om rekenkracht overvloediger beschikbaar te maken, waardoor de kosten voor bedrijven en particulieren dalen en tegelijkertijd complexere mondiale problemen kunnen worden opgelost.

Ontwikkeling

Het ontwikkelingsproces voor Jalapeño verliep opmerkelijk snel. In slechts negen maanden tijd werd het project van het eerste concept tot de tape-out voor productie gebracht. Die prestatie werd mogelijk gemaakt door een nauwe integratie van software en hardware en het onconventionele gebruik van OpenAI’s eigen modellen om de ontwerpfase en optimalisatie van de chip te versnellen.

Dit creëert een zichzelf versterkende cyclus waarin AI wordt gebruikt om juist die infrastructuur te bouwen die toekomstige, nog krachtigere versies van de technologie zal aandrijven.

Schaalvergroting van AI-infrastructuur

Voor de toekomst vormt de chip de eerste fase van een breder hardwareplatform. In samenwerking met Microsoft en anderen zijn OpenAI en Broadcom van plan om vanaf 2026 datacenters op gigawatt-schaal in gebruik te nemen.

Het uiteindelijke doel is om AI te democratiseren door de kosten en latentie van inferentie te verlagen, zodat tools zoals ChatGPT en de OpenAI API sneller en toegankelijker worden voor een wereldwijd publiek van onderzoekers, studenten en ondernemers.

(at)

Volg Business AM ook op Google Nieuws

Wil je toegang tot alle artikelen, geniet tijdelijk van onze promo en abonneer je hier!

Voeg businessam.be toe als preferred source op Google
Meer

Ontvang de Business AM nieuwsbrieven

De wereld verandert snel en voor je het weet, hol je achter de feiten aan. Wees mee met verandering, wees mee met Business AM. Schrijf je in op onze nieuwsbrieven en houd de vinger aan de pols.