Key Takeaways
- De efficiëntie manier waarop DeepSeek een AI-tool heeft ontwikkeld, heeft tot discussie geleid binnen de industrie.
- Analisten van SemiAnalysis schatten dat de hardware-uitgaven van DeepSeek meer dan 500 miljoen dollar bedragen.
- De chatbot van het Chinese bedrijf laat zien dat prestaties niet alleen afhankelijk zijn van hardware-investeringen.
De efficiëntie manier waarop DeepSeek een AI-tool heeft ontwikkeld, heeft tot discussie geleid binnen de industrie. Hoewel de Chinese startup beweert dat haar grote taalmodel DeepSeek-V3 is getraind met behulp van slechts 2,8 miljoen GPU-uren (Grafische Processor Unit) tegen een kostprijs van 5,6 miljoen dollar, staat dit cijfer in schril contrast met de miljarden die Amerikaanse techgiganten aan soortgelijke projecten hebben besteed.
Speculaties over ware omvang investeringen
Het succes van DeepSeek heeft speculaties aangewakkerd over de ware omvang van hun investering. Documenten onthullen dat het moederbedrijf, hedgefonds High-Flyer Quant, een aanzienlijke computerinfrastructuur heeft opgebouwd. In 2019 investeerde Liang Wenfeng, oprichter van zowel High-Flyer als DeepSeek, zwaar in GPU’s voor algoritmische handel. De website van High-Flyer belicht de ontwikkeling van Fire-Flyer 2, een supercomputercluster die 1.550 petaflops (eenheid die verwerkingssnelheid van computer meet)kan bereiken, vergelijkbaar met enkele van ’s werelds krachtigste supercomputers.
Analisten van SemiAnalysis schatten dat de hardware-uitgaven van DeepSeek meer dan 500 miljoen dollar bedragen, als we de kosten voor onderzoek en ontwikkeling naast de totale eigendomskosten in beschouwing nemen. Hun projecties suggereren zelfs een potentiële serveruitgave van 1,6 miljard dollar, inclusief 944 miljoen dollar voor operationele kosten in verband met rekenclusters.
Prestaties niet alleen afhankelijk van hardware
Ondanks de verschillende cijfers over de uitgaven van DeepSeek, zijn de software-innovaties onmiskenbaar. De modellen van het bedrijf laten zien dat prestaties niet alleen afhankelijk zijn van hardware-investeringen. Analisten van Morgan Stanley erkennen dit punt en stellen dat de output van DeepSeek dient als een game changer, die AI-toepassingen ondersteunt die op hun modellen zijn gebouwd. Analist Tilly Zhang van Gavekal benadrukt dat de race om het leiderschap in AI nu meer omvat dan alleen toegang tot geavanceerde chips; het vereist het vermogen om ze effectief te gebruiken.
Wil je toegang tot alle artikelen, geniet tijdelijk van onze promo en abonneer je hier!