Key takeaways
- DeepSeek bereikt prestatieniveaus die vergelijkbaar zijn met populaire chatbots zoals ChatGPT.
- Het V3-model van de startup werd getraind met minder dan $6 miljoen aan rekenkracht.
- DeepSeek daagt de Amerikaanse dominantie in AI-ontwikkeling uit met een goedkope doorbraak.
DeepSeek, een Chinese startup op het gebied van kunstmatige intelligentie, heeft een nieuw AI-model geïntroduceerd met de naam DeepSeek-V3-0324. Deze nieuwste versie van hun V3-model voor grote talen laat aanzienlijke prestatieverbeteringen zien op verschillende gebieden, met name op het gebied van redeneer- en codeercapaciteiten. Benchmarktests uitgevoerd op Hugging Face, een vooraanstaand platform voor AI-ontwikkeling, bevestigen deze verbeteringen.
De opkomst van DeepSeek heeft veel interesse gewekt in Silicon Valley. Het bedrijf zorgt voor opschudding doordat het prestatieniveaus lijkt te bereiken die vergelijkbaar zijn met die van populaire chatbots zoals ChatGPT, terwijl de ontwikkelingskosten aanzienlijk lager zijn. DeepSeek meldt dat zijn V3-model werd getraind met minder dan 5,55 euro miljoen aan rekenkracht van 2.000 Nvidia H800-chips, waarmee een prestatieniveau werd bereikt dat vergelijkbaar is met toonaangevende modellen ontwikkeld door OpenAI en Meta.
Doorbraak in AI-ontwikkeling
Deze doorbraak weerlegt de heersende opvatting dat Amerikaanse techgiganten enorme investeringen in geavanceerde hardware en datacenters nodig hebben om voorop te blijven lopen in de ontwikkeling van AI. Het succes van DeepSeek dient als een belangrijke mijlpaal in de voortdurende strijd tussen de Verenigde Staten en China om de dominantie op het gebied van kunstmatige intelligentie, wat mogelijk een verschuiving in het machtsevenwicht betekent.
Wil je toegang tot alle artikelen, geniet tijdelijk van onze promo en abonneer je hier!