DeepSeek AI Model V3.1: Geoptimaliseerd voor Chinese chips en kosteneffectieve inferentie


Key takeaways

  • DeepSeek-V3.1 optimaliseert de prestaties voor chips die in China worden gemaakt en sluit daarmee aan bij de inspanningen van China om zijn binnenlandse halfgeleiderindustrie te ontwikkelen.
  • Het bijgewerkte model gebruikt een hybride inferentiestructuur, die zowel redeneermodi als niet-redeneermodi toestaat via een door de gebruiker instelbare ‘deep think’-knop.
  • DeepSeek blijft prioriteit geven aan de kosteneffectieve werking van AI door de introductie van het FP8-gegevensverwerkingsformaat voor efficiënt geheugengebruik en hogere verwerkingssnelheden.

DeepSeek, een Chinese AI-startup, heeft donderdag een verbeterde versie van zijn vlaggenschip, het V3-model, onthuld. De update richt zich op compatibiliteit met binnenlands geproduceerde chips, waarmee DeepSeeks AI-modellen mogelijk op één lijn worden gebracht met China’s inspanningen om zijn eigen halfgeleider-ecosysteem te ontwikkelen. De stap komt op een moment van toenemende spanningen tussen de VS en China, waarbij Washington beperkingen oplegt aan de export van technologie.

Vorige verbeteringen 

Eerder dit jaar trok DeepSeek de aandacht met het uitbrengen van AI-modellen die Westerse tegenhangers zoals OpenAI’s ChatGPT evenaarden, terwijl ze kosteneffectiever waren. Deze nieuwste V3-update volgt op eerdere verbeteringen aan de kernmodellen, waaronder een update voor het R1-model in mei en een eerdere V3-verbetering in maart.

DeepSeek heeft de optimalisatie van het UE8M0 FP8 precisieformaat van zijn DeepSeek-V3.1 model benadrukt voor compatibiliteit met komende chips van Chinese makelij. Hoewel specifieke chipfabrikanten of modellen niet bekend zijn gemaakt, stelt het FP8 dataverwerkingsformaat AI in staat om efficiënter te werken door het geheugengebruik te verminderen en de verwerkingssnelheden te versnellen in vergelijking met traditionele methoden.

Hybride inferentiestructuur

DeepSeek-V3.1 introduceert een hybride inferentiestructuur, waardoor het kan werken in zowel beredeneerde als niet-beredeneerde modi. Gebruikers kunnen van de ene modus naar de andere overschakelen met behulp van een “diep denken”-knop die toegankelijk is op de toepassing en het webplatform van het bedrijf, die nu zijn bijgewerkt met versie V3.1.

DeepSeek heeft ook prijsaanpassingen aangekondigd voor zijn API, met ingang van 6 september. Deze wijzigingen zullen van invloed zijn op ontwikkelaars die de AI-modellen van DeepSeek integreren in hun eigen toepassingen en webproducten.

Wil je toegang tot alle artikelen, geniet tijdelijk van onze promo en abonneer je hier!

Meer

Ontvang de Business AM nieuwsbrieven

De wereld verandert snel en voor je het weet, hol je achter de feiten aan. Wees mee met verandering, wees mee met Business AM. Schrijf je in op onze nieuwsbrieven en houd de vinger aan de pols.