Groter is niet altijd beter: ook Microsoft lanceert ‘mini-AI’-model

Steeds meer techbedrijven produceren ‘light’-versies van hun AI-modellen. Nu springt ook Microsoft op de kar met een mini-AI, Phi-3.

Waarom is dit belangrijk?

Kleinere artificiële intelligentie-modellen doen hun intrede als downloadbare programma's op smartphones of laptops. Ze nemen minder plaats in en zijn ontworpen met een specifiek doel. Het maakt het dagelijks gebruik van AI makkelijker.

In het nieuws: Phi-3 Mini wordt het eerste van die kleinere AI-modellen die Microsoft lanceert.

  • Volgens Eric Boyd, vice-directeur bij Azure, het AI-platform van Microsoft, zal Phi-3 Mini “even krachtig zijn als Large Language Models zoals ChatGPT-3.5 (de huidige gratis versie van ChatGPT, red.), maar in een kleiner formaat”, zo verklaart hij tegenover The Verge.
  • Naast Mini komen er ook Small- en Medium-modellen. Elk model heeft een verschillend aantal ‘parameters’, die geven aan hoeveel complexe instructies het aankan. Voor de miniversie is dat relatief beperkt tot 3,8 miljard parameters. Phi-3 Mini is beschikbaar om te downloaden via Azure, Hugging Face en Ollama.
  • De Phi-modellen werden samengesteld met een bepaald “curriculum”, aldus Boyd. Zo werden ze getraind om kinderverhalen te produceren. “Er zijn niet genoeg kinderboeken, dus we hebben een lijst van meer dan 3000 woorden genomen en een LLM gevraagd om ‘kinderboeken’ te maken om te leren aan Phi.”

Ingezoomd: Waarom brengen techbedrijven juist kleinere AI-modellen op de markt?

  • Boyd meent dat kleinere modellen zoals Phi-3 beter werken voor specifieke toepassingen voor bedrijven omdat hun interne datasets toch kleiner zijn. En ze zijn vaak ook betaalbaarder, omdat deze modellen minder rekenkracht gebruiken.
  • Andere bedrijven gingen Microsoft voor. Google lanceerde Gemma, een afgeslankte versie van Gemini. Ook Meta kwam met een kleine versie van zijn model Llama en Claude 3 Haiku kan dan weer snel wetenschappelijke documenten samenvatten.
  • Zo diversifiëren techbedrijven hun AI-modellen, en wordt de perceptie dat AI log en zwaar is, weggewerkt. De toegankelijkheid vergroot, omdat je als eindgebruiker weet waar je een bepaald AI-model voor kunt gebruiken.
Meer