ENGLISH
Categoriseren van Leveranciers & ChatGPT

Categoriseren: de basis voor een spend analyse

Waarom leveranciers categoriseren?

Een gedegen leveranciers categorisering is de sleutel tot het verkrijgen van waardevolle inzichten en het optimaliseren van je spend analyse.

De vijf cruciale redenen waarom een gedegen leverancierscategorisering de basis vormt voor een succesvolle spend analyse zijn:

  • Inzicht in uitgavenpatronen
  • Identificatie van leveranciers afhankelijkheid
  • Versterking van onderhandelingspositie
  • Risicobeheer toeleveringsketen
  • Prestatiebeoordeling en leveranciersmanagement

Hoe goed is ChatGPT in categoriseren?

ChatGPT maakt aan de achterkant gebruik van verschillende large Language Models. Om vast te kunnen stellen hoe goed leveranciers gecategoriseerd kunnen worden hebben we de resultaten van de gratis versie (die werkt mer GPT-3.5Turbo) vergeleken met het model wat alleen toegankelijk is met de betaalde versie (die werkt ook met GTP-4). GPT-4 is hierbij het meest geavanceerde model.

Bij onze experimenten in 2022 hebben we veelbelovende resultaten behaald bij het gebruik van GPT-3 om leveranciers te categoriseren. Door gebruik te maken van de krachtige API die OpenAI beschikbaar stelt aan ontwikkelaars, kunnen we rechtstreeks communiceren met de verschillende geavanceerde taalmodellen die OpenAI biedt.

Om te bepalen of het nieuwste en meest geavanceerde model, GPT-4, betere resultaten behaalt dan GPT-3.5 Turbo, hebben we de handschoen zelf opgepakt. We hebben een test uitgevoerd waarbij we onze vooraf gedefinieerde lijst van leveranciers meerdere keren hebben voorgelegd aan zowel GPT-3.5 Turbo als GPT-4 en gevraagd om deze naar eigen inzicht te categoriseren.

Resultaat onderzoek

We hebben de uitvoer van de modellen vergeleken met de classificaties die we op het internet hebben gevonden, om te bepalen in welke mate deze overeen komen.

De resultaten tonen een verschil tussen GPT-3 Turbo en GPT-4. GPT-4 scoort beter dan GPT-3.5 Turbo. Bij GPT-4 is circa 70% van de symilarity score hoger dan 0,5. Bij GPT-3.5 Turbo ligt dat percentage op 60%. Voor een goede en bruikbare categorisering moet de score boven de 0,5 liggen. De categorie kan een afwijkende naam hebben maar klopt dan wel . Een score onder 0,5 betekent dat de categorie onjuist is of onbekend.

Supplier Classification Analysis: A Comparative Study of GPT-3.5 and GPT-4 for Procurement:

Wat betekent dit resultaat?

Op basis van het resultaat uit dit onderzoek kunnen we concluderen dat bij het gebruik van GPT-4 er minder leveranciers foutief geclassificeerd worden dan in het geval van GPT-3.5 Turbo. Door de categorieën gegenereerd door GPT4 toe te voegen aan de spend data is de basis voor een spend analyse al snel gelegd. Voor beide modellen geldt dat de categorieën met een score lager dan 0,5 handmatig moeten worden geclassificeerd.

Wilt u meer weten hoe het categoriseren met behulp van GPT4 plaats vindt, of heeft u een lijst met leveranciers die u wilt categoriseren met behulp van GPT-4, neem dan contact met ons op. Wij helpen u graag verder.