Missende data: identificeer en vul aan

Data stelt het management in staat betere beslissingen te nemen, helpt bij het signaleren van trends en kansen, bevordert data-driven actieplannen met een lager risico, en bevordert de efficiëntie en inzet van het personeel bij de uitvoering van kerntaken.
Het is een continu proces om binnen je bedrijf meer gegevens en data te verzamelen, processen af te stemmen en de data juist te interpreteren. Zo maak je op de lange termijn consistent betere beslissingen. In dit artikel bespreken we de verschillende soorten ontbrekende data, en hoe je die het beste kunt aanvullen.
Welke soorten ontbrekende data zijn er
Hieronder staan de verschillende soorten data 'gaps' uiteengezet door e-tailize. We zullen ze in detail bespreken en je tips geven om ze op te vullen.
1. Ontbrekende gegevens
Je organisatie verzamelt niet alle beschikbare informatie.
2. Ongelijkheid data
Het verschil tussen het belang dat het management aan een metriek of indicator toekent en het daadwerkelijke belang.
3. Onjuiste interpretatie van gegevens
Zoals beschreven in ons artikel over data geletterdheid kan het schadelijk zijn voor een bedrijf als de persoon die de gegevens analyseert niet de juiste kennis en vaardigheden heeft om de gegevens te interpreteren of op te schonen. Dit leidt tot het trekken van de verkeerde conclusie en mogelijk het nemen van een schadelijke besluit voor je bedrijf.
| Vanity Metric | Actionable Metric | |
| Gebruik | feel-good factor en algemene richting | kan worden gebruikt voor weloverwogen en werkbare zakelijke beslissingen |
| Indicatie van | de grootte van iets | individueel gedrag |
| Soorten | brutohoeveelheden | verhoudingen/ratio's en eenheidseconomie |
| Voorbeelden (er zijn er veel meer) | proefgebruikers
paginaweergaven sociale media "Likes'' e-mail abonnees leads in verkoop marketinguitgaven totaal geworven klanten maandelijks inkomen per klant |
converterende gebruikers
Conversiepercentage sociale media betrokkenheid/doorverwijzingen e-mail opt-in conversiepercentage cohortanalyse van de verkooptrechter rendement op marketinginvestering kosten voor klantenwerving (CAC) customer lifetime value (LTV) |
Waar het op neerkomt is dit: focus op de juiste actionable metric voor je economische motor en communiceer dit duidelijk met de organisatie.
3. Verkeerde interpretatie van de gegevens
De fout om gegevens verkeerd te interpreteren is snel gemaakt, vooral als er gegevens analfabetisme in je organisatie. Er zijn twee onderdelen nodig om tot een goede beslissing te komen op basis van gegevens:
1. Context en domeinkennis
Statistisch gezien zou een model kunnen zeggen dat de inkomsten zullen stijgen als je de prijs met 20% verlaagt. In werkelijkheid is dit niet zeker. Inzicht in het domein (markt, concurrentie, enz.) en de context is van cruciaal belang om de juiste beslissing te nemen. De context in dit geval is nog meer data. Daarbij kunnen de gegevens kwalitatief en kwantitatief zijn, en moeten ze relevant en up-to-date zijn.
2. Statistische competentie
De basis van statistische competentie wordt gevormd door je kennis van verwante concepten en je vermogen om kritisch te denken. De volgende concepten zijn essentieel om te beheersen:
Correlatie betekent niet causatie
Het feit dat twee dingen met elkaar samenhangen, betekent niet noodzakelijk dat het één het andere veroorzaakt. Bijvoorbeeld; de stelling: minder slaap zal leiden tot slechter presteren op je werk. Deze bewering kan juist zijn, maar we hebben bewijs nodig van goed uitgevoerd onderzoek om feitelijk te kunnen stellen dat er een causale relatie is tussen de twee variabelen.
Wat dit betekent voor je bedrijf, is dat je een hypothese moet vormen door te kijken naar waarschijnlijke causale relaties wanneer je gegevens analyseert. Daarna moet deze hypothese getest worden aan de hand van een A/B test of een onderzoek. Indien correct uitgevoerd, kun je de resultaten gebruiken om beslissingen mee te maken en te ondersteunen.
Sommige ondernemers geven de voorkeur aan een aanpak op basis van onderbuikgevoel. In onze ogen is onderbuikgevoel een prima manier om een hypothese te vormen, die je daarna kan testen. Aan de hand van de testresultaten kan je beslissen of de hypothese juist was. Dit neemt emotie en ego weg, en zal op de lange termijn het bedrijf ten goede komen.
Visualisaties interpreteren
Er zijn veel manieren om gegevens visueel weer te geven. Hier is een lijst van de modellen die handig zijn om te kennen. Een belangrijke visualisering die niet op die lijst staat is de cohortanalyse. Verder is het aan jou om de juiste schaal en rooilijn van de gegevens te kiezen, anders kan het misleidend zijn.
Patronen herkennen
Het vermogen om patronen te herkennen is afhankelijk van je ervaring met analytics, je vermogen om kritisch te denken, en de kennis van het domein.
Zoek uitschieters in de dataset en begrijp waarom die uitschieters er zijn, dit zal je hopelijk context geven over waarom de rest van de gegevenspunten geen uitschieters zijn. Zo herken je makkelijker patronen in de gegevens.
Bovendien zal inzicht in de achterliggende formules en de structuur van de dataset je helpen patronen te voorspellen of te herkennen.
De data 'schoonmaken'
Het is essentieel om een dataset schoon te maken en te filteren, dit zorgt ervoor dat je analyse wordt vertekend. Een voorbeeld van waar dit fout gaat is bijvoorbeeld bestellingen die jij zelf doet op je webwinkel. Als je die aankopen niet uit de dataset haalt, gebruik je een dataset die niet in overeenstemming is met je klantenbestand, en neem je beslissingen op basis van misleidende data.
Dit is slechts één voorbeeld van het niet correct "opschonen" van gegevens, hier volgen nog enkele voorbeelden:
- Duplicaten
- Fouten
- Ongewenste afwijkingen (een eenmalige waarde, die de rest van de gegevensverzameling vertekend)
- Ontbrekende gegevens
Door gegevens op te schonen zul je betere beslissingen nemen omdat de data dan geldig, nauwkeurig, volledig, consistent en uniform is.
Het dichten ontbrekende data op marketplaatsen
e-tailize is een softwareoplossing voor het beheren van marktplaatsen. Naast integratie leveren wij bruikbare statistieken op het gebied van concurrentie, markt, producten, advertenties en nog veel meer. Daarnaast bieden wij documentatie en tutorials aan zodat je het meest uit je data kan halen. Geïnteresseerd in data-analyse op marktplaatsen? Lees er meer over hier.