Nieuws

pinokkio

Big data liegt! En hoe je dat kan voorkomen

Big data is voor veel organisaties een soort orakel van Delphi geworden. De bron voor alles wat je altijd al wilde weten. Maar net als met alle orakels moet je weten hoe je de informatie moet interpreteren om niet op het verkeerde been te worden gezet.

In de whitepaper How Big Data Can Lie zet Information Builders de ‘leugens’ van big data op een rij. Er zijn verschillende redenen waarom de informatie verkregen uit de analyse van big dat niet altijd even betrouwbaar is. Een van de voornaamste oorzaken is de snelheid waarmee een enorme hoeveelheid informatie wordt vergaard en verwerkt.

Zwangere mannen

Dit kan leiden tot een groot aantal onzorgvuldigheden en fouten. Deze fouten kunnen een enorme impact hebben, zeker wanneer de incorrecte informatie wordt gebruikt als basis voor maatregelen. Waar een tikfout toe kan leiden, bleek eerder in het Verenigd Koninkrijk. Incorrecte invoer van data zorgde ervoor dat volgens de bestanden van de nationale gezondheidsdienst NHS 20.000 mannen zwanger waren.

Proactief handelen

Alleen een volledig geautomatiseerd systeem van data quality management kan deze problemen voorkomen, stelt Information Builders. Organisaties moeten proactief zorgen dat hun data betrouwbaar is. Vervuilde data moet worden geëlimineerd voordat het andere databases kan aantasten.

Vergissingen over het hoofd gezien

Ook de omvang van big data werkt fouten in de hand. Hoe meer data, hoe groter de kans dat een analist een vergissing over het hoofd ziet, waarschuwt Information Builders. Het is onmogelijk om handmatig door de gegevens heen te gaan en fouten te detecteren en te corrigeren. Ook hier moet automatisering de oplossing bieden.

Deel dit bericht via: