Logo

Informatie overvloed vraagt om curatief onderhoud

| 24 oktober 2019 | Overige

Bedrijven en overheidsorganisaties verzamelen grote hoeveelheden data om de informatiepositie van de organisatie te verbeteren. In ieder onderwerp dat besproken wordt komt data aan bod. 

Het begint te wringen. Investeringen in technologie zijn veel beloftes en laag rendement. Ik neem in de praktijk zelfs een regressie waar: nieuwe technologie en meer data verslechtert de informatiepositie. De verwarring wordt groter in plaats van dat helder is hoe een organisatie moet reageren op de informatie die het heeft.

Dit artikel verkent waarom de waarde van data vaak verkeerd ingeschat wordt door verkeerde verwachtingen van wat technologie brengt en wat we kunnen doen om informatie waardevol te laten zijn.

Springtij van informatie

We verzamelen meer informatie dan ooit tevoren. We plaatsen een sensor omdat het kan, doen bij ieder contact klanttevredenheidsonderzoek, analyseren iedere klik en iedere beweging op websites en hangen camera’s in winkels. We weten al lang dat mensen niet rationeel zijn en proberen beslissingen te beïnvloeden door informatie over gedrag te verzamelen.

De overvloed aan informatie heeft vooral de emotie vrijgelaten. Social media is geworden tot een echoput van ongenoegen en schone schijn. De filtering van al die emotie, door stafbureaus, door journalisten, door analysedesks van vermogensbeheerders en banken, door wetenschappers is verdrongen door de directe toegankelijkheid voor iedereen.

Informatie die bedrijfsmatig verzameld wordt voor besluitvorming is onderhevig aan hetzelfde fenomeen van menselijke emoties, maar we zien het veel minder sterk omdat we er een grotere afstand toe hebben.

Het is hoog tijd voor de evaluatie van de waarde van informatie. Oneindige hoeveelheden data verzamelen levert niet meer informatie op. Het levert minder informatie op, het beeld wordt verstoord door emoties, door tegengestelde signalen. Meer data is vaak meer ruis, waardoor het filteren van het signaal alleen maar ingewikkelder geworden is. Het is een springtij van emotionele prikkels geworden, de ruis overstemt de informatie waar we naar op zoek zijn.

Dan automatiseren we het toch?

Automatisering helpt beperkt. Door automatisering is meer data beschikbaar gekomen, maar de techniek om die enorme hoeveelheden data op waarde te schatten blijft achter. De hype rond AI is wellicht vooral een hype in de overtuiging of de hoop dat hiermee de filtering van emoties verregaand geautomatiseerd kan worden.

Maar helaas, zo werkt het niet. AI versterkt de emotie in veel gevallen. Bias in data is terug te vinden in bias van de uitkomsten van algoritmes.

Het algoritme geeft een uitkomst, maar een mens moet er iets mee doen. Waar een door mensen samengesteld verslag met duiding en aanbeveling komt, zal een computer geen duiding geven. AI wordt steeds beter in het verwerken van context, maar dat is gericht op het classificeren van informatie naar een waargenomen context die in de data opgeslagen is, niet naar een context van een vraagstelling.

De uitdaging van het verwerken van context

Er zijn verschillende soorten context die een rol spelen in het gebruik van informatie.

Allereerst is er de context over hoe informatie verzameld is. Waar komt de data vandaan? Met welk doel is deze verzameld? Wat is de betrouwbaarheid van de bron? Is er referentie informatie aanwezig waartegen de data beoordeeld kan worden?

Vervolgens is er de context van gebruik van de informatie. Wat is de vraag die we willen beantwoorden? Welke afleidingen, interpretaties en aannames hebben we gedaan om de informatie die we verzameld hebben te projecteren op onze vraagstelling?

Dat is waar het pijnpunt ligt: de interpretatie van informatie. Dit is waar we computers en algoritmes willen inzetten om de data te duiden, maar waar die algoritmes bijzonder botte instrumenten zijn. De mate van intelligentie in AI is zeer rudimentair en de progressie is langzaam. AI algoritmen zijn meesters in het herkennen van patronen en het husselen van de bouwstenen van die patronen tot nieuwe uitkomsten. Deep fake video is indrukwekkende techniek, maar is van een totaal andere categorie dan het interpreteren van data naar de context van de vraagstelling. Waarom blijft AI op dit gebied achter?

Antwoord geven op de vraag ‘wat gaan we nu doen op basis van deze informatie?’ is vaak niet eenduidig en vraagt om consensus. Computers kennen geen consensus. Consensusvorming is wat mensen tot mensen maakt. 

Op moment dat de consensus die we bereikt hebben herhaald en gedistribueerd moet worden als onderdeel van de informatie die we delen, proberen we deze te vangen in computerprogrammatuur: in datamodellen, in algoritmes, in transformaties die we programmeren in ETL tools of talen zoals Python of Scala.

Context en de kunst van voorspellen 

Voorspellende modellen zijn extrapolatie van waargenomen gedrag uit het verleden. Dat gedrag is nooit volledig gevangen in data, er zijn op voorhand keuzes gemaakt welk deel van het gedrag vastgelegd wordt. Los van de ethische vraag of het wel gewenst is dat het gedrag van een mens voor 100% vastgelegd wordt, is het niet zo dat 100% vastlegging leidt tot een betere voorspelling. 

De keuze wat je vastlegt, welke factoren leiden tot keuzes van mensen op beslismomenten zijn belangrijk. De rest is ruis. Je zal veel analyse moeten doen van de context waarin bepaald gedrag vertoond wordt, anders zal je nooit helder krijgen welke factoren dat zijn. Het werk van een data scientist is het helder krijgen van die context en wat er toe doet en wat niet.

Hoe bepaal je wat er toe doet? Dat is weer menselijke interpretatie en consensus over de uitkomsten van die (statistische) analyse. En hier zie je, ook in het bedrijfsleven, hetzelfde fenomeen ontstaan als op social media: de zichtbaarheid van de individuele mening over de uitkomst zorgt ervoor dat we krampachtig gaan proberen de kool en de geit te sparen, of dat eilandjes van meningen in een organisatie tegengestelde acties gaan uitvoeren.

Naar curatief onderhoud van informatie

Ik pleit voor het aanbrengen van schaarste in informatie. Schaarste stimuleert menselijke inventiviteit en creativiteit. Schaarste leidt tot oplossingen van problemen. Bij overvloed worden we onverschillig en murw. Zie het als snoeien van de vruchtbomen in je tuin om de productiviteit van de fruitboom op peil te houden.

Door bewust bezig te zijn met welke informatie er toe doet creëer je een focus op het verwijderen van de ruis. Dat betekent dat je actief bezig bent met de duiding en het initiatief teruglegt bij de mensen die gebruik maken van de informatie. Vertrouwen als tegengif tegen de illusie van controle met data. Dit wordt al lang gezegd, maar we doen het tegenovergestelde.

De data industrie zal het gewicht van het monster dat het gecreëerd heeft niet kunnen dragen. Daarmee schets ik niet een dystopie waarin de computer de mens bestiert. Het is veel simpeler: wij worden ongelukkig van de informatieoverload.

Samenvattend

Data is belangrijk voor iedere organisatie, de aandacht voor het onderwerp is terecht. Connectiviteit en goedkope rekenkracht in de Cloud heeft geleidt tot een structuurverandering in hoe wij bedrijfsprocessen organiseren en heeft de grenzen van een organisatie diffuus gemaakt.

De focus ligt, als gevolg van de versnelling van technologie impact en de resulterende beurswaarde van de FAANG bedrijven, op de acquisitie van informatiebronnen waar een bedrijf nog geen toegang toe had.

We komen in de volgende fase, de fase van curatief onderhoud op de informatiehuishouding van een organisatie om de slagkracht terug te krijgen die aan het wegebben is onder de golfvloed van data. Curatief onderhoud betekent dat organisatie actief moeten organiseren dat men:

  • Terughoudend wordt in het vasthouden van allerhande verzamelde data om de resulterende mist rond oordeelsvorming te voorkomen.
  • Meer aandacht heeft voor context van gebruik en minder voor definities van data.
  • Expliciet maakt hoe oordeelsvorming tot stand komt, zodat de eisen aan de informatie die besluiten voedt helder worden.


Je kan me bereiken via