Logo

De rol van context, de bron van alle complexiteit (4/5)

De vraag wat BI, of analytics, onderscheidt van andersoortig gebruik van data heeft me altijd beziggehouden. Ik denk dat ik inmiddels de vraag vrij simpel kan beantwoorden: we gaan anders met context om.

Data wordt gebruikt om inzicht te verwerven in waar we staan met onze organisatie, hoe soepel of stroef de bedrijfsprocessen verlopen, welke kansen en bedreigingen op de organisatie af komen. Het inzicht ontstaat door de verzamelde data te analyseren en te interpreteren en over de uitkomst van die interpretatie met elkaar in discussie te gaan om de ‘wat moeten we doen?’ vraag te beantwoorden.

Illustratie bij dit artikel

Het probleem is dat niet iedereen de gegevens op dezelfde manier interpreteert omdat hun persoonlijke context anders is. De grote uitdaging van BI en analytics projecten is het expliciet maken van de gedeelde context, zodat de informatie met de interpretatie wordt gedistribueerd.

Het proces van tot overeenstemming komen van interpretatie en die uit te drukken in een gedeelde context, zorgt voor veel verwarring en vertraging in projecten. Dat betekent dat je goed moet nadenken over hoe om te gaan met context. Er zijn drie onderwerpen waar een beslissingen over hoe met context om te gaan een rol speelt:

  1. Het verschil in context waarin informatie wordt geproduceerd en waarin informatie wordt geïnterpreteerd.
  2. De distributiegraad van informatie.
  3. De informatie levenscyclus: hoe en waarvoor informatie wordt gebruikt verandert in de tijd.

Deze drie onderwerpen bespreek ik kort in relatie tot de vijf gebruikspatronen.

Het verschil tussen context van bedrijfsproces en context van interpretatie

De context van interpretatie verandert sneller dan de context van het bedrijfsproces. Eenvoudig gezegd, wat je denkt dat de informatie uit een dwarsdoorsnede van je bedrijfsprocessen voor je betekent verandert op moment dat bedrijfsdoelstellingen aangepast worden, terwijl het bedrijfsproces hetzelfde blijft. In BI spreken we vaak van één versie van de feiten (informatie in de context van het bedrijfsproces) en de verschillende standpunten daarop (informatie in de context van interpretatie).

Deze twee contexten wil je gescheiden houden in je oplossingen, zodat de verandering van interpretatie beperkte impact heeft. Door hiervoor te ontwerpen voorkom je vertraging in het doorvoeren van wijzigingen.

Binnen de gebruikspatronen wordt anders met context omgegaan:

  • Toezicht houden — Informatie betreft de executie van het bedrijfsproces zelf. De context van interpretatie is die van het bedrijfsproces zelf en daarmee is informatie vaak beperkt tot de feiten.
  • Verantwoordingsinformatie — De context van interpretatie is formeel vastgesteld en een breed gedragen. Context wordt gemodelleerd in de informatieoplossingen en wordt met de feiten gedistribueerd.
  • Analyse — Analyse is vooral onderzoek naar de validiteit van de overeengekomen interpretatie. In analyse vindt uitbreiding van de context plaats door (externe) referentiedata toe te voegen. De feiten worden in een breder perspectief geplaatst en de interpretatie heroverwogen.
  • Voorspelling — Feit informatie wordt gecombineerd met gedragsinformatie van actoren, zoals klanten, leveranciers, medewerkers, bezoekers van een website of fysieke machines gebruikt in een productieproces. De interpretatie is het maken van het voorspelmodel zelf. De uitkomsten van het voorspelmodel wordt gevalideerd tegen de feiten en kwaliteit van interpretatie wordt met statistische onzekerheid aangeduid.
  • Dataonderzoek — De feiten worden op allerlei mogelijk manieren in verschillende contexten geplaatst, op zoek naar nieuwe inzichten. Dataonderzoek is vaak eigenlijk contextonderzoek. Het is de opmaat tot definiëren van een (nieuwe) gezamenlijke gedeelde interpretatie van de feiten.

De implicatie is dat je niet op één universele manier informatie met context kan aanbieden. Het verschil in mate van flexibiliteit hoe met context om te gaan zorgt voor tegenstrijdige eisen aan de oplossingen die deze ondersteunen. Een oorzaak van vertraging in projecten is dat dit niet op tijd onderkent wordt of oplossingen niet expliciet hiervoor ontworpen worden.

De distributiegraad van informatie

Hoe groter het bereik van informatie is, hoe eenduidiger deze moet zijn. Wat is eenduidigheid? Het is het expliciet maken van de context van interpretatie zodat de kans groter is dat iedere gebruiker dezelfde interpretatie heeft. Althans, dat is wat je probeert te bereiken. Je probeert toe te werken naar het moment dat informatie zelf-verklarend is voor de doelgroep.

Grafische weergave van distributiegraad van informatie

Het principe is simpel: als ik het rapport maak, dan weet ik wat ik gedaan heb en voor welke gebruikscontext ik het rapport maak. Als ik het rapport aan een collega geef en mijn collega heeft een vraag, dan zullen ze die aan mij stellen. Hoe groter dat afstand, des te kleiner de kans dat ik weet waar het rapport vandaan komt en aan wie ik een vraag moet stellen.

De relatie met de gebruikspatronen is complex, de distributiegraad speelt altijd wel een rol. De doorlooptijd van een project wordt inherent langer wordt naarmate de distributiegraad groter is. Het eenduidig maken van informatie is een traag proces waar veel communicatie en toetsing nodig is.

De informatielevenscyclus

Gebruik van dezelfde informatie verandert in de tijd. Een simpel voorbeeld: vanuit data exploratie wordt nuttige informatie gemaakt die voor een grotere groep mensen waarde heeft en die op gezette tijden geproduceerd moet worden. Op een gegeven moment wordt besloten dat de informatie wordt toegevoegd aan een dashboard.

Het gebruikspatroon waarbinnen de informatie valt verandert omdat het interactiepatroon tussen informatieconsument en informatieproducent verandert. De verandering in gebruikspatroon leidt tot andere eisen aan de robuustheid van het productie- en distributieproces. De distributiegraad wordt hoger, waardoor de informatie eenduidiger opgeleverd moet worden voor de informatieconsumenten. Het gevolg is dat de technische middelen waarmee de informatie wordt geproduceerd geschikt moeten zijn voor de operationele lasten die passend zijn voor het gebruikspatroon van verantwoordingsinformatie.

De informatielevenscyclus is een ondergeschoven onderwerp in het informatielandschap. Organisaties zijn vaak niet bereid om te investeren in het herbouwen van informatie die al beschikbaar is gemaakt. In de loop van de tijd neemt de beheerlast toe en de doorlooptijd van veranderingen of nieuwe informatie wordt steeds langer omdat te veel informatie met de verkeerde middelen geproduceerd worden. De eenduidigheid van informatie wordt steeds lager omdat deze niet aangepast wordt aan het daadwerkelijke gebruik. Dit verlaagt de opbrengst van informatievalorisatie. De tegenmaatregel is simpel: denk van op voorhand na over de criteria die je stelt onder welke voorwaarden informatie gedistribueerd mag worden, maar het handhaven hiervan is niet eenvoudig.Je kan me bereiken via