Logo

Data en AI in een analytische wereld

| 28 juni 2018 | Overige

Kunstmatige intelligentie (AI) is lange tijd beperkt gebleven tot de laboratoria van universiteiten. Ontwikkeling van connectiviteit en rekenkracht heeft geleid tot een keerpunt waardoor het mogelijk is om algoritmes op grote schaal en lokaal toe te passen. Het maakt nieuwe toepassingen mogelijk. Sommige van die toepassingen vervangen bestaande omdat ze een verbetering zijn, maar AI vervangt niet alle toepassingen.

Illustratie bij het artikel Data and AI in een analytische wereld

De verwachtingen van wat AI gaat brengen zijn overspannen. Een lezenswaardig niet-technisch artikel over de ontwikkelingssnelheid van de mogelijkheden van AI is The seven deadly sins of AI predictions. Desondanks is een veelgehoorde en hardnekkige mening dat Business Intelligence (BI) overbodig gemaakt wordt door AI. Of dat AI meer waarde genereert dan BI ooit gedaan heeft. Een mening die vooral wordt verkondigd door mensen zonder data science vaardigheden.

Toepassen van inzichten gebaseerd op algoritmes verschilt sterk van hoe we dat doen op basis van dashboards. Ik verwijs naar mijn complexiteit van informatieprojecten artikelenserie voor meer achtergrond in de verschillende soorten toepassing van informatie en de voorwaarden die dit oplegt aan governance.

De mechanica achter werken met data ontgaat veel mensen. Iedereen heeft recht op een eigen opinie, maar als je beslissingen gaat nemen op basis van misvattingen kan dat tot schade leiden voor de organisatie waar je voor werkt. In deze lijst stel ik een aantal aannames ter discussie, die in mijn beleving voortkomen uit het onbegrip over de mechanica:

  • Data is geen glitter. En het is ook geen olie. Data is niets anders dan de vastlegging van door mensen geïnitieerde activiteiten. Om de beperkingen daarvan te begrijpen geeft het artikel training computers to understand humanity je meer context.
  • Je kan bruikbare informatie vinden in data, maar dat is de diamant tussen het stof. Meer data leidt niet tot meer inzicht. Meer data betekent dat je meer moet graven en meer stof moet zeven en dat diamanten lastiger te vinden zijn.
  • Weten waar je naar zoekt en wat je moet verzamelen vergroot je kansen om diamanten te vinden. Dat is wellicht de enige vergelijking met olie die opgaat: investeren in zoeken naar vindplaatsen levert meer rendement dan lukraak boren.
  • Wat je niet weet kan je niet voorspellen of vergelijken met wat je wel weet. Je moet data verzamelen over wat je niet weet om gedrag af te kunnen leiden of gedrag te classificeren met behulp van algoritmes. Dat is geen toeval of geluk en ook geen kwestie van lukraak data verzamelen. Je moet je bewust zijn van wat je niet weet om te zoeken naar data die het gat opvult.
  • Als je het oorzakelijk verband kent zullen algoritmes geen nieuw licht op die relatie werpen. Statistiek is een hulpmiddel om het bestaan van een hypothetische relatie te bewijzen of te verwerpen. Positieve of negatieve uitslag is even waardevol in die zoektocht. Meer van dezelfde soort data zal het statistisch bewijs niet verbeteren boven een bepaalde drempelwaarde, maar het toevoegen van additionele ondersteunende of tegensprekende data wel. Daarvoor moet je wel getraind zijn in statistiek. Het percentage mensen met gevoel voor statistiek is niet proportioneel gegroeid met de beschikbaarheid van AI.

Voorspellende modellen gebruiken dezelfde data als BI-oplossingen. Het doelvan wat je met de informatie wilt doen is anders.

Er is geen hiërarchie van doelen, het één is niet van meerwaarde boven het andere. Beide brengen waarde, onder voorwaarde dat een organisatie in staat is om adequaat de toepassing van inzichten voor het beoogde doel te sturen. Hier valt nog veel te verbeteren. De worsteling met ‘digitalisatie’ van organisaties draait om governance uitdagingen en niet om de toepassing van technologie.




Reacties via Twitter @MartijntenNapel of e-mail reacties@preachwhatyoupractice.nl