Wat zijn "data"?

Wat zijn data?

Bron: Fragment uit het boek "Uit het hoofd, een geschiedenis van de menselijke intelligentie.. Koop het boek via deze link https://www.booksandbags.be/booksandbags/product/11.
Het historische artikel "As we may think", Vannevar Bush
‘Denk aan een toekomstig apparaat… waarin een individu al zijn boeken, verslagen en mededelingen opslaat, en dat gemechaniseerd is, zodat het kan worden geraadpleegd met een buitengewone snelheid en flexibiliteit. Het vormt een vergrote intieme aanvulling op zijn geheugen.’

– Vannevar Bush, As We May Think, 1945 

Data gaat over het vastleggen en bewaren van "gegevens"; Culturele uitingen deden zich al vanaf de prehistorie voor in de vorm van geschreven, geschilderde, gekerfde of gebeeldhouwde artefacten. Naast gereedschappen bedacht de mens sinds de prehistorie eveneens geheugenapparaten, of mnemotechnische gereedschappen. Het schrift geldt als een soort geheugenapparaat, maar ook de boekdrukkunst, het wereldwijde web en zelfs digitalisering.

Al die geheugenapparaten stellen de mens in staat om kennis en ruwe data voor langere tijd ‘uit het hoofd’ te bewaren en uitwisseling en verspreiding van kennis en vaardigheden mogelijk te maken en te versnellen. 

René Magritte, "La trahison de images"  (Bron: https://www.museumtv.art/)

Data: waarneembare registraties

Net zoals bij het concept ‘intelligentie’ is het niet eenvoudig om een pasklare definitie voor het begrip ‘data’ of ‘gegevens’ te geven. Gegevens vormen een (op de een of andere manier) waarneembare registratie van ‘feiten’ of ‘abstracte concepten’ op een ander medium. Het schilderij La trahison des images(Het verraad van de voorstelling) van René Magritte is beter bekend onder de naam Ceci n'est pas une pipe. Magritte gebruikte een woordspelletje dat een perfecte definitie biedt voor ons concept van ‘data’. Het gaat inderdaad niet om een pijp, maar om een voorstelling van een pijp. De pijp zelf is het levensechte object, maar een schilderij van een pijp is data.Natuurlijk moeten data geen voorstelling zijn van echte objecten. Je kan immers ook de temperatuur registreren in de vorm van een reeks getallen en die temperatuur kan je niet ‘vastpakken’, hooguit voelen. 

De opslag van data gebeurt op zo’n manier dat die in veel gevallen voor lange termijn kan worden bewaard en het verspreiding en uitwisseling ervan mogelijk maakt. Mijn studenten, en ze zijn daar lang niet de enigen in, raken weleens verward in het onderscheid tussen ‘ruwe data’, ‘informatie’ en ‘kennis’. Op zich is dat niet vreemd, want in de dagelijkse omgang gebruiken we die begrippen heel vaak door elkaar. 

Van data tot kennis tot informatie

Data of gegevens in hun ruwe vorm vormen nog niet meteen bruikbare kennis. Kennis ontstaat pas wanneer we de data verwerken en in hun ruimere context zien. Een ‘woord’ dat je intypt op het toetsenbord van je computer, een gebeurtenis die zich nu voordoet in een buitenlands conflict, de geur van spaghetti die uit de keuken komt… zijn allemaal vormen van ruwe data. Een foto van je grootvader uit de Tweede Wereldoorlog is dat eveneens. Maar al die gegevens leiden niet automatisch tot kennis. Een kind dat nog nooit heeft geleerd over de Tweede Wereldoorlog zal van die foto weinig ‘leren’, net zoals de geur van spaghetti weinig connotaties oproept voor een lid van de Pirahastam. Verkeersborden en de bijhorende kleuren en pictogrammen zijn ruwe data, maar krijgen pas betekenis in een levensechte verkeerssituatie. 

Verschijningsvormen van data

Data kan voorkomen in diverse verschijningsvormen. Een foto vormt een afgesloten pakket data (discrete data), maar een geluidsopname of film een continue stroom aan gegevens. Een waardeoordeel (of vooroordeel) over iets vellen, is een kwalitatieve vorm van data. Als je een andere Facebookgebruiker de huid vol scheldt, dan vormt jouw getypte bericht eveneens een afgesloten pakketje gegevens. Je kan data ook indelen in categorieën of structuren. Een boomstructuur is hiervan een bekend voorbeeld. Een volledig overzicht van alle door mensen bedachte geheugenapparaten zou al snel tot een encyclopedisch overzicht leiden. 

In de technologische geschiedenis bedacht de mens diverse technieken om data te  onthouden; registreren; bewaren voor langere termijn; structureren en organiseren; indexeren; verkleinen; verzenden over grotere afstanden; delen; …

"Data as stored memories", Afbeelding gegenereerd door AI. Copyright: Kris Merckx
Volgende pagina

Databanken