Historie datavisualisatie (Doreen)

Posted on 31 augustus 2011

0


De geschiedenis van data visualisatie in vogelvlucht

By nique
Published: October 31, 2008Posted in: @ HighlightsData en visualisatieTheorieTags:

Dit artikel is een kort overzicht van een paar hoogtepunten uit de geschiedenis. Het is een samenvatting van alle artikelen die al eerder door mij gepubliceerd zijn op deze blog. En is bedoeld als een summier maar compleet overzicht met onderstaande conclusie als resultaat:

Conclusie

Wanneer je de ontwikkelingen in datavisualisatie vergelijkt met die van de maatschappij zie je dat er vooral grote ontwikkelingen op het gebied van data visualisatie plaats vonden vlak na grote overgangen in de maatschappij.
Vlak na het industriële tijdperk bijvoorbeeld, eind 18e – begin 19e eeuw, was er een enorme opbloei van data visualisatie.
En sinds het post-industriële tijdperk de opkomst van de personal computer (In 1983 introduceerde IBM zijn eerste Personal Computer in Nederland.) zie je een toename de verschillende visualisatie technieken (wordclouds, treemaps, spreadplots).
Vandaag de dag volgen zowel de technologische als maatschappelijk ontwikkelingen elkaar in hoog tempo op. Computers worden steeds sneller, hebben steeds meer rekenkracht om ingewikkelde berekeningen uit te voeren. Het delen van informatie, het participeren hierin, rijke internet applicaties is steeds meer een gemeengoed. Het valt buiten de scope van mijn artikel om in te gaan op de huidige enorme technologische ontwikkeling maar het zal zeker van grote invloed zijn op de datavisualisatie en het presenteren van gegevens. Het is een goed moment om nu te gaan kijken naar de nieuwe mogelijkheden.


Voor de 17e eeuw

planeten.gifMichael Friendly (2007) heeft een chronologisch overzicht gemaakt van mijlpalen in thematische cartografie, statistische grafieken en andere datavisualisaties tot nu toe. Visualisaties vinden volgens hem vooral de oorsprong in geometrische diagrammen, kaarten en in tabellen met sterren standen. oldest-map.jpg Hij noemt als reden de opkomst van nieuwe technieken en navigatie instrumenten in de 16e eeuw.
Voorbeelden zijn een diagram uit de 14e eeuw te bekijken waarin een onbekende astronoom de beweging van de planeten over een bepaalde periode heeft geïnventariseerd.
En de Catal Hyk stadsplattegrond als oudste (6.200 BC) welke te zien is in het Konya museum in Turkije(afbeelding 2).


De 17e eeuw

Untitled-1.pngDeze eeuw kenmerkte zich vooral door het in kaart brengen van afstanden, territoriale afbakeningen, astronomie. Het gebied van schatting, waarschijnlijkheid, demografie en andere statistische begrippen ontwikkelde zich.
Untitled-2.pngVoorbeeld is Michael van Langren’s (1644) verbeelding van 12 verschillende bepalingen van de geografische lengte tussen Toledo en Rome. Het is waarschijnlijk de eerste weergave van statistische data (afbeelding 3).
En Christiaan Huygens grafiek die de levensverwachting als grafiek weergeeft(afbeelding 4).


De 18e eeuw: het experimenteren met vorm

defourcroy3.jpgIn deze eeuw probeert men vooral de gezondheid, geologie, economie en demografie in kaart te brengen. En doordat er meer data beschikbaar komt zie je nieuwe vormen van visualiseren ontstaan. Voorbeelden zijn de ‘Essai d’une table polomtrique’ van Charles de Fourcroy (1782) waarbij proportionele geometrische figuren (rechthoeken) gebruikt worden om demografische hoeveelheden te vergelijken (afbeelding 5).
first-pie-chart.jpgEn een figuur van William Playfair welke in de linkeras en -lijn per cirkel de bevolking en in de rechteras en -lijn per cirkel de belasting laat zien. Zie artikel ‘Mijlpaal in de data visualisatie‘.


Begin 19e eeuw

In deze periode zien we dankzij de ontwikkelingen in de 18e eeuw een explosieve groei van statistische grafieken en thematische kaarten.
Miniatuurweergave voor dupin2.gifVoorbeeld is de eerste choropleet kaart, dat is een kaart waarin kwantitatieve ruimtelijke gegevens met behulp van de arcering of het kleuren van bepaalde gebieden of percelen wordt weergegeven, is waarschijnlijk de ‘Carte de la France obscure et la France éclairée’ van Charles Dupin (1826) (afbeelding 7). Zie artikel ‘Opkomst statistische visualisaties en thematische plattegronden (1800 – 1850)‘.


Tweede helft 19e eeuw: het gouden tijdperk voor datavisualisatie

In deze periode heeft Minard de verliezen van Napoleons leger tijdens de tocht naar Moskou gevisualiseerd in de, volgens Edward Tufte, ‘beste statistische grafiek ooit gemaakt’.
Minard.pngHet is een kaart, die berucht is om de hoeveelheid informatie (geografische locatie inclusief namen van steden en rivieren, tijd (alleen op de terugtocht), temperatuur (het onderste deel van de grafiek), route, richting van de troepen en het aantal (nog resterende) manschappen) die aangeboden wordt, uit 1869 laat de verliezen onder de manschappen (breedte van de banen), hun bewegingen (heen bovenste baan, terugtrekking onderste zwarte baan) en de buiten temperatuur tijdens de franse invasie naar Moskou (1812) zien. Zie artikel ‘Minard, een terugkerend element‘ en artikel ‘Een interactieve Minard‘.


Eind 19e, begin 20e eeuw

18.jpgIn deze periode ontstaan er overal in Europa officiële bureaus voor onderzoek en statistiek. Het belang van numerieke informatie voor handel, industrie, vervoer en sociale planning wordt onderkend. De organisaties die zich bezighouden met het verzamelen, organiseren en analyseren van officiële statistische informatie over bevolking, handel, sociale, politieke en morele zaken verspreiden zich snel over Europa. In Nederland werd in 1894 het Amsterdamse bureau voor Onderzoek en Statistiek opgericht. Het is het oudste statistische bureau van Nederland. Vijf jaar later, in 1899, werd bij Koninklijk Besluit het Centraal Bureau voor de Statistiek opgericht. In Nederland werd er nog hoofdzakelijk gewerkt met tabellen. Frankrijk, Hongarije, Duitsland en Finland werkte al veel meer met grafieken. Zie artikel ‘Ontwikkelingen eind 19e, begin 20ste eeuw‘. Voor meer informatie over deze periode zie artikel ‘Voor het grote publiek‘ en artikel ‘Sociale geografie‘.


1950 -1975

Na een stille periode begin 20e eeuw zien we zo rond 1950 een opleving in de ontwikkelingen binnen de data visualisatie. Reden hiervoor was onder andere de ontwikkeling van FORTRAN (The IBM Mathematical FORmula TRANslating System, 1957) een hogere programmeertaal speciaal ontwikkeld voor wetenschappelijke doeleinden.
Tegen het einde van deze periode zien we een paar grote technische veranderingen die van grote invloed zijn op de data visualisaties zoals bijvoorbeeld nieuwe software pakketten, nieuwe computertalen, de computermuis, kleurenmonitoren, scanners, plotters. Zie artikel ‘Opleving van data visualisatie (1950 -1975)‘.


Van 1975 tot nu toe

Deze technologische ontwikkelingen hebben zich sindsdien in hoog tempo doorgezet. Er komen steeds meer interactieve statistische data systemen dankzij. Nieuwe modellen en theorieën voor de directe manipulatie van visuele data analyses (linking, brushing, selection, focusing) worden ontwikkeld. Er ontstaan nieuwe manieren voor het visualiseren van high-dimensional data zoals scatterplot matrix (Tukey, 1981) parallel coördinates plot (Inselberg 1985, Wegman 1990), spreadplots (Young, 1994). Zie artikel ‘Van 1975 naar interactieve en 3D visualisaties‘.

scatterp.gif parallel2.gif 1471-2105-5-60-6.jpg

Van links naar rechts: scatterplot matrix, coördinates plot en spreadplot.


Gerelateerde categorie op Latebytes
De historie van data visualisatie


Lijst van afbeeldingen
Afbeelding 1: Funkhouser, H.G. (1936). ‘A note on a tenth century graph’. Osiris 1 (1936) pp. 260-262.
Afbeelding 2: Catal Hyk stadsplattegrond. Geraadpleegd op 10 april, van http://www.atamanhotel.com/catalhoyuk/oldest-map1.html.
Afbeelding 3, 4, 6, 7: Michael Friendly. Gallery of Data Visualization The Best and Worst of Statistical Graphics. Geraadpleegd tussen februari en juni 2008, van: http://www.math.yorku.ca/SCS/Gallery/
Afbeelding 5: Palsky (1996): Des Chiffres et des Cartes, p.51-52.
Afbeelding 7: Choropleth map with shadings from black to white (distribution and intensity of illiteracy in France), the first (unclassed) choropleth map, and perhaps the first modern statistical map. Bron: “Milestones in the History of Thematic Cartography, Statistical Graphics, and Data Visualization” van Michael Friendly en Daniel J. Denis, York University, Canada.

Mijlpaal in de data visualisatie

By

nique

Published: April 11, 2008Posted in: @ HighlightsData en visualisatieHistorieTags:

William Playfair (1759-1823) is een van de grondleggers geweest van de lijngrafieken, staaf- en taartdiagrammen die we nu nog steeds gebruiken om statische data weer te geven. Wat je ziet is dat hij vooral eenvoudige visualisaties maakte. Het zijn vooral vergelijkingen. Er wordt geen inzicht gegeven in wat er zou gebeuren als er data zou wijzigen.
first-pie-chart.jpg
Bovenstaande figuur laat in de linkeras en -lijn per cirkel de bevolking en in de rechteras en -lijn per cirkel de belasting zien. De uitvergroting hieronder laat dit beter zien. (Bron: Florence Nightingale’s Statistical Diagrams. Hugh Small.) De bedoeling is dat de helling die deze linker- en rechterlijn met elkaar verbindt de hoogte van belasting direct zichtbaar maakt. Alleen wordt de helling in deze afbeelding ook bepaald door de diameter van de cirkel. Het is in ieder geval wel zichtbaar dat de helling behorende bij ‘Britain and Ireland’ de andere kant op gaat. In de huidige statistische visualisaties is het een regel om nooit twee verticale assen voor verschillende waardes (bevolking en belasting) te gebruiken.
small6.jpg
In een andere afbeelding wordt het nog duidelijker hoe Playfair het gebruik van grafische vormen voor zich zag. Hij gebruikt hierin drie parallelle tijdslijnen om de prijs van graan, de wekelijkse lonen en de regerende koning over een tijdsspanne van 250 jaar (1565 tot 1820) in beeld te brengen. Zijn doelstelling was het zichtbaar maken dat arbeiders erop vooruitgegaan waren in deze periode.
playfair2.gif
playfair.gif
fg4.jpg
Bronnen

  1. A brief history of data visualisation. Michael Friendly. 2006.
  2. Milestones in the History of Thematic Cartography, Statistical Graphics, and Data Visualization. An illustrated chronology of innovations. Michael Friendly and Daniel J. Denis
  3. Florence Nightingale’s Statistical Diagrams. Hugh Small.
Posted in: Uncategorized