Je zal er misschien niet dagelijks mee bezig zijn, maar soms vraag je je misschien wel eens bij een tabel of view af van welke andere objecten (tabellen, views, stored procedures) deze afhankelijk zijn. In SQL server kan je dit in principe zien door op het object te klikken en de dependencies te bekijken. Of via de sys.sysdepends tabel.
Ik zeg in principe, want waanzinnig betrouwbaar blijken deze methodes (iig in SQL Server 2005) niet te zijn. Daarom ben ik aan het knutselen gegaan en heb ik een script gemaakt dat in een database van alle stored procedures en views onderzoekt welke tabellen en views worden aangeroepen, gemaakt, gevuld, gewijzigd, verwijderd, etc. Je vindt het script, sp_ObjectDependencies_v0_2_beta, in de download sectie . Script is nog in onwikkeling, maar toch al erg bruikbaar.
Maar ik ben ook een mooie tool tegengekomen van redgate. Deze tool visualiseert alle afhankelijkheden. Zie de video hieronder. Een ander tool van dit bedrijf, geeft je zelfs de mogelijkheid op kolomniveau te zien wat de afhankelijkheden zijn (SQL Prompt). Veel hoeft het allemaal niet te kosten, SQL Dependencies is 240 euro. Je kan een gratis trial versie (14 dagen) downloaden om er eens mee te spelen.
Als je snel een eerste gevoel wil hebben van de data in een tabel, heb je met SQL een probleem. Bij bijvoorbeeld SPSS is dit een eitje, je selecteert alle kolommen die je wilt in het menu “Explore” en je krijgt van alle (numerieke) data het aantal records, minimum, maximum, standaard deviatie, etc, etc. Erg fijn als je een dataset voor het eerst onder handen hebt.
In SQL ben je dan wel even bezig, voorwaar geen leuke taak. Daarom heb ik enige tijd een stored procedure geschreven die automatisch voor alle kolommen in een tabel (of view) metadata laat zien. Informatie over de variabelen zelf (datatype, is het een primary index, etc.) en statistieken over de inhoud. Ik heb het script nu aangepast zodat je meer statistieken op kan vragen. Naast het aantal records, missings, min, max, gemiddelde, etc. heb je nu ook de mogelijkheid om de kwartielen op te vragen, alsook de mediaan, kurtosis en skew.
Ook is het nu mogelijk om alleen een subset van kolommen als input te geven.
Ik heb mij overigens in de aanloop naar de kamerverkiezingen wild geïrriteerd aan de debatten die steeds werden onderbroken om een hippe redacteur, met laptop in de aanslag natuurlijk, te laten vertellen wat die voor de nederlandse bevolking volledig a-typische groep van twitteraars van het debat vond.
Toch valt niet te ontkennen dat twitter een interessante (en realtime) bron van informatie kan zijn. Leuk artikel hierover in de Harvard Business Review: Six Ways to Find Value in Twitter’s Noise. In dit artikel laten ze een aantal mogelijkheden zien, door ten tijde van de launch van de Ipad te kijken welke woorden werden getweet in combinatie met het woord Ipad. Ze gebruikten hiervoor een “steam graph”, die de frequentie van de gebruikte woorden in de tijd laat zien.
Het aardige is dat diegene die deze grafiek voor de Harvard Business Review heeft gemaakt, op zijn site een interactieve versie heeft staan, waar je zelf een trefwoord kan opgeven. Onderstaande heb ik gemaakt met zijn Twitter SteamGraphs tool, voor het keyword “bavaria”. Tijdens de huldiging is Bavaria in context met Heineken genoemd, zie de reacties onder in het plaatje.
Je ziet een mooie grafiek op het internet en je wilt graag de data gebruiken, maar die staat er niet bij. Dan komt g3data (download link in het midden van de pagina) goed van pas, deze kan namelijk de datapunten van de grafiek lezen en deze exporteren naar een tekstbestandje. Erg handig!
Deze pagina is alleen toegankelijk voor leden. Login. Heeft u nog geen account? Registreer nu!
Geef je mening over dit artikel: 1 stem(men)
Loading ...
Handige software hoeft niet veel geld te kosten. Soms is het zelfs (legaal) gratis! Met MicroCharts en Sparkmaker kon je al tegen een milde vergoeding prachtige “in cell graphs” maken, zoals Tufte’s sparklines en Stephen Few’s bullet graphs. Maar nu ben ik een gratis Excel add-in tegengekomen die dit ook kan en nog meer, zoals treemaps, horizon graphs, boxplots en heatmaps. Lees verder voor een korte test!
Deze pagina is alleen toegankelijk voor leden. Login. Heeft u nog geen account? Registreer nu!
Geef je mening over dit artikel: 5 stem(men)
Loading ...
In mijn werk is SAmenu al sinds jaar en dag een onvolprezen hulpmiddel tegen vierkante ogen en muisarmen. Elke database marketeer weet immers wat het is te slepen met bestanden, van N:\ naar C:\, vandaar weer naar F:\, of toch maar weer terug naar D:\.
Ik wilde er al een tijdje geleden een post aan wijden, maar mijn geheugen van max. 3 minuten stond dat in de weg. Gelukkig zag ik een collega er van de week eentje in Excel proberen te knutselen en werd ik er weer aan herinnerd. Waar deze omlachtige inleiding toe leidt?
De Treemap
Treemaps visualiseren informatie met betrekking tot hierarchieen. Elk item wordt afgebeeld als een rechthoek, waarvan de grootte en de kleur afhankelijk is van de bijbehorende data. Ik heb er zelf eentje in elkaar geknutseld met de gratis Excel add-in Microsoft Research Treemapper op basis van verkoopdata van de entertainmentmarkt (bron: NVPI)
De entertainmentmarkt kan worden verdeeld in drie markten: Video, Games en Audio. Deze drie markten kunnen weer verder uitgesplitst worden, de audiomarkt bijvoorbeeld in Albums, Muziekvideos, Downloads en Singles. De grootte van de vierkanten is afhankelijk van de totale omzet, de kleur van de omzet per verkocht artikel (groener = hoger).
De Treemap is uitgevonden door Dr. Ben Shneiderman van de University of Maryland. Deze mijnheer had in de jaren 90 een server met een volgelopen harddisk onder zijn hoede en zocht een middel om snel te zien welke bestanden de grootste ruimte innamen en welke gebruikers hiervoor verantwoordelijk waren. Lees meer over de geschiedenis van de Treemap in het artikel Treemaps for space-constrained visualization of hierarchies.
Zie voor enkele online voorbeelden bijvoorbeeld de site van The Hive Group (mooi voorbeeld van Amazon) en nog een artikel van Shneiderman op Perceptual Edge. Ziet er meteen ook een stuk mooier uit dan de Microsoft Research Treemapper. Overigens kan je ook treemaps maken op het eerder besproken initiatief van IBM: Many Eyes.
Met deze tool kan je labels toevoegen aan de datapunten in een XY (Scatter) grafiek of een Bubble chart. Wellicht een enigzins misleidende naam, want stiekem werkt de labeler ook bij elk ander type grafiek. De labels zijn dynamisch en veranderen mee als de brondata verandert. De tool maakt het ook gemakkelijk om in een keer alle labels te verplaatsen.
De eerste post van de Tool Tips rubriek bevat meteen twee Excel add-ins. Ze doen nagenoeg hetzelfde en komen allebei uit Duitsland. Ik heb het hier over MicroCharts van BonaVista en SparkMaker van Bissantz. Wat ze doen? Ze maken zogenaamde Sparklines; een uitvinding van visualisatiegoeroe Edward Tufte.
Het betreft kleine, kale grafieken waaruit je geen waardes af kan lezen, maar waarmee je uitstekend op een klein oppervlakte een trend over meerdere periodes kan laten zien. Van origine zijn het alleen lijngrafieken, maar beide add-ins maken ook gebruik van kolom- en taartdiagrammen: Een voorbeeld uit SparkMaker:
Zoals je ziet kan je heel veel informatie kwijt op een kleine ruimte. De tool van BonaVista heeft zelfs het vierde deel in de Data Visualization Competition van Stephen Few gewonnen. Zie hieronder een fragment uit het winnende dashboard:
Beiden lijken elkaar in functionaliteit niet veel te ontlopen. Voordeel van MicroCharts is dat de formules waarmee je dynamische grafieken maakt ook in Excel 2000 werken. SparkMaker kan dit alleen in Excel XP en Excel 2003, in de 2000 versie kunnen alleen statische grafieken worden gemaakt. Daarbij is MicroCharts ook goedkoper: Een Pro licentie kost 82 Eur, tegen 165 Eur voor SparkMaker. Voor beide programma’s kan je gratis een 30 dagen trial downloaden. Ze bieden alletwee ook de mogelijkheid de grafieken te converteren naar (statische) plaatjes zodat iemand zonder de add-ins de grafieken ook kan bekijken.
Al met al lijkt het me leuk speelgoed voor dashboard designers. Zie ook het artikel op Juice Analytics en een op Excel Geek.
Ik wil een nieuwe rubriek toevoegen aan DBM Café met hierin ruimte voor het bespreken van software, tools, add-ins, etc die het werk van de Database Marketeer aanzienlijk vergemakkelijken.
Dus weet jij een handig stukje gereedschap dat op de werkbank van elke Database Marketeer thuishoort, neem dan contact met mij op!