Brugernes eksterne blogs
Nanoskala batteri bygget af virus
Kirkeglas kan fjerne forurening
Få gratis nyheder om nanoteknologi
Konstruktiv evaluering via tilfredshedsundersøgelser
I det seneste nummer af Evalueringsnyt(pdf) faldt jeg over en artikel af ph.d. Christian Moldt. Artiklen beskriver hvordan studentertilfredshedsmålinger finder anvendelse på en række videregående uddannelser.
En af artiklens interessante iagttagelse er, at lærere og ledere, når de frit associere til ordet “evaluering” kommer i tanke om langt flere negative ord og vendinger end positive. På den baggrund kan det ikke overraske at Christian Moldt i sine interview afdækker stor skepsis og ikke mindst vanskelighed ved at bruge studenterevalueringer af lærerne.
Jeg tror man skal være meget opmærksom på den kontekst artiklen beskriver: I mangel af bedre vil jeg kalde denne kontekst assymetrisk, diakron og illegitim.
Den er assymetrisk fordi det er eleverne der evaluere lærerne. Ønsker og krav og feedback går derfor kun den ene vej. Ganske vidst kan læreren efterfølgende debattere resultatet med eleverne, men udover at læreren mangler processværktøjer til at foretage en sådan dialog, så ramler vi ind i forhold nr 2, nemlig at evalueringen dybest set er assynkron:
Evalueringen foretages når et kuld elever er ved at være færdige med undervisningen. Det betyder på den ene side at de kan tale frit for leveren, uden frygt for at blive mødt med sanktioner fra læren. På den anden side betyder det også at eleverne ikke har grund til at tage ansvar for processen, eller opleve den som virkelig relevant. Eventuelle forbedringer af undervisningen vil jo ikke komme dem til gode, men i stedet kun det næste kuld studerende.
Endelig er evalueringen illigitim, forstået på den måde at den er uønsket. Lærerne er en klassisk profession hvor ledelseskompetencer ikke anerkendes. Lederen er i stedet primus inter pares - eller som Christian Moldt antyder, “hyggetante”. Det betyder for det første at evalueringen bliver til en personlig sag hvor man ikke kan forvente hjælp eller feedback fra ledelsen/organisationen. Det bliver til en sag mellem underviser og klassen, i stedet for skole og eleverne. Ledelsen kan ikke, fordi den ikke forstår sig selv som ledelse, tage resultaterne på sig og på makroniveau handle på resultaterne. For det andet betyder det læren ikke accepterer evalueringens genstandsfelt som noget der berører kernefagligheden. Kernefagligheden er i stedet fordybelse i faget - og i nogle tilfælde forskning. Undervisningen er et nødvendigt onde - og som sådan ikke noget man bruger mange kræfter på at forbedre. Derfor opfattes tilfredshedmålinger også bare som bureaukratisk tidsspilde.
Wally tager ikke medansvar :-)
Hvad kan vi lære? For det første tror jeg man kan lære ret meget af konteksten. En evaluering skal for at blive vel modtaget konstruktivt indskrives i en symmetrisk ramme, hvor den evaluerede og den evaluerende kan kommunikere frem og tilbage. Dette kan evt. ske som på en procesdag som opfølgning på evalueringen 1.
Evalueringen skal også være synkron - forstået sådan at begge parter skal tage ansvar og se evalueringen som relevant. Lige nu - og om et år.
Endelig skal legitimiteten være på plads. Man skal på forhånd gøre det klart hvad evalueringen skal bruges til, og hvem der har initiativpligten til at igangsætte handling. Man skal desuden gøre det helt klart hvordan evalueringen passer ind i den strategiske udvikling af organisationen og forklare hvorfor evalueringen faktisk er en kerneaktivitet.
Derudover vil jeg fremhæve et fjerde element. Udviklingselementet. Alt for mange evalueringsspørgsmål antager at virkeligheden er konstant. Men virkeligheden er aldrig konstant. Således har selv den dårligste chef, medarbejder, underviser eller giraf - både gode og dårlige dage. Sørg for at anerkende dette i spørgsmålsformuleringerne. Til mindre analyser - fx 360 evalueringer - kan solution focused rating (pdf) eksempelvis være en nyttig metode.
Virkeligheden er aldrig konstant. Nogle gange er man bedre end gennemsnittet og andre gange er man ringere end gennemsnittet
Det er også vigtigt at stille handlings og ikke kun holdningsspørgsmål. Det er utroligt vanskeligt at forbedre sig på baggrund af et resultat der fx siger at 82 procent mener “du er en dårlig leder”. Man får nemlig ikke at vide hvad der er galt - i stedet får man en spand lort i hovedet. Det er meget bedre at få at vide at 82% ikke oplever at de får umiddelbar feedback.
Husk altid at tilbyde uddybende tekstsvar således at både holdning og handlingsspørgsmål kan uddybes. Dette sidste punkt er relevant i surveys. Ofte ser man et enkelt aflsuttende ‘åbent’ spørgsmål alla :”har du ellers noget på hjeret” - og der har man oftest ikke.
Men hvis man stillere et præciserende åbent tekst spørgsmål for hvert lukket spørgsmål sker der noget andet. Særligt hvis man også uddyber hvad man ønsker at få at vide. I stedet for “Har du noget på hjertet” - så kan man jo skrive: “Hvis du har lyst, så uddyb venligst hvordan XXX giver feedback. Du behøver ikke at forklare eller begrunde din rating. I stedet vil vi gerne have eksempler på både gode og dårlige ting, således at XXX kan få at vide hvad hun gør godt, og hvad hun gør mindre godt”.
- Konsulentfirmaet Resonans er eksempelvis dygtige
Kirkeglas kan fjerne forurening
Hvad er en nanopartikel? Og hvorfor kan den bruges til at bekæmpe sygdomme?
Kan billeder virkelig være data?
I dzidzo sammenhænge påstår jeg gerne at organisationens udsmykning kan fortælle mere eller ligeså meget om virksomheden, som strategipapirer og missioner kan.
Sociological images viser ganske tydeligt hvordan kvindelige atleter i stigende grad bære kropsnært og meget lidt tøj. Mon ikke det siger noget om hvilke værdier samfundet gennemsyres af - og ikke mindst hvem der er den typiske sportsseer?
I et mere raffineret indlæg har en af mine favorit data-geek blogs/virksomheder, Dolores Labs, vha. af billig arbejdskraft vist at sorte atleter i dag optræder på ca. 6 ud af 10 forsider af Sports Illustrated. I midten af 50′erne var forsiderne prydet med billeder af hvide atleter i 90% af udgivelserne.
Hvilke racer optræder på forsiden af Sports Illustrated? Udvikling over tid.
100.000 fans i en trøje
Humanistisk samfund
For et par år siden skrev jeg lidt om det norske Human-Etisk Forbund, som er en sekulær organisation, der arbejder på at fremme humanistiske værdier og mindske religiøs indflydelse i samfundet og på den enkeltes liv - det sidste bl.a. ved at tilbyde ikke-religiøse ceremonier i forbindelse med navngivning, bryllup, begravelse osv. - og jeg konkluderede, at sådan en vil vi også ha’ i Danmark.
Det ønske ser nu ud til at gå i opfyldelse. En ny forening med navnet Humanistisk Samfund, som er tænkt som et dansk sidestykke til Human-Etisk Forbund, bliver officielt stiftet på et møde d. 29. august.
Blandt initiativtagerne til den nye forening ses bl.a. Dennis Nørmark og Lars Andreassen, forfatterne til bogen “Det virkelige menneske”, som jeg tidligere har omtalt.
Humanistisk samfund har allerede en hjemmeside, hvor man kan læse mere. Her er også links til diverse avisartikler og til P1’s hjemmeside, hvor man kan høre Dennis Nørmark i studiet hos Poul Friis. Endelig kan man også melde sig ind, og vil så blive inviteret til det stiftende møde (som foregår i København).
Humanistisk samfund har i øvrigt også en Facebook gruppe.
Spændende gratis bog om nanoteknologi
Underbevidsthed og racisme i sport
Politiken kan idag berette at rød vurderes mere venligt end blå - hvertfald af taekwondo dommere. Vi har længe vidst at underbevidsthed spiller ind på de mærkeligste ting:
Sidste år kom det frem at der er en anelse rascisme blandt NBA dommere. Hvilket er ekstremt interessant da NBA basketball ellers er omgæret af fanatisk eftersyn og kontrol, herunder statistik og video. Hvis der under de forhold kan forekommer ubevidst rasicme blandt de bedste dommere - hvad kan der så ikke forventes at forekomme i diskotekets døråbning.
Måske skulle du teste dig selv ved hjælp af en Implicit Associations Test - fx om skjult racisme (testen er på engelsk - men man skal blot sortere nogle ord og billeder - så de fleste kan tage den): Foreløbig ser testresultaterne således ud.
fordeling af testscore, fra Harvards IAT. De sorte bjæler viser andelen der har nemmest ved at matche negativt ladet ord med billeder af afro-amerikanere (og positivt ladede ord med euro-amerikanere).
Hele problemfeltet minder mig i øvrigt om subliminal marketing, som sandsynligvis - nogen gange - virker. På en eller anden måde, og hvertfald i laboratoriet - hvis vi altså ikke har alt for travlt.
This finding — that the brain does not pick up on subliminal stimuli if it is too busily occupied with other things — shows that some degree of attention is needed for even the subconscious to pick up on subliminal images.
Der er lavet rigtigt mange forskellige studier. Bl.a. refere Cordelia Fines fremragende bog, at mænd efter at have set bilreklame med kvinder i udfordrende positurere, vurdere kvindelige jobansøgere som mindre dygtige end de mænd der ikke var primet med sexistiske reklamestereotyper. Det sjoveste er måske at selv om effektgruppen vurderede ansøgerne som fagligt ringere - var de stadigt villige til at ansætte kvinderne… (jeg forsøger senere at finde links til selve undersøgelsen. For ny må I nøjes med link til bogen: A Mind of Its Own: How Your Brain Distorts and Deceives.)
Det minder mig til gengæld om et af mine farvorit colombo afsnit - fra sæson 3: Double exposure hvor subliminal teknik bruges i udførslen af et mord
Peter Falk som Colombo i sæson 3 episoden 'double exposure'
Social netværksanlyse grundlagde google - og hvad nu?
Google sidder stadig trygt og godt på markedet for websøgninger og afledte muligheder. Google er god til konstant at bringe innovation til forbrugerne, bl.a. ved at have et næsten romersk øje for små lovende startups - som google køber og efterfølgende launcher et halvt til helt år senere.
Googles succes skyldes selvfølgelig at de generelt stadig levere de mest relevante søgeresultater. Det sker ved hjælp af google pagerank, som grundlæggende blot er et centralitetsmål som vi kender det fra social/organisatorisk netværksanalyse. Præcist som degree-, betweeness-, closeness- og information-centrality er pagerank således et udtryk for hvor vigtig hver knudepunk er i netværket. I sociale netværk er knudepunktet ofte mennesker. I pagerank er det hjemmesider1.
Imidlertid bruger google endnu ikke klikke begrebet optimalt. En klikke er en gruppe af knudepunkter der minder meget om hinanden, om som er forbundet på kryds og tværs. Klikker vil ofte være praksisfællesskaber eller nicheområde. Mange søgeord genfindes i mange forskellige klikker på tværs af internettet. Med mindre man har lavet en tilstrækkelig præcis søgning, med mange forskellige søgetermer, vil google derfor blot sende een videre til de største og mest populærer sider. Men hvad nu hvis man i virkeligheden ville hen i en anden ‘klikke’, men måske blot ikke kunne finde på de rigtige søgetermer? Elle hvis man bare web-osede: Kiggede lidt hist og lidt pist?
En række nye tjenester forsøger at fylde hullet ud. Mindst een af dem bliver nok købt af google eller yahoo - og ingen af dem er rigtig gode endnu (måske fordi de er basseret på yahoo). Men jeg synes klart at potentialerne er tilstede. Nedenfor kan du få et indtryk af hvordan tre forskellige søgemaskiner forsøger at bruge netværksanalyse til både at visualisere og gruppere resultaterne.
grokker
quintura
clusty
Inspiration: greenlaneseo
grokker.com søgning - man kan 'zoome' ind på hver klike
Søgeresultat quintura. Grundlæggende samme koncept som grokker.
Og tilsidst clusty.com
- jvf. googles open social -http://code.google.com/apis/opensocial/ -tænker google dog nok i høj grad identitet bredere end i gamle dage
Konfus Konsult
Bag enhvert grin findes en trist sandhed. En fremragende parodi på konsulentbranchen.
dzidzo er selvfølgelig anderledes
Flyver med fuglevinger
Brug google til at fokusere din markedsførsel
Nyheden om googles nye insights søgning har jeg samlet op hos Kasper Hyllesteds Weblog. Man kan via tjenesten se hvilke regioner i danmark der interessere sig for sit produkt. Det er en rigtig smart service som google tilbyder, men pas på: Kasper Hyllested gode eksempel med Paris Hilton som skulle være taget til Ribe istedet for København, illustrerer faren:
- Insight søgningen indekserer/skalerer resultaterne, således at den mest populære søgning repræsenteres med 100 point. På den måde er det let at se, at forskellene i Paris Hilton søgningerne i Danmark er ret lille, på tværs af landsdele. Man skal således passe på med blot at kigge på rangeringen, men altid kigge på faktisk score.
- Scoren er normaliseret efter total søgevolume. Det betyder at man faktisk godt kan sammenligne Ribe med København, men det man sammenligner er den relative søge-popularitet. Resultaterne siger altså ikke noget om absolut interesse. Derfor er nok meget klogt at Frk. Hilton tager til københavn, hvor der trods alt er flere mennesker. En lille procent del af noget stort kan således være større end en stor procentdel af noget småt.
Ikke desto mindre er servicen interessant og jeg vil bruge den meget fremover tror jeg. Fx har jeg allerede nu fået bekræftet af man relativt går mere op i trivsel på hovedlandet end andre steder. Og at Københavnerne hellere søger efter survey, mens Fyn og Århus helst søger efter Spørgeskema…
Eller gør de? Kun relativt… Det vil stadig være bedst at reklamere med ordet survey - selv i jylland - se sammenligningen.
The genius of Charles Darwin
Første afsnit (af 3) af Richard Dawkins’ seneste produktion, som handler om Charles Darwin og evolutionsteorien - og selvfølgelig får religion nogle hug undervejs:
http://video.google.com/videoplay?docid=-4471435322910215458
Dansk Data Arkiv må oppe sig
Lidt galde: Hvordan kan det være, at vi i web 2.0 tiden med open source tendenser og mere, stadig skal søge manuelt om at få adgang til frit tilgængelige datasæt i dansk dataarkiv? Hvordan kan det være at DDA’s hjemmeside ikke tilbyde et feed1 med de seneste datasæt? Hvorfor ikke tænke DDA-links ind i eletroniske (og print) publikationer? Hvor kunne det være godt med adgang til statens API - ligesom i England. Eller hvad med en Swivel funktiionalitet?
Det er en bevægelser der har momentum i bl.a. USA. Så hvad med foregangslandet? Helge Sander - hvad siger du? Skulle man ikke kræve at forskerne giver adgang til deres data? Der kan selvfølgelig være fortrolighedshensyn at tage stilling til, men hvis ikke et resultat kan efterprøves og reproduceres er der vel rimeligt at spørge om der overhovedet er tale om forskning?
De enkelte universiter har et ansvar. Er der nogen dansk forsker der kan måle sig med Gary King’s åbenhed? Se data her og han side om datadeling.
Lidt flere data i den store www verden.
N.b. Det jeg efterlyser er særligt videnskabelige datasæt og undersøgelser. Fra den statlige verden findes allerede en del. Der mangler måske en fælles indgang og bedre interface etc. Men man kan faktisk bruge følgende til ret meget:
- Uddannelsesstatistik.dk giver adgang til en masse værdifuld statistik på uddannelsesområdet. Men udførslen er klodset og tung.
- Forhandlingsdatabasen giver adgang til statsansattes løn,
- LOPAKs til de kommunaltansattes løn.
- noegletal.dk giver adgang til en masse kommunale data
- Selvfølgelig også danmarks statistik.
- helst atom; men RSS er fint
Både stort og småt
Politiken har i argurketiden valgt at bringe microsoft-’nyheden‘ (fra marts) der bekræfter at den gennemsnitlige korteste sti i hele verdens sociale net - kun er ca. 6 led langt. Det er før konstateret i mange forskellige typer netværk: Kevin Bacon, Wikipedia, videnskabelige referencer og meget mere. Stanly Milgrams postkort forsøg er endda fra før web 1.0.
Det er et kendt paradoks at sociale netværk har tendes til både at udvise small world karakteristika (alle kender alle kun X led ude) såvel som en høj grad af embeddedness (men vi tale alligevel sammen i tæt sammenspunde klikker1).
Small world fænomenet er relevant i epedimologi, og eksempelvis studiet af trendsetting m.m. Dvs. netværk hvor konsekvenser spredes selv via hurtig, sjælden og overfladisk kontakt.
I langt de fleste ’sociale’ sammenhæng skal der dog mere end et enkelt møde til at viderbringe information og handlingsændringer. I organisationer bør man derfor fokusere på embeddednessaspektet2. I næsten alle tilfælde går indflydelsen maks 3 led ud. Dvs til en ven af en ven: Forestil dig du hedder klaus og ved en masse om reklametryk. Du får en henvendelse fra Dennis som du ikke kender: “Hej klaus, kan du hjælpe mig med at vælge hvilke farver jeg bør bruge til min søns fødselsdagainvitation. Jeg er blevet rådet til at spørger dig af Bodil, som kender Trine, der er gift med Ole, som vist nok arbejdede sammen med dig sidste år”. Her er vi ude i fjerde led - og henvendelse er allerede ret latterlig.
I arbejdet med sociale netværk - og særligt med vidensdeling for øje - bør man næsten altid fokusere på hvilke sub-netværk der eksistere og hvordan de kan udvides. Hvad karakterisere ‘embeddedness’ i det konkrete tilfælde? Er det arbejde? Familie? Fælles fritidsinteresser?
(microsofts lille analyse på chat-data bør i øvrigt gøre os alle sammen opmærksom på at webtjenester som facebook, google og microsofts ejer alle de data (ord) vi sender igennem deres protokoller. Bog-brother is indeed watching)
- En klikke defineres som et under-netværk hvor alle kender alle. Det er en ret restriktiv definition (pdf link
- brobyggere der forbinder en klikke med den næste 8og således muligør small world fænomenet) er selvfølgelig også interessante - men på en anden måde som jeg vil vende tilbage til i en anden post
Fact Pattern Analysis - loven sat på formel
Min forrige post omhandlede maskiners evne til at forudsige domsfældelser i US supreme court. Denne follow-up handler om noget beslægtet nemlig såkaldt Fact Pattern Analysis (FPA) - som også finder anvendelse inden for det juridiske. Således skriver forfatterne til dette paper at
“Det er interesant at [forfatterne til papiret der inspirerede forrige post] brugte CARTS i ‘væddemålet’ mellem eksperter og computer modeller. [...] Men den type CARTS der blev anvendt brugte tilfældige variable og forsøgte ikke at finde faktiske juridiske regler (Min oversættelse)
CARTS er en forkortelse for Classification And Regression Tree, hvilket er en teknisk detaljer jeg ikke vil bruge krudt på. Omvendt med forsøget på at bruge computermetoder til at undersøge faktisk gældende lovpraksiser. Det er en interessant - og i nogle øjne måske håbløst naiv - tilgang som kan bruges til at dokumentere hvordan fortolkninger af de samme love ændrer sig over tid, eller hvordan den amerikanske højesteret faktisk bliver mere konservativ i takt med flere konservative dommere får sæde. Metoden er altså oplagt som led i deskriptiv samfundsvidenskab og måske også som præskriptivt dobbelt check af kvaliteten af domsafsigelser.
Forfatterne anerkender to forskellige paradigmer indenfor FPA: På den ene side et attitide (juridisk realistisk) paradigme hvor domsfældelser antages at være afhængige af dommeres holdninger (attitude) og på den anden side et juridisk positivistisk paradigme hvor kun den gældende lov antages at have indflydelse. Forfatterne vil dog ikke vælge side. I stedet bemærkes det at foretalerer for begge paradigmer påstår at FPA understøtter netop deres argumenter - hvilket på sin vis er korrekt Det afhænger nemlig helt af hvor man kigger hen. I nogle sager hvor de sociale omkostninger ved at følger sine holdninger er små, er der fx større tendens til at dommerens egne holdninger spiller ind.
Jeg tror et velkvalificeret FPA projekt kan hjælpe både dommere, parter og ikke mindst samfundsforskere med at gennemskue skift i retspraksis og fairness af domme. Hvorvidt en nogenlunde dækkende FPA nogensinde kan bruges normativt/preskriptivt ved jeg ikke. Men fx gives der i artiklen følgende eksempel på at FPA kan bruges til at illustrere et skred i rettens beskyttelse af privatlivet i forbindelse med politiefterforskning: Case-spørgsmålet er, om bevismaterialer tilvejebragt via en ransøgning/visitering skal godkendes som gyldigt.
Modellen1 er:
Nu forestiller man sig at en politiker oplever at domspraksis ændrer sig. Hvad gør man? Kører en CART model på to forskellige tidsserier. Givet man har nok sager kan man så sammenligne om der fx er forskel på disse to tidspunkter (og der findes selvfølgelig også mere formelle statistiske tests)? Nedenfor vises to hypotetiske tilfælde - og det er let at se at der i denne hypotetiske case er sket en ændring af retspraksis.
Ærligt talt ved jeg ikke helt hvad jeg skal synes om FPA - andet end der er meget spændende. Denne artikel er den første jeg har læst om emnet - og den er ikke synderligt velskrevet. Hvis der sidder en jurist eller anden person med holdninger/erfaringer og læser med på denne post - vil jeg meget gerne hører mere.
- her er det tydligt at se hvorfor metoden (CARTS) indeholder klassifikation og (beslurtnings)Træer
Super Crunchers af Ian Ayres - Boganmeldelse
Super Crunchers: How Anything Can be Predicted samlede jeg op i lufthavnen i forrige måned. Der er tale om en let læst og vel argumenteret forfægtelse af statitistisk metode. Uheldigvis afsløres bogens egentlige motivation først til sidst i bogen nemlig
behovet for at indprente lægmand en grundlæggende statistisk forståelse (min oversættelse)
endda på en sådan måde at fordomme om at kvantitativ metode som ondskabens ‘højreorienteret’ træl (”tænk på: løgn, forbandet løgn og statistik”) gøres til skamme:
Man kan knuse tal og stadig have en passioneret og omsorgsfuld sjæl. Man kan være kreativ (min oversættelse).
Jeg vil dog tro at folk der tænder på titlen og særligt undertitlen “How anything can be predicted” er overbevidst før titelbladet vendes. Hvilket er en skam. For “Super Crunchers” er en overbevisende bog der på indholdssiden klart har potentiale til at skabe interesse for statistisk metode i selv meget kvalitativt orienterede kredse.
På formidlingssiden er forfatterens prosa tydeligt mærket af passion for data generelt og datamining i særdeleshed. I den forstand er sproget måske ikke egnet til at overbevise/omvende de skeptiske. På den anden side har Ian Ayres som forfatteren hedder også en omsorgsfuld sjæl. Indeholdt er hvertfald søde bemærkninger om kollegaer, et enkelt lille hævntogt1, betragtninger om sin datter, om hvordan statistik skyder ekspertvældet ned og lader lægmand ser kejserens sande klæder, hjælper arbejdsløse med at få arbejde, narkomaner med at forblive ‘clean’, singler med at finde kærligheden og gravide med at vurdere risikoen for at få handikappade børn. Det er således ærværdige sager som Ayres forfølger.
Der er kun to figurer i bogen (begge af normalfordelingskurver) og ingen ligninger. Der er altså tale om en deskriptiv bog med en masse gode eksempler på super-crunching. Det er ikke en lærerbog eller en introduktion til de teknisk orienteredet2. Der er tre storer temaer:
For det første viser Ayres at vores liv idag leves digitalt. Næsten ingen ting er længere privat. Det betyder at dataminingindustrien3 (oh yes - den findes i allerhøjestegrad, fx Acxiom og danske Geomatic) er bedre til at forudsige om du bliver skilt i det næste år, end du selv er. På den baggrund skrædersyes tilbud og produkter til lige præcis dit kundesegment4 hvilket kan være en fordel for forbrugeren, men med det aberdabei at virksomheder vha. af statistik i dag kan prisdiskrimere og altså tilbyde forskellige kunder det samme produkt til forskellige priser. Som Ayres skriver er der grund til bekymring hvis man modtager noget gratis fra sin leverandør af dette eller hint. Det betyder nemlig at man betaler for meget for sine vare. Mens virksomheder kan kværne store datasæt har den almindelige forbruger jo ikke råd til den slags, hvilket altså umiddelbart stiller menigmand relativt svagere vis a vis erhvervslivet. Heldigvis stiller dataminingfirmaer sig også i forbrugernes tjeneste og hjælper de forbrugere der gider (hvilket jo langt fra er alle) med at finde de bedste tilbud. Farecast.com kværner eksempelvis data for forbrugere og hjælper os med at forudsige om flypriserne vil falde eller stige i fremtiden. De er endda så sikre at de (for nogle afgange) tilbyde at forsikrer deres forudsigelser for 10$. Stiger prisen mod forventning refundere farecast beløbbet. Så datamining er altså slet ikke kun dårligt.
Ayres foreslår i øvrigt at man lovgivningsmæssigt kan tvinge virksomheder til at offentligegøre data - eller som han siger “educate consumers about themselves”. Særligt interessant er overvejelsen om ikke kære told∘skat offensivt kunne bruge sine mange oplysninger om borgeren som en service, der fortalte om man som virksomhed bruger for mange penge på reklame, giver mindre end gennemsnittet til godgørende formål, har et fornuftigt afkast på sine investeringer og så videre.
Det andet tema i bogen er brugen af simpel eksperimentel metode. Det er tankevækkende at eksperimentel metode med randomiseret forsøg i nogle sammenhænge beskrives som rabiat, mens Ayres langt hen ad vejen lykkedes at fremstille det som noget af det mest simple og mest overbevisende (og jeg er helt klart enig med Ayres). Eksempler dækker hvordan hospitaler reddede 100.000 menneskeliv, fattige hjælpes i mexico, kriminalitet sænkes i amerikanskebyer og hvorvidt fængselsstraffe forhærdiger de kriminelle og meget andet.
Det tredje tema - som afslutter bogen - drejer sig om mere basal statistik: Reglen om næsten alle gennemsnit er normaltfordelt og at 95% vil ligge inde for +/- to standardafvigelser, og brugen af bayesteorem til at opdatere sandsynligheder (Ayres bruger det samme eksempel som jeg beskrev fornylig). Der argumenteres for at intuition sagtens kan være statistisk intuition og de statistik kan bruges til at undersøge og opdatere sine fingerspidsfornemmelser.
Jeg var - som jeg formoder de fleste andre der finder titlen interessant - solgt i forvejen. Det var paradoksalt nok derfor jeg købte bogen: For at blive endnu mere overbevidst. Og her, i mit eget lille mikro univers, ligger forfatterens akilleshæl. For bogens titel blev tilsyneladende fundet ved hjælp af eksperimentel metode: Et par google annoncer blev lanceret på internettet med forskellige bud på hvilken titel bogen skulle have. SuperChrunchers vandt klart - dvs. supercrhunchers reklamen genererede langt flere klik end de øvrige titler. Mit gæt er som nævnt, at de folk der finder bogens titel incitterende allerede i forvejen er gejlet af tal… Men folk der kender til simple statistik, den digitale web2.0. mining virkelighed og bare har hørt om bayes vil ikke få meget nyt med sig.
På den måde er bogen uforvarende et eksempel på at eksperimentel metode ikke kan stå allene. Der er således en modsigelse mellem bogens formål (at omvende og overbevise) og bogens salgstaktik (at henvende sig til de allerede overbevidste). Den gode titel skal således være i overensstemmelse med bogens indhold. Og det kunne statistik ikke hjælpe med5 .
Køb bogen - enten fordi du gerne vil have en masse eksempler du kan bruge til at overbevise ikke tal-venlige folk (giv den i gave)6, eller fordi du selv ønsker at få en nem og letlæst introduktion til hvorledes statistik kan anvendes.
- Det er John Lott Ayres er ude efter - og noteapperatet antyder at Ayres og med-hævner Steven Levitt har fat i den lange ende
- til gengæld er noterne meget værdifulde og detaljerede med gode “further readings” forslag
- eller såkaldt CDI - “consumer data integration
- som for Acxioms vedkommende består af mere end 70 forskellige livsstile. Man er altså kommet langt siden Henrik Dahls minervamodels fire segmenter
- Dog: Supercrunchers indeholder faktisk omtale af Atai Winkler som har haft relativt stort held med at forudsige hvilken bog på New York Times bestseller liste som ville få førstepladsen, allene på baggrund af analyse af titlen - man kan endda selv prøve sin egen titel her
- noteapperattet er dog også værd at læse for de indviede
