Kan Wikipedia förutspå resultatet i Melodifestivalens första deltävling?

Det finns en del studier som visar hur man med hjälp av antalet sidvisningar (och i vissa fall antalet redigeringar) på Wikipedia kan förutspå utfallet av olika skeenden. En av de mest kända är hur man kan se om en film kommer att dra in mycket pengar på biograferna. I denna anda gör jag härmed en enkel koll på hur deltagarna i den första deltävlingen står sig inför kvällen. Med hjälp av Wikimedias sidvisnings-API samlade jag in data för de fyra senaste veckorna. Så här har sidvisningarna varierat över den tiden.

Av grafen kan man se spikar för Pernilla Andersson, Ace Wilder och de senaste dagarna Anna Book. Mimi Werner har ingen artikel och kommer inte med i grafen alls. En joker? En klurighet dock: värdena för Albin & Mattias är från deras respektive sida som jag har summerat ihop. Samir & Viktor har däremot dels en sida som duo, dels en varsin sida, men här har jag bara tagit med data från sidan för duon. Vill ni kika mer noggrant på hur jag har räknat ut det är kan ni kolla direkt i mitt kalkylark.

Gör man en summering visar sig följande resultat.

Om metoden håller skulle alltså Anna Book vinna ikväll och Pernilla Andersson blir tvåa.

Uppdatering: Jag som lever under en sten (eller snarare har varit på kurs de senaste två dagarna) har ju missat att Anna Book blivit diskad. Då borde Pernilla Andersson ta hem det, och Ace Wilder bli två.

Uppdatering 2: Pernilla Andersson blev sist. Metoden är tydligen inte tillämpbar i Melodifestivalsammanhang.

Resultat för Melodifestivalen om det hade varit upp till Wikipedias läsare

Emanuel Karlsten levererade en prediktion mitt under Melodifestvalen baserat på en spaning från Spotify, Youtube och Googlesökningar.  Där blev hans etta, tvåa, trea och fyra: Ace Wilder, Sanne Nielsen, Linus Svenning och Panetoz.

Om man tittar på sidvisningarna på Wikipedia för de respektive artisterna de senaste 30 dagarna, till och med fredagen 7 mars blev ställningen så här:

Ace Wilder 30696
Sanna Nielsen 15662
Oscar Zia 10863
Yohio 8915
Anton Ewald 8318
Panetoz 7496
Linus Svenning 6345
Helena Paparizou 1046
Alcazar 720
Ellen Benediktsson 23

Lite skillnad jämfört med de andra tre tjänsterna alltså. Och båda skiljer sig en del mot slutresultatet, framförallt på de lägre nivåerna. Båda var dock helt fel ute med att ha missat Alcazar helt, men det är kanske ändå inte kvällens största skräll. Alla datapunkterna placerade Ace Wilder långt före Sanna Nielsen, men den lilla skillnaden på enstaka procentenheter i telefonröstningen räckte till att Nielsen skulle hamna minimalt före Wilder och blev alltså vinnare!

Redundans och public service

Igår på Melodifestivalens andra chans så strulade det en del med grafiken så att de inte kunde visa några listor i rutan. Men det kanske inte spelade så jättestor roll, med det beteende som kallas Second screen var det lätt för många att gå in på Wikipedia och se ställningarna uppdateras kontinuerligt. Under kvällen uppdaterades sidan 22 gånger och det var flera som utnyttjade detta, sidan visades 2284 gånger under gårdagen. Jag skrev om hur snabbt resultatet på Wikipedia uppdateras redan 2010 och det rörde sig om sekunder, ibland snabbare än SVT, även då tekniken funkade.

Så vad vill jag säga med detta? Jo, att eftersom att detta är en så vitt utnyttjad källa så är det inte orimligt att Public service själva står för att uppdatera dessa siffror, tillsammans med statiska källlänkar. Det skulle göra att frivilliga krafter skulle frigöras till att göra mer komplicerade saker än att skriva in saker som läses upp på tv. Public service skulle också kunna se till att alla officiella bilder gjordes tillgängliga  så att även om det finns frivilliga som vill lägga timmar och energi på att fotografera så skulle arbete kunna slippa dubbleras.  Redundansen skulle kunna vara en del av det normala arbetsflödet, att inte bara förlita sig på de system som finns i huset, utan även dra nytta av de öppna och allmännyttiga system som finns parallellt. Det är inga stora insatser som krävs, och om det gjordes kontinuerligt så skulle det finnas mycket mer rikt innehåll tillgängligt, inte bara för oss svenskar utan för hela världen.

Om man tycker att Melodifestivalen är lite banalt så kan samma tankar appliceras på till exempel nyhetsrapportering eller allt material från Kunskapskanalen.

Bruten trend

Jag gissade för någon vecka sedan på hur besökarstatistiken på Wikipedia skulle utveckla sig, baserat på förra årets statistik. Det blev dock helt fel. Det var många fler som besökte sidan om Melodifestivalen vid tiden för tredje deltävlingen än förra året och dessutom fler än för den andra deltävlingen i år. Även den fjärde deltävlingen var det mycket fler än förra året. Vad det här beror på är mycket svårt att gissa sig till, men jag som har följt twitterflödet för #mel2011 kan ju säga att aktiviteten på nätet under den här tiden är hög. Antagligen har det här blivit ett komplement till tv-soffans samtal. Inte bara sitter man tillsammans och pratar, man når även samtidigt alla sina andra vänner. Och om aktiviteten på Internet ökar i stort är det ju inte så konstigt om den ökar även på Wikipedia.

Melodifestivalen 2011 februariMelodifestivalen 2011 i februari. Data från stats.grok.se

3200 sidvisningar

För ett par veckor sedan skrev jag ett inlägg på Wikimedia Sveriges blogg med en kort rapport av hur Melodifestivalartiklarna på Wikipedia har för sidvisningstatistik och jämförde med förra året. Och det är intressant att se hur väl det här följt över deltävling två också och tiden däremellan. Så därför tänker jag djärvt försöka förutspå att antalet sidvisningar på lördag för artikeln på Wikipedia kommer att bli 3200 stycken. Eller djärvt och djärvt, det skulle egentligen vara mer djärvt att säga att det ska bli något annat.

Wikipedia article traffic statistics Melodifestivalen 2010 och 2011Data från stats.grok.se. Melodifestivalen 2010 i februari 2010, och Melodifestivalen 2011 i februari 2011