Kan Wikipedia förutspå resultatet i Melodifestivalens första deltävling?

Det finns en del studier som visar hur man med hjälp av antalet sidvisningar (och i vissa fall antalet redigeringar) på Wikipedia kan förutspå utfallet av olika skeenden. En av de mest kända är hur man kan se om en film kommer att dra in mycket pengar på biograferna. I denna anda gör jag härmed en enkel koll på hur deltagarna i den första deltävlingen står sig inför kvällen. Med hjälp av Wikimedias sidvisnings-API samlade jag in data för de fyra senaste veckorna. Så här har sidvisningarna varierat över den tiden.

Av grafen kan man se spikar för Pernilla Andersson, Ace Wilder och de senaste dagarna Anna Book. Mimi Werner har ingen artikel och kommer inte med i grafen alls. En joker? En klurighet dock: värdena för Albin & Mattias är från deras respektive sida som jag har summerat ihop. Samir & Viktor har däremot dels en sida som duo, dels en varsin sida, men här har jag bara tagit med data från sidan för duon. Vill ni kika mer noggrant på hur jag har räknat ut det är kan ni kolla direkt i mitt kalkylark.

Gör man en summering visar sig följande resultat.

Om metoden håller skulle alltså Anna Book vinna ikväll och Pernilla Andersson blir tvåa.

Uppdatering: Jag som lever under en sten (eller snarare har varit på kurs de senaste två dagarna) har ju missat att Anna Book blivit diskad. Då borde Pernilla Andersson ta hem det, och Ace Wilder bli två.

Uppdatering 2: Pernilla Andersson blev sist. Metoden är tydligen inte tillämpbar i Melodifestivalsammanhang.

10 år som Wikimedian

Idag för exakt tio år sedan gjorde jag min första redigering på Wikipedia. Men det var en liten stund efter att jag först hade laddat upp en bild på Wikimedia Commons. Det var min första redigering överhuvudtaget. Ingen höjdarbild, men bättre än ingen alls och vid tillfället det enda moderna fotot på Karlstad domkyrka.

Min första uppladdade bild.

Och med tiden blev det fler redigeringar. Jag har nu gjort cirka 12 000 på svenskspråkiga Wikipedia (ganska precis 100 per månad i snitt), laddat upp drygt 2 000 bilder till Wikimedia Commons och är ansvarig för över 340 000 redigeringar på Wikidata. Bara för att jag slutade som verksamhetschef på Wikimedia Sverige kommer jag alltså inte sluta att vara en wikimedian. Det är förmodligen också så att jag i mitt nya företag kommer att komma i kontakt med de plattformar som finns under Wikimedias paraply. Så tack för tio fina år, nu ser vi fram mot minst lika många till!

Antal uppladdade filer till Wikimedia Commons per månad.
Antal uppladdade filer till Wikimedia Commons per månad.

Topp 100 på svenskspråkiga Wikipedia 2015-2013

De senaste tre åren har Johan Gunnarsson producerat topp-100 listor på mest besökta sidor. Eftersom att de har funnits ett par år tänkte jag att det skulle vara intressant att se utvecklingen över tid. Så med hjälp av data från 2013, 2014 och 2015 gjorde jag en sammanställning (vars uträkning du kan granska här). Det visade sig att samma artikel har toppat listan varje år, att 54 artiklar har funnits på topp-100 alla tre år och att totalt 174 artiklar har varit på topplistan minst en gång.

Totalplacering Artikel 2015 2014 2013
1 Sverige 1 1 1
2 USA 4 3 6
3 Zlatan Ibrahimović 11 4 2
4 Stockholm 5 5 9
5 Andra världskriget 6 8 10
6 Islam 9 15 11
7 Lista över svenska idiomatiska uttryck 12 13 21
8 Tyskland 16 9 22
9 Adolf Hitler 18 20 13
10 Wikipedia 10 18 25
11 Första världskriget 23 12 26
12 Hinduism 25 22 20
13 Australien 26 31 17
14 Frankrike 22 26 37
15 Lista över förkortningar 15 30 41
16 Buddhism 31 34 24
17 Finland 21 24 46
18 Ryssland 24 14 54
19 Johan Falk (filmer) 2 87 4
19 Norge 19 32 42
19 Lista över Disneyfilmer 38 17 38
22 Svenska 14 27 55
23 Astrid Lindgren 8 28 61
24 Gustav Vasa 20 46 34
25 Storbritannien 27 33 43
26 Judendom 39 39 29
27 Game of Thrones 59 16 45
28 Carl XVI Gustaf 29 54 40
29 Harry Potter 53 40 33
30 Avicii 91 23 14
31 Göteborg 33 25 71
32 Italien 28 53 50
32 Kina 32 36 63
34 Spanien 30 44 58
35 Europa 43 42 51
36 Turkiet 51 56 32
37 Kristendom 50 52 48
38 Indien 36 41 76
39 Bipolär sjukdom 76 55 27
40 Island 37 61 64
41 Schweiz 34 62 70
42 Jorden 56 99 15
43 Danmark 44 63 72
44 Facebook 84 65 31
45 Kanada 60 29 96
46 James Bond 49 85 57
47 Franska revolutionen 47 80 65
48 Landskap i Sverige 54 64 77
49 August Strindberg 61 76 62
50 Lista över svenska ordspråk 48 67 94
51 Feminism 85 37 98
52 Medeltiden 57 75 89
53 Periodiska systemet 78 58 86
54 New York 79 92 67
55 Lista över Sveriges tätorter 13 21
56 Islamiska staten 7 60
57 Sverigedemokraterna 73 10
58 Monica Zetterlund 38 56
59 Aspergers syndrom 82 18
60 Selma Lagerlöf 74 39
60 Nelson Mandela 97 16
62 Pappersformat 41 89
63 Wiki 94 49
64 Youtube 66 82
65 Lista över latinska ordspråk och talesätt 90 60
66 Star Wars 63 92
66 Europeiska unionen 68 88
68 Japan 58 100
69 Nato 90 70
70 Leonardo da Vinci 92 87
71 Sydafrika 87 97
72 Israel 99 91
73 Ebolavirus 2
74 Martin Beck (filmer) 3
74 Yohio 3
76 Justin Bieber 5
77 Ukraina 6
78 Riksdagsvalet i Sverige 2014 7
78 Kurt Wallander (filmer) 7
80 Uniform 8
81 Geografiska koordinatsystem 11
82 One Direction 12
83 Avlidna 2015 17
84 Världsmästerskapet i fotboll 2014 19
84 Eurovision Song Contest 2013 19
86 Melodifestivalen 2013 23
87 Paul Sandberg 28
88 Johan Falk 30
89 12-timmarsklocka 35
89 Moderaterna 35
89 Cristiano Ronaldo 35
92 Miley Cyrus 36
93 Eurovision Song Contest 2015 40
94 Syrien 42
95 Olympiska vinterspelen 2014 43
96 Nordkorea 44
97 Upplysningstiden 45
97 Arkeologi 45
99 Ingångssida 46
100 Krim 47
100 Zara Larsson 47
102 Socialdemokraterna (Sverige) 48
103 Fascism 49
104 Vatten 50
105 Brasilien 51
106 Stephen Hawking 52
106 Lionel Messi 52
108 London 53
109 Karl XII 55
110 Ungdom med uppgift 57
111 Eurovision Song Contest 2014 59
111 Borderline 59
113 Renässansen 62
114 Grekland 64
115 Carl von Linné 65
116 Arne Andersson (moderat politiker) 66
116 Michael Jackson 66
118 Skåne 67
119 Avlidna 2014 68
119 Sommartid 68
121 Densitet 69
121 Demokrati 69
121 Cannabis 69
124 11 september-attackerna 70
125 Telefonförsäljning 71
125 Anna Kinberg Batra 71
127 Industriella revolutionen 72
127 Vänsterpartiet 72
129 Stefan Löfven 73
129 Kap Verde 73
131 Ace Wilder 74
131 Politisk uniform 74
133 Syriska inbördeskriget 75
133 Olof Palme 75
135 Sovjetunionen 77
135 Liberalism 77
137 Jimmie Åkesson 78
137 Jesus 78
139 Amyotrofisk lateralskleros 79
139 ADHD 79
141 Sveriges län 80
141 Pippi Långstrump 80
143 Belgien 81
143 Fredrik Reinfeldt 81
143 Autism 81
146 Polen 82
147 Landsnummer 83
147 Världsmästerskapet i fotboll 83
147 Abba 83
150 Jordbruk 84
150 Rihanna 84
152 Stress 85
153 Ø 86
153 Allmoge 86
155 Romerska riket 88
155 W 88
157 Nationalism 89
158 Cornelis Vreeswijk 90
159 Bitcoin 91
160 Måns Zelmerlöw 93
160 Conchita Wurst 93
162 Illuminati 93
163 Romantiken 94
164 Soliditet 95
164 Grekisk mytologi 95
164 Thailand 95
167 Kultur 96
167 Religion 96
169 William Shakespeare 97
170 Pablo Escobar 98
170 Socialism 98
172 Barcelona 99
173 Iran 100
173 Melodifestivalen 2014 100

För den sammanställda rangordniningen har jag alltså valt att prioritera de som har funnits med på listan flera år, vilket gör att till exempel Ebolavirus hamnar långt ner trots att det var den näst mest besökta artikeln 2014. Det går ju såklart att prioritera på andra sätt också, gör ni en egen variant så hör gärna av er, det skulle vara intressant att se. Här tar jag heller inte hänsyn till de absoluta besökarsiffrorna, gör man en sådan sammanställning kommer det säkert att skilja sig på ett par ställen.

Resultat för Melodifestivalen om det hade varit upp till Wikipedias läsare

Emanuel Karlsten levererade en prediktion mitt under Melodifestvalen baserat på en spaning från Spotify, Youtube och Googlesökningar.  Där blev hans etta, tvåa, trea och fyra: Ace Wilder, Sanne Nielsen, Linus Svenning och Panetoz.

Om man tittar på sidvisningarna på Wikipedia för de respektive artisterna de senaste 30 dagarna, till och med fredagen 7 mars blev ställningen så här:

Ace Wilder 30696
Sanna Nielsen 15662
Oscar Zia 10863
Yohio 8915
Anton Ewald 8318
Panetoz 7496
Linus Svenning 6345
Helena Paparizou 1046
Alcazar 720
Ellen Benediktsson 23

Lite skillnad jämfört med de andra tre tjänsterna alltså. Och båda skiljer sig en del mot slutresultatet, framförallt på de lägre nivåerna. Båda var dock helt fel ute med att ha missat Alcazar helt, men det är kanske ändå inte kvällens största skräll. Alla datapunkterna placerade Ace Wilder långt före Sanna Nielsen, men den lilla skillnaden på enstaka procentenheter i telefonröstningen räckte till att Nielsen skulle hamna minimalt före Wilder och blev alltså vinnare!

Ny och populär

På Wikipedia finns en del olika tävlingar som gör det lite roligare att spendera sin fritid på att skriva ett uppslagsverk. En av dem är Veckans tävling, den som jag gillar bäst eftersom att den varierar hela tiden. Faktum är att det inte finns någon fast form alls utan det är helt upp till tävlingsledaren att bestämma hur den ska gå till.
Den här veckan är jag tävlingsledare.
Tävlingen går till på följande sätt: du skriver en ny artikel i valfritt ämne och i slutet av veckan räknas antalet sidvisningar ihop. Den med flest vinner! Ganska enkelt alltså. Så ta en titt i spåkulan och skriv om något du tror kommer att bli eftersökt i veckan eller gör dig redo att snabbt skriva när det händer något stort.

Bruten trend

Jag gissade för någon vecka sedan på hur besökarstatistiken på Wikipedia skulle utveckla sig, baserat på förra årets statistik. Det blev dock helt fel. Det var många fler som besökte sidan om Melodifestivalen vid tiden för tredje deltävlingen än förra året och dessutom fler än för den andra deltävlingen i år. Även den fjärde deltävlingen var det mycket fler än förra året. Vad det här beror på är mycket svårt att gissa sig till, men jag som har följt twitterflödet för #mel2011 kan ju säga att aktiviteten på nätet under den här tiden är hög. Antagligen har det här blivit ett komplement till tv-soffans samtal. Inte bara sitter man tillsammans och pratar, man når även samtidigt alla sina andra vänner. Och om aktiviteten på Internet ökar i stort är det ju inte så konstigt om den ökar även på Wikipedia.

Melodifestivalen 2011 februariMelodifestivalen 2011 i februari. Data från stats.grok.se

3200 sidvisningar

För ett par veckor sedan skrev jag ett inlägg på Wikimedia Sveriges blogg med en kort rapport av hur Melodifestivalartiklarna på Wikipedia har för sidvisningstatistik och jämförde med förra året. Och det är intressant att se hur väl det här följt över deltävling två också och tiden däremellan. Så därför tänker jag djärvt försöka förutspå att antalet sidvisningar på lördag för artikeln på Wikipedia kommer att bli 3200 stycken. Eller djärvt och djärvt, det skulle egentligen vara mer djärvt att säga att det ska bli något annat.

Wikipedia article traffic statistics Melodifestivalen 2010 och 2011Data från stats.grok.se. Melodifestivalen 2010 i februari 2010, och Melodifestivalen 2011 i februari 2011

1% av Sveriges befolkning

Efter att felaktigt ha förutspått den 29 december (mha tillgänglig statistik) som datum passerades 92 488 användare istället 30 december kl 21.53.

Jaha, vadan denna udda observation?

Enligt SCB har Sverige just nu 9 248 805 invånare. Det vill säga att ett antal motsvarande 1 % av Sveriges invånare då har ett konto på Wikipedia. Nu vet ju vi att detta inte är nödvändigtvis sant, samma person kan ju ha flera konton. Det betyder inte heller att 1 % av Sveriges invånare har skapat konto på Wikipedia många konton är så kallade SUL-konton (Single Unified Login) vilka skapas automatiskt till inloggade användare från andra språkversioner som besöker den svenska.

Siffran är dock ändå intressant då den tyder på en stor spridning i samhället. För Wikipedia som projekt är den positiva utvecklingen mycket viktig då kvaliteten höjs ju fler personer som granskar det som skrivs.

Hur ser statistiken ut för andra språk/länder?

Det finns ju en lista med artiklar per talare men ingen motsvarande med antal användare per talare. Jag har gjort en sammanställning över olika språk som dock får tas med en stor nypa salt då sättet man räknar talare av ett språk ingalunda är bra definierat. Den visar att av de nordiska länderna är svenska sämst men jämfört med andra länder är de nordiska väldigt långt framme. Detta skulle mycket väl kunna bero på en större andel SUL-konton, då antalet användare från andra språk blir mer synliga för språk med färre antal talare.

Användare efter språk på olika Wikipedior
Användare efter språk på olika Wikipedior. Bildlicens: CC-BY-SA-3.0
Bild: Desainali Bildlicens: CC-BY-SA-3.0

Och innan ni påpekar det, i grafen ser det ut som om svenska har mindre än 1 % och det beror på att jag har använt den uppskattade siffran för antalet talare av språket, vilket är större än antalet invånare (svensktalande i Finland och Åland står för den större delen).

Användare 92 489 blev [[Användare:Akew]]

Detta är ett överflyttat inlägg från desainali.com och publicerades där 30 december 2008. Detta inlägg är en del av migreringen över till min personliga hemsida.