Topp 100 på svenskspråkiga Wikipedia 2015-2013

De senaste tre åren har Johan Gunnarsson producerat topp-100 listor på mest besökta sidor. Eftersom att de har funnits ett par år tänkte jag att det skulle vara intressant att se utvecklingen över tid. Så med hjälp av data från 2013, 2014 och 2015 gjorde jag en sammanställning (vars uträkning du kan granska här). Det visade sig att samma artikel har toppat listan varje år, att 54 artiklar har funnits på topp-100 alla tre år och att totalt 174 artiklar har varit på topplistan minst en gång.

Totalplacering Artikel 2015 2014 2013
1 Sverige 1 1 1
2 USA 4 3 6
3 Zlatan Ibrahimović 11 4 2
4 Stockholm 5 5 9
5 Andra världskriget 6 8 10
6 Islam 9 15 11
7 Lista över svenska idiomatiska uttryck 12 13 21
8 Tyskland 16 9 22
9 Adolf Hitler 18 20 13
10 Wikipedia 10 18 25
11 Första världskriget 23 12 26
12 Hinduism 25 22 20
13 Australien 26 31 17
14 Frankrike 22 26 37
15 Lista över förkortningar 15 30 41
16 Buddhism 31 34 24
17 Finland 21 24 46
18 Ryssland 24 14 54
19 Johan Falk (filmer) 2 87 4
19 Norge 19 32 42
19 Lista över Disneyfilmer 38 17 38
22 Svenska 14 27 55
23 Astrid Lindgren 8 28 61
24 Gustav Vasa 20 46 34
25 Storbritannien 27 33 43
26 Judendom 39 39 29
27 Game of Thrones 59 16 45
28 Carl XVI Gustaf 29 54 40
29 Harry Potter 53 40 33
30 Avicii 91 23 14
31 Göteborg 33 25 71
32 Italien 28 53 50
32 Kina 32 36 63
34 Spanien 30 44 58
35 Europa 43 42 51
36 Turkiet 51 56 32
37 Kristendom 50 52 48
38 Indien 36 41 76
39 Bipolär sjukdom 76 55 27
40 Island 37 61 64
41 Schweiz 34 62 70
42 Jorden 56 99 15
43 Danmark 44 63 72
44 Facebook 84 65 31
45 Kanada 60 29 96
46 James Bond 49 85 57
47 Franska revolutionen 47 80 65
48 Landskap i Sverige 54 64 77
49 August Strindberg 61 76 62
50 Lista över svenska ordspråk 48 67 94
51 Feminism 85 37 98
52 Medeltiden 57 75 89
53 Periodiska systemet 78 58 86
54 New York 79 92 67
55 Lista över Sveriges tätorter 13 21
56 Islamiska staten 7 60
57 Sverigedemokraterna 73 10
58 Monica Zetterlund 38 56
59 Aspergers syndrom 82 18
60 Selma Lagerlöf 74 39
60 Nelson Mandela 97 16
62 Pappersformat 41 89
63 Wiki 94 49
64 Youtube 66 82
65 Lista över latinska ordspråk och talesätt 90 60
66 Star Wars 63 92
66 Europeiska unionen 68 88
68 Japan 58 100
69 Nato 90 70
70 Leonardo da Vinci 92 87
71 Sydafrika 87 97
72 Israel 99 91
73 Ebolavirus 2
74 Martin Beck (filmer) 3
74 Yohio 3
76 Justin Bieber 5
77 Ukraina 6
78 Riksdagsvalet i Sverige 2014 7
78 Kurt Wallander (filmer) 7
80 Uniform 8
81 Geografiska koordinatsystem 11
82 One Direction 12
83 Avlidna 2015 17
84 Världsmästerskapet i fotboll 2014 19
84 Eurovision Song Contest 2013 19
86 Melodifestivalen 2013 23
87 Paul Sandberg 28
88 Johan Falk 30
89 12-timmarsklocka 35
89 Moderaterna 35
89 Cristiano Ronaldo 35
92 Miley Cyrus 36
93 Eurovision Song Contest 2015 40
94 Syrien 42
95 Olympiska vinterspelen 2014 43
96 Nordkorea 44
97 Upplysningstiden 45
97 Arkeologi 45
99 Ingångssida 46
100 Krim 47
100 Zara Larsson 47
102 Socialdemokraterna (Sverige) 48
103 Fascism 49
104 Vatten 50
105 Brasilien 51
106 Stephen Hawking 52
106 Lionel Messi 52
108 London 53
109 Karl XII 55
110 Ungdom med uppgift 57
111 Eurovision Song Contest 2014 59
111 Borderline 59
113 Renässansen 62
114 Grekland 64
115 Carl von Linné 65
116 Arne Andersson (moderat politiker) 66
116 Michael Jackson 66
118 Skåne 67
119 Avlidna 2014 68
119 Sommartid 68
121 Densitet 69
121 Demokrati 69
121 Cannabis 69
124 11 september-attackerna 70
125 Telefonförsäljning 71
125 Anna Kinberg Batra 71
127 Industriella revolutionen 72
127 Vänsterpartiet 72
129 Stefan Löfven 73
129 Kap Verde 73
131 Ace Wilder 74
131 Politisk uniform 74
133 Syriska inbördeskriget 75
133 Olof Palme 75
135 Sovjetunionen 77
135 Liberalism 77
137 Jimmie Åkesson 78
137 Jesus 78
139 Amyotrofisk lateralskleros 79
139 ADHD 79
141 Sveriges län 80
141 Pippi Långstrump 80
143 Belgien 81
143 Fredrik Reinfeldt 81
143 Autism 81
146 Polen 82
147 Landsnummer 83
147 Världsmästerskapet i fotboll 83
147 Abba 83
150 Jordbruk 84
150 Rihanna 84
152 Stress 85
153 Ø 86
153 Allmoge 86
155 Romerska riket 88
155 W 88
157 Nationalism 89
158 Cornelis Vreeswijk 90
159 Bitcoin 91
160 Måns Zelmerlöw 93
160 Conchita Wurst 93
162 Illuminati 93
163 Romantiken 94
164 Soliditet 95
164 Grekisk mytologi 95
164 Thailand 95
167 Kultur 96
167 Religion 96
169 William Shakespeare 97
170 Pablo Escobar 98
170 Socialism 98
172 Barcelona 99
173 Iran 100
173 Melodifestivalen 2014 100

För den sammanställda rangordniningen har jag alltså valt att prioritera de som har funnits med på listan flera år, vilket gör att till exempel Ebolavirus hamnar långt ner trots att det var den näst mest besökta artikeln 2014. Det går ju såklart att prioritera på andra sätt också, gör ni en egen variant så hör gärna av er, det skulle vara intressant att se. Här tar jag heller inte hänsyn till de absoluta besökarsiffrorna, gör man en sådan sammanställning kommer det säkert att skilja sig på ett par ställen.

Nya sidor på Wikipedia

NyaWikisÄnnu ett litet hobbyprojekt från min sida för att göra det lite tydligare vad som händer på Wikipedia. Det har ju alltid varit möjligt att följa vilka nya sidor som skapas (det finns till och med ett RSS-flöde för det). Men det är inte lätt att hitta dit. Så för att göra det lite lättare så har jag med hjälp av IFTTT satt upp ett twitterkonto som skickar ut en tweet när det skapas en artikel och berättar vem som har gjort den och med en länk. Twitterkontot hittar du på @NyWikipediasida.

Följer du denna kan du hinna se artiklar innan de raderas av olika skäl. Varje dag skapas cirka 200-400 artiklar men bara ungefär hälften finns kvar vid dagens slut. Det är mest rent trams som raderas men också sådant som förvisso är sant men som inte passar i ett uppslagsverk, vilket är en av grundpelarna i Wikipedia.

Nu är IFTTT lite knepigt, tjänsten verkar bara uppdatera cirka varje kvart och då kommer det tweets för flera artiklar i rad. Vi får se om jag lyckas lösa det på något sätt eller om det kommer att fortsätta att komma i klumpvis form.

 

Wikipedia image quiz – now also in English

I mitt senaste inlägg berättade jag om hur jag skapade ett bildquiz baserat på Wikipedia. Efter att ha spelat det lite grann så är det uppenbart att slumpfunktionen på Wikipedia verkligen fungerar, den levererar nämligen väldigt många artiklar om olika arter. Och det stämmer ju, då svenska Wikipedia i skrivande stund består till ungefär två tredjedelar av sådana artiklar. Det var därför en av idéerna för vidareutveckling var att använda Holgers nya slumpfunktion som filtrerar bort dessa (och då kan det argumenteras för om det ska kallas för slump, men låt gå).  Men i väntan på att lista ut hur jag kan använda den kom jag på e annan enkel idé. I stället för att använda svenska Wikipedia som grund så har jag gjort en variant för engelska. Även om det skulle tillkomma en miljon artartiklar där (i dagsläget har de mycket färre än vad som finns på svenska) så blir det ändå en mycket mindre del då de har över 4,6 miljoner artiklar totalt.

Den engelska varianten hittas på: http://nyval.wtf/quiz/en/

Jag har också lagt till snabbtangenter för att visa svar och ny fråga. På svenska används Alt+v respektive Alt+n (tangentkombinationen kan variera beroende på din webbläsare/operativssystem, hitta din kombination här) och på engelska Alt+s respektive Alt+n.

Wikipedia-bildquiz

I en Facebooktråd om slumpartikelfunktionen på Wikipedia och en ny variant som Holger Motzkau har byggt så kom David Castor med en idé om ett frågesportspel baserat på slumpartiklarna. Hans idé var:

Jag gjorde häromsistens en frågesport där jag visade en bild från en slumpmässig och namnen på den och tre slumpartiklar till. Sedan skulle deltagarna gissa från vilken av de fyra artiklarna som bilden var hämtad.

Det tänkte jag kunde vara något för mig att använda som exempel, jag har ju tidigare testat lite med att programmera i PHP och jag har en ganska bra koll på Wikipedias API. Sagt och gjort, jag hackade på lite och nu finns det en färdig prototyp. Inga finesser, bara en enkel frågesport. Den bygger på att man kan fråga API:et efter slumpade artiklar och att man kan begära bilder från dessa. Jag gör dessutom en dubbelkoll så att inte samma bild används två gånger. En utmärkt hjälp till utvecklingen var API-sandlådan på Wikipedia. (I min kod har jag konsekvent använt mig av pageid istället för title på artiklarna som i exemplen nedan, detta för att jag i PHP inte lyckades få mellanslag i artikelnamn att hanteras på rätt sätt, men principen är ju densamma.)

Slumpade artiklar

Detta görs med kommandot action=query&list=random I mitt fall begär jag dessutom fyra bilder på en gång. Detta är den exakta frågan jag använder: https://sv.wikipedia.org/w/api.php?action=query&list=random&format=json&rnnamespace=0&rnlimit=4

Hämta bilder

Detta görs med kommandot action=query&prop=pageimages Jag passar dessutom på att i samma anrop begära rätt bildstorlek som jag senare kan använda när jag skapar sidan. Här en hårdkodad variant på anropet (jag använder ju egentligen resultatet från slumpartiklarna):
https://sv.wikipedia.org/w/api.php?action=query&prop=pageimages&format=json&piprop=thumbnail%7Cname&pithumbsize=400&pilimit=4&titles=Stj%C3%A4rtand%7CAnka%7CSn%C3%B6%7CMonotypisk
Hittas inga bilder i någon av de fyra artiklarna begär jag fyra nya slumpartiklar. Under mina testomgångar behövde jag aldrig göra detta mer än en gång, men teoretiskt sett så kan detta ta en stund om man har otur med slumpartiklarna.

Kontrollera dubbletter

Jag väljer helt enkelt en bild från föregående omgång och kolla om den finns i någon av de andra artiklarna. Detta kan göras med kommandot action=query&prop=images och att skicka med en bild och artiklarna som ska kollas som parametrar. Här en hårdkodad variant på anropet: https://sv.wikipedia.org/w/api.php?action=query&prop=images&format=json&imimages=File%3ANorthern_Pintails_(Male_%26_Female)_I_IMG_0911.jpg&titles=Stj%C3%A4rtand%7CGr%C3%A4sand%7CAnka%7C%C3%84nder
Finns bilden i mer än en artikel gör jag det superlätt för mig och börjar om med fyra nya slumpartiklar. Här skulle man kunna effektivisera det genom att kolla andra bilder i de fyra första artiklarn (om det fanns några).

Kontextualisera

När jag visar svaret hämtar jag även ut det första stycket från Wikipedia så att man kan få ett sammanhang av ämnet. Detta görs med kommandot action=query&prop=extracts Här en hårdkodad variant på anropet: http://sv.wikipedia.org/w/api.php?action=query&prop=extracts&format=json&exintro=&explaintext=&titles=Stj%C3%A4rtand

Resultatet

Det färdiga resultatet hittas på: http://nyval.wtf/bildquiz/

Idéer för utveckling:

  • Poängräknare
  • Använda Holgers slumpgenerator som tar bort de robotskapade artiklarna.

Har du några andra idéer får du gärna höra av dig.

Redigeras det på Wikipedia från Riksdagen?

Jag blev imorse varse om ett konto på Twitter som listar redigeringar som gör från parlamentet i Storbritannien, @parliamentedits. Då det i Twitterbion stod att det gjordes genom IFTTT så förstod jag hur det var uppsatt. Alla redigeringar som görs från en IP-adress går att få som ett RSS-flöde och dessa finns det en kanal för i IFTTT som kan trigga något, till exempel en tweet. Några förfrågningar gav dessutom en lista på IP-adresser som Riksdagen har.

Så efter lite funderande på namn skapade jag kontot @RiksdagWikiEdit på Twitter och ett konto på IFTTT. En stunds knappande med recept och vips så var tjänsten uppe. Nu är det bara att vänta och se vad som händer.

En annan Wikipediaanvändare uppmärksammade också det här och började gräva i historiken för att se vart som har gjorts fram till idag och visar resultatet här.

Skälet till att jag satte upp detta var inte för att förska hitta skandaler, utan mest för att det var lätt och förhoppningsvis får vi se konstruktiva och bra redigeringar. Vi vet ju sedan tidigare att riksdagsledamöter redigerar en del. Och jag tycker att vi kan ställa kravet på transparens på vad som händer.

Kul var också att skaparen av det första kontot, Tom  Scott, som är en av mina favoriter i Youtubekanalen Computerphile såg detta och twittrade det vidare. Skönt med semester helt enkelt så att man hinner göra roliga udda projekt också!

Ny och populär

På Wikipedia finns en del olika tävlingar som gör det lite roligare att spendera sin fritid på att skriva ett uppslagsverk. En av dem är Veckans tävling, den som jag gillar bäst eftersom att den varierar hela tiden. Faktum är att det inte finns någon fast form alls utan det är helt upp till tävlingsledaren att bestämma hur den ska gå till.
Den här veckan är jag tävlingsledare.
Tävlingen går till på följande sätt: du skriver en ny artikel i valfritt ämne och i slutet av veckan räknas antalet sidvisningar ihop. Den med flest vinner! Ganska enkelt alltså. Så ta en titt i spåkulan och skriv om något du tror kommer att bli eftersökt i veckan eller gör dig redo att snabbt skriva när det händer något stort.

Nerdy moment

Okej, jag har alltid erkänt att jag är en nörd. Faktum är att jag tycker att de flesta som är nördar ofta har väldigt mycket att ge. Det skulle inte förvåna mig om de som har varit de stora uppfinnarna och tänkarna genom tiderna skulle ha klassats som nördar med dagens mått.

Så det är därför som jag med glädje ser att Tekniska museet har hängt upp mitt porträtt på väggen i deras Walk of Nerds för mitt stora Wikipedianörderi. Det värmer i hjärtat att få hänga där, i ett museum som inhyser så mycket annat som har gjort gott för mänskligheten.

Frukostföreläsning för Webbstjärnan

Förra veckan hade jag en frukostföreläsning för webbstjärnan. Jag använde mig av samma teknik för presentationen som jag skrivit om tidigare och ni hittar den här:

http://aina.li/webbstjarnan

Kul var att det hela filmades, så ni kan se hela föreläsningen här: