Projekt litteratur

classic Classic list List threaded Threaded
1 message Options
Reply | Threaded
Open this post in threaded view
|

Projekt litteratur

Lars Aronsson

Jag fortsätter jobba med mina länkar mellan Projekt Runeberg och
Wikipedia.  Dessutom plockade jag över (med tillåtelse!) en lista
över de 200 mest utlånade författarna vid svenska folkbibliotek
från Sveriges författarfond (SVFF).  Wikipedia har redan artiklar
om nästan alla 200.  Men flera av artiklarna är rätt korta, så jag
införde i listan en markering av artiklarnas nuvarande längd,

http://sv.wikipedia.org/wiki/Wikipedia:Projekt_litteratur/SVFF_mest_utl%C3%A5nade

På en skala från 0 till 10, har jag gjort följande klasser:

  Klass      Längd
    0        0..99    tecken
    1      100..199   tecken
    2      200..399   tecken
    3      400..799   tecken
    4      800..1599  tecken
    5     1600..3199  tecken
    6     3200..6399  tecken
    7     6400..12799 tecken
    8    12800..25599 tecken
    9    25600..51199 tecken
   10    51200 tecken eller längre

Att det blev just 10 klasser beror på att jag hittade färdiga små
stapeldiagram på Wikimedia Commons med lämpliga färger, från rött
för de lägre klasserna, gult och ljusgrönt för dem i mitten och
mörkt grönt för de högsta.

Som synes är det mörkgrönt för 1:an Astrid Lindgren (klass 9,
artikeln är 31044 tecken lång) och mellangrönt för Lasse och Inger
Sandberg, Barbro Lindgren (klass 7) och många andra.  Men på 24:e
plats finns Gunilla Wolde vars artikel bara har 490 tecken och
alltså klass 3, markerat med orange färg.

Är det här en användbar kvalitetsmarkering?  Givetvis är längd
inte detsamma som kvalitet, men alltför korta artiklar är ju ett
hinder för god kvalitet.  Och längden går ju att mäta snabbt och
objektivt, till skillnad från äkta kvalitet.  Jämför med färgerna
och kvalitetsklasserna som föreslogs i oktober 2006 på
http://sv.wikipedia.org/wiki/Wikipedia:Projekt_litteratur

Artiklarnas längder plockar jag fram ur förra veckans databasdump,
som laddas ner från download.wikimedia.org.  Värdena uppdateras
alltså inte omedelbart.  Jag har ett script för själva
uppdateringen, som jag (kanske) kör när det finns en ny dump.


--
  Lars Aronsson ([hidden email])
  Aronsson Datateknik - http://aronsson.se