
Wprowadzenie
Cele lekcji
W tej lekcji poznamy projekt Wikimedia Commons i GLAM-Wiki oraz niektóre narzędzia statystyczne udostępniane przez Wikipedię:
- Wikimedia Commons to repozytorium zbiorów audiowizualnych, wykorzystywanych w projektach wikipedystycznych. Wszystkie zasoby Wikimedia Commons są dostępne na zasadach pozwalających na ich swobodne wykorzystanie, nie tylko w działaniach edukacyjnych,
- GLAM-Wiki to inicjatywa, w ramach której galerie, biblioteki, archiwa i muzea współpracują z społecznością Wikipedii, aby udostępniać swoje zbiory w Wikimedia Commons. Są one następnie wykorzystywane przez edytorów i edytorki Wikipedii do tworzenia i uzupełniania haseł, niekiedy przy pomocy osób ze współpracujących instytucji (zob. projekt zrealizowany przez Muzeum Narodowe w Warszawie Muzeum Narodowe w Warszawie/Faras),
- Wikimedia Statistics to narzędzie prezentacji ogólnych danych na temat Wikipedii i siostrzanych projektów,
- Wikipedia udostępnia też narzędzie pokazujące liczbę odsłon wybranych artykułów w czasie, umożliwiające także tworzenie porównań: pageviews.wmcloud.org,
- Istnieją także narzędzia przygotowane specjalnie dla projektów GLAM-Wiki: glamtools.toolforge.org/glamorous/ i glamtools.toolforge.org/baglama2/. Warto zwrócić uwagę, że system Wikipedii i projektów siostrzanych wspierają budowane niezależnie programy i aplikacje, jednak ich wiarygodność i stabilność może być różna,
- Przydatne może być narzędzie pozwalające sprawdzić, jakie strony Wikipedii linkują do interesującego nas hasła: Specjalna:Linkujące.
Dzięki tej lekcji będziemy umieli sprawdzać popularność zbiorów instytucji kultury i dziedzictwa w przestrzeni Wikipedii oraz korzystać z podstawowych narzędzi statystycznych tego systemu. Publikowanie w Wikimedia Commons pozwala dotrzeć instytucji do szerokiego grona odbiorców, a dane udostępniane przez narzędzia statystyczne Wikipedii dokumentują to wykorzystanie.
W raporcie z 2019 roku możemy przeczytać, że udostępnianie zbiorów instytucji na Wikimedia Commons nie przekłada się na wzrost odwiedzin witryn tych instytucji, ale zwiększa wykorzystanie jej zbiorów także poza przestrzenią Wikipedii.
Efekty
- wiedza o inicjatywie GLAM-Wiki,
- umiejętność korzystania z podstawowych narzędzi statystycznych Wikipedii i siostrzanych projektów.
Wymagania
Dostęp do internetu, przeglądarka. Realizacja lekcji nie wymaga programowania.
Część merytoryczna
Wikipedia to darmowa, otwarta encyklopedia internetowa, powstała dzięki pracy tysięcy edytorów i edytorek. Dzięki swojej łatwej dostępności i szerokiemu zakresowi tematycznemu, Wikipedia stała się jednym z najpopularniejszych globalnych źródeł wiedzy. Obok Wikipedii rozwijane są projekty siostrzane, takie jak Wikimedia Commons, Wikisłownik, Wikicytaty czy Wikibooks. Wikimedia Commons jest platformą przechowującą zbiory audiowizualne, które są wykorzystywane w różnych projektach związanych z Wikipedią.
To właśnie tym wikiserwisem mogą zainteresować się instytucje kultury i dziedzictwa, posiadające zdigitalizowane zbiory i chętne do dzielenia się nimi. To dzielenie się musi zapewniać odbiorcom maksymalne prawa do wykorzystania cyfrowych reprodukcji, określane przez dwie licencje Creative Commons (CC BY lub CC BY-SA) lub zasady domeny publicznej. Udostępnione w Wikimedia Commons zbiory mogą być wykorzystywane jako ilustracje haseł Wikipedii oraz w projektach i działaniach także poza Wikipedią.
Faras na Wikipedii
Oczywiście udostępnianie zbiorów na Commons nie jest jedynym sposobem współpracy instytucji z Wikipedią. W wikiprojekcie Faras z 2016 wspólna praca polegała także na merytorycznym opracowywaniu i uzupełnianiu haseł oraz ich tłumaczeniu.
Jedna z najpopularniejszych reprodukcji cyfrowych ze zbioru Faras - wizerunek św. Anny Autor nieznany, św. Anna - fragment postaci. Malowidło ścienne.jpg - została użyta w hasłach publikowanych na wielu językowych wersjach Wikipedii Special:GlobalUsage. Takie informacje mogą być wstępem do dalszego badania jakościowego: kto korzysta z zasobów, jakie udostępniamy na Wikipedii jako instytucja? Czego dotyczą ilustrowane nimi hasła?
Bardzo wartościowym narzędziem statystycznym dla infrastruktury Wikipedii jest przeglądarka liczby odsłon Pageviews Analysis. Po wejściu na stronę tego narzędzia możemy zobaczyć przykład prostego porównania między popularnością haseł dog i cat dla angielskiej Wikipedii (en.wikipedia.org). Po lewej stronie znajdują się filtry, ułatwiające konstruowanie wykresu - podajemy tam zakres dat, dla którego chcemy przeprowadzić analizę, możemy też odfiltrować odwiedziny botów czy wyświetlenia na urządzeniach mobilnych.
Przeglądarka liczby odsłon
Sprawdźmy najpierw, jak popularne było hasło Faras, którego dużą część stanowi opis polskiego stanowiska archeologicznego oraz Galerii Faras w Muzeum Narodowym w Warszawoe. Hasło ilustrowane jest także wspomnianą wyżej reprodukcją malowidła ściennego przedstawiającą św. Annę. Aby zobaczyć statystyki dotyczące tego hasła, musimy:
- w polu Projekt zmienić angielską na polską Wikipedię (pl.wikipedia.org);
- zmieńmy też typ daty na miesięczne i zaznaczmy zakres ostatniego roku (1 stycznia 2023 - 31 grudnia 2023);
- w polu Strony wpiszmy tytuł hasła (Faras) - system powinien podpowiedzieć nam ten tytuł po wpisaniu pierwszych liter.
Wygenerowany wykres Pageviews Analysis podliczy nam też wszystkie odsłony. W 2023 roku hasło poświęcone Faras w polskiej Wikipedii wyświetlano prawie 4 tys. razy. Otrzymujemy także informację (widoczną po prawej stronie wykresu), że w tym czasie nad hasłem pracowało dwóch edytorów i zostało zmienione dwukrotnie. To dane gotowe do umieszczenia i odpowiedniego skomentowania w ewentualnym raporcie poświęconym aktywności muzeum na Wikipedii.
Wróćmy jeszcze do grafiki ze św. Anną. Narzędzie do wyświetlania statystyk oglądalności pozwoli nam także na sprawdzenie, jak często była wyświetlana strona tego pliku. Nie jest to oczywiście pełna informacja o jego widoczności na Wikipedii. Aby ją wyliczyć, należałoby zsumować wyświetlenia strony pliku (na Wikimedia Commons) oraz wyświetlenia wszystkich stron, w których jest on wykorzystywany.
Żeby sprawdzić popularność strony grafiki ze św. Anną, musimy:
- w menu na samej górze strony wybrać opcję Więcej → Wyświetlenia multimediów,
- zmienić ustawienia w polu Projekt (wpisujemy commons.wikimedia.org),
- w polu Pliki wprowadzić tytuł strony interesującego nas pliku: Autor nieznany, św. Anna - fragment postaci. Malowidło ścienne.jpg (system powinien sam podpowiedzieć ten tytuł po wpisaniu jego pierwszych liter).
Między styczniem a grudniem 2023 roku strona z wizerunkiem św. Anny została wyświetlona ponad 180 tys. razy.
Wszystkie dane zbierane przez narzędzie statystyki odsłon są dostępne także jako pliki CSV czy JSON, a wykres jako PNG.
Ogólne dane o Wikipedii
Do raportu - na przykład do jego wstępnego rozdziału - przydałyby się nam także pewne ogólne dane dotyczące Wikipedii. Dane takie udostępnia strona Wikimedia Statistics. Po wejściu na stronę wybierzmy od razu polską Wikipedię (w polu w prawej górnej części strony wybierzmy pl.wikipedia.org).
Jak widać, w zeszłym roku polska Wikipedia w samym tylko grudniu uzyskała ponad 326 mln odsłon. Po kliknięciu w okienko z tą informacją uzyskujemy dostęp do pełnych danych za cały 2023 rok. To łącznie ponad 8 miliardów odsłon!
Ciekawe, że (jak widać to po statystykach) poza Polską polskojęzyczna Wikipedia czytana jest chętniej w Niemczech. Dane pozwalają na wygenerowanie prostej wizualizacji na mapie.
Podsumowanie
Pokazane wyżej narzędzia statystyczne pozwalają na przygotowanie raportu na temat wykorzystania zbiorów instytucji w przestrzeni Wikipedii i jej siostrzanych projektów. Poza informacjami o tym, gdzie i w jaki sposób wykorzystuje się w przestrzeni Wikipedii grafiki udostępniane w ramach działań GLAM-Wiki, można skorzystać z danych o odsłonach tych artykułów i stron. Dzięki takim narzędziom Wikipedia może być traktowana jako przejrzysty system publikowania zbiorów cyfrowych instytucji kultury i dziedzictwa: nie tylko jasne są reguły publikacji (status prawnoautorski), ale też dane dotyczące ich wykorzystania.
Wykorzystanie metod
W pracach naukowych wykorzystuje się dane statystyczne Wikipedii, m.in.
- do analizy trendów, poprzez badanie zmian popularności (liczby odsłon) określonego hasła lub liczby jego edycji,
- do badań nad językiem haseł, sposobem przedstawiania określonych tematów czy porównywania treści tych samych haseł w różnych językach,
- do badań nad społecznością Wikipedii i siostrzanych projektów, w tym badań nad tym, jak w ramach wspólnej pracy kształtowane są treści haseł,
- do badań stronniczości i uprzedzeń w treści haseł i ich zakresie tematycznym.
W projektach warsztatowych czy podczas zajęć dydaktycznych narzędzia statystyczne Wikipedii wykorzystać można m.in.:
- do ilustrowania struktury społeczności Wikipedii oraz dokumentowania jej aktywności,
- do odkrywania, w jaki sposób wydarzenia polityczne czy społeczne odbijają się w popularności haseł Wikipedii oraz intensywności ich edycji,
- jako źródła danych do ćwiczeń z analizy i wizualizacji danych.
Pomysł na warsztat
Zaproś uczestników do zanalizowania haseł poświęconych wybranym osobom z historii Polski XX wieku. Niech każdy z uczestników pozyska dane o popularności tych haseł (liczbie odsłon), liczbie edytorów i edycji, powiązanych z nimi multimediach. W trakcie warsztatów warto zwrócić uwagę na relację popularności haseł Wikipedii do treści szkolnej edukacji historycznej czy tematyki świąt państwowych (określone trendy zmiany liczby odsłon w ciągu roku). Warto zwrócić uwagę na miejsce kobiet wśród tych postaci, także w kontekście braku odpowiedniej reprezentatywności kobiet w przestrzeni Wikipedii. Można w tym celu skorzystać z narzędzia Humaniki, dokumentującego liczbę haseł poświęconych kobietom i mężczyznom w poszczególnych wersjach językowych Wikipedii, artykułu naukowego Ms. Categorized: Gender, notability, and inequality on Wikipedia oraz artykułu Why didn’t Wikipedia have an article on Donna Strickland, winner of a Nobel Prize?.