Subskrybuj newsletter o cyfrowej humanistyce i innowacjach w sektorze kultury

Rozpoznajemy trendy dotyczące muzeów z wykorzystaniem Google Trends

Okładka lekcji: dwa koty wspinające się na wykresie liniowym / Źródło: AI

Wprowadzenie

Google Trends to narzędzie, które pozwala analizować popularność określonych fraz wyszukiwania w Google dla wybranego okresu, języka i regionu. Dane o wyszukiwaniach otrzymujemy w postaci relatywnej, co znaczy, że nie mamy dostępu do bezwzględnych wartości, opisujących, ile razy wyszukiwano określone hasło. Zamiast tego Google prezentuje nam szacunki na temat tego, jak często dana fraza była wyszukiwana w stosunku do całkowitej liczby wyszukiwań w wyznaczonym okresie.

Interfejs Google Trends / Źródło: trends.google.com

Google Trends wykorzystywać można w marketingu, badaniach rynkowych i społecznych czy nawet do przewidywania epidemii. My wykorzystamy go do zbadania kilku interesujących trendów związanych z korzystaniem z polskich muzeów. Pamiętajmy, że dane i interpretacje nie mają tu charakteru naukowego, a lekcja jest przede wszystkim ćwiczeniem z podstaw Google Trends.

Cele lekcji

Celem lekcji jest zbadanie, w jaki sposób dane z wyszukiwań mogą uzupełnić naszą wiedzę o funkcjonowaniu muzeów w Polsce. Lekcja jest praktycznym wprowadzeniem do korzystania z Google Trends w badaniach kultury.

Efekty

Efektem naszej pracy będzie zestaw danych oraz wypracowanie kilku tez, które dałoby się rozwinąć w dalszych, szczegółowych badaniach. Praca z Google Trends pozwoli nam też zauważyć poważne ograniczenia tego narzędzia i danych, które udostępnia.

Wymagania

Do skorzystania z lekcji wymagana jest przeglądarka internetowa i ew. arkusz kalkulacyjny lub dostęp do Google Sheets. Może przydać się też ChatGPT (w wersji płatnej).

Część merytoryczna

Pierwsza wersja platformy do analizy wyszukiwań w Google pojawiła się w 2008 roku, dziś to narzędzie wykorzystywane jest nie tylko komercyjnie, ale też w badaniach. Spróbujmy sprawdzić, jak można badać trendy muzealne z wykorzystaniem takich danych. Najpierw jednak musimy poznać zasady, na jakich są one opracowywane.

Relatywna popularność fraz wyszukiwania

Podstawowym błędem w korzystaniu z Google Trends jest traktowanie danych o wyszukiwaniach określonej frazy jako danych bezwzględnych. Metoda przygotowania danych do tej platformy polega na tym, że:

  • po wpisaniu frazy (hasła) wyszukiwania, pobierana jest losowa próbka danych z wyszukiwań Google dla tej frazy, wskazanej lokalizacji i zakresu czasowego. Wszystkie frazy są dodatkowo formatowane przed pobraniem danych o wyszukiwaniach - usuwane są apostrofy i inne znaki specjalne,
  • dane te są następnie przedstawiane jako odsetek wyszukiwań danego terminu w odniesieniu do wszystkich wyszukiwań w wybranym czasie i lokalizacji. Umożliwia to porównywanie różnych fraz wyszukiwania - punkt odniesienia jest zawsze taki sam,
  • tak znormalizowane dane przekształcane są do skali od 1 do 100. Wartość 100 wyznacza maksymalne zainteresowanie wyszukiwaniem dla danego terminu w wybranym czasie i lokalizacji, a wszystkie inne wartości są proporcjonalne względem tego punktu,
  • przy dodaniu nowej frazy wyszukiwania, proces normalizacji i indeksowania jest wykonywany ponownie.

Google nie udostępnia dokładnych liczb wyszukiwania dla żadnych fraz. Konsekwencją takiej metody jest dostęp do czytelnego, intuicyjnego wykresu, w którym można porównać trendy bez niepotrzebnej koncentracji na dokładnych wartościach liczby wyszukiwań. Nawet frazy o skrajnie różnej częstotliwości wyszukiwań mogą być porównywane w jednym zestawieniu - dzięki temu możemy analizować relatywne różnice w zainteresowaniu określonym tematem.

Trendy analizują dane wyszukiwania wyłącznie jeśli fraza lub temat wyszukiwania jest odpowiednio popularny. Frazy z małą liczbą wyszukiwań są wyświetlane na skali jako 0.

Frazy czy tematy?

Google Trends możemy eksplorować za pomocą fraz (haseł) lub tematów. Tematy są bardziej efektywną metodą wyszukiwania, ponieważ umożliwiają rozszerzenie wyników o semantycznie powiązane terminy. Przyładowo, jeśli naszą frazą będzie muzeum sztuki, zwizualizowane dane trendów wyszukiwania ograniczone będą do zapytań zawierających dokładnie te słowa. Wybierając wyszukiwanie tematem, możemy liczyć na dane zebrane dla wielu różnych wariantów zapytań, takich jak art museum, galerie sztuki, także w innych językach (jeśli chcemy przygotować globalną analizę).

Wyszukując frazę, otrzymamy wyniki zawierające dokładnie to słowo, na przykład wyszukiwanie muzeum zwróci dane dla wyszukiwań takich jak muzeum czy muzeum historii Polski. Gdy wpiszemy kilka słów, dane będą zawierały każde z nich w dowolnej kolejności, na przykład wyszukiwanie muzeum sztuki przyniesie wyniki takie jak muzeum sztuki, muzeum sztuki nowoczesnej czy sztuka w muzeum. Jeśli użyjemy cudzysłowu, otrzymamy wyniki zawierające dokładnie tę frazę (słowa w podanej, oryginalnej kolejności). Na przykład wyszukiwanie “muzeum sztuki” zwróci wyniki takie jak muzeum sztuki czy nowoczesne muzeum sztuki, ale nie uwzględni wyników dla wyszukiwań takich jak muzeum nowoczesnej sztuki czy muzea i sztuka.

To ważne, żeby tematy porównywać z innymi tematami, a frazy (hasła) z innymi frazami.

Ślady pandemii

Pandemia COVID-19 wpłynęła na funkcjonowanie polskich muzeów przede wszystkim przez ogólnopolskie lockdowny, które ogłaszano w trzech okresach: marzec - maj 2020, październik - grudzień 2020, marzec - maj 2021. W tym czasie muzea i inne instytucje kultury musiały zamknąć swoje przestrzenie, a swoją aktywność - nie bez problemów - przenieść do internetu. Jedną z nowych form muzealnej aktywności online było wirtualne zwiedzanie.

Jak piszą Agnieszka Bąk i Rafał Wiśniewski, w okresie pandemii

Szukając nowych formuł, muzea zapraszały zwiedzających na wirtualne opowieści o nieznanych publiczności miejscach czy innych zagadkach charakterystycznych dla danej instytucji i jej zbiorów. Można było zaobserwować, że podobne działania w wersji cyfrowej przed pandemią prowadzone głównie przez pracowników działów edukacji czy komunikacji, w okresie COVID-19 zaangażowały również kuratorów zbiorów, konserwatorów dziedzictwa, specjalistów z różnych dziedzin, a także dyrektorów muzeów.

Wirtualne zwiedzanie, dotąd traktowane jako nieistotny dodatek do głównej działalności muzeum, w trakcie lockdownów okazało się jednym z kluczowych rozwiązań, pozwalających na zachowanie kontaktu z publicznością i realizację misji instytucji w nowych, trudnych warunkach.

Ten gwałtowny wzrost popularności (czy też zapotrzebowania) użytkowników na korzystanie ze zbiorów muzeów w ten sposób, widać w danych Google Trends:

Popularność hasła 'wirtualne zwiedzanie muzeum' / Źródło: trends.google.com

Spróbujmy bliżej przyjrzeć się danym, które możemy wyeskportować z Google Trends, klikając jedną z ikon w prawym górnym rogu wykresu. Ograniczmy je do okresu styczeń 2020 - luty 2022:

Miesiąc Wartość
2020-01 8
2020-02 10
2020-03 100
2020-04 50
2020-05 34
2020-06 12
2020-07 0
2020-08 0
2020-09 0
2020-10 7
2020-11 21
2020-12 11
2021-01 14
2021-02 17
2021-03 13
2021-04 16
2021-05 10
2021-06 0
2021-07 0
2021-08 0
2021-09 0
2021-10 10
2021-11 10
2021-12 0
2022-01 8
2022-02 0

Wykres i szczegółowe dane pokazują popularność frazy wirtualne zwiedzanie muzeum. Widzimy, że szczyt popularności przypada na marzec 2020 (pierwszy lockdown), a następnie - w kolejnych lockdownach - fraza ta nie zyskuje podobnie dużej popularności. Jak moglibyśmy to zinterpretować? Być może zastanawiając się, czy po pierwszym lockdownie muzea przyzwyczaiły swoich odbiorców do oferty cyfrowej i ogólne wyszukiwanie możliwości zwiedzania online nie było już potrzebne. Cyfrowy dostęp do zbiorów i przestrzeni stał się w pewien sposób oczywisty.

Inna, mniej pozytywna interpretacja, mogłaby sugerować, że po szoku pierwszego lockdownu Polacy przestali szukać zasobów muzealnych: ponieważ pojawiło się wiele innych zasobów, które możnaby konsumować online, cyfrowa oferta muzealna przestała być tak widoczna i wyjątkowa.

Sezonowa popularność

Muzeum II Wojny Światowej zostało otwarte w marcu 2017 roku. Na ten okres przypada też szczyt popularności tematu Muzeum II Wojny Światowej w Gdańsku (który reprezentują takie hasła jak muzeum wojny i muzeum ii wojny).

Popularność tematu 'Muzeum II Wojny Światowej w Gdańsku' / Źródło: trends.google.com

Dane z Google Trends bardzo ciekawie pokazują sezonowość szczytów wyszukiwania, przypadającą na miesiące wakacyjne (lipiec - sierpień). Czy nie jest tak, że szczyty te generowane są przez turystów, którzy przyjeżdżają nad morze i przy okazji odwiedzają to muzeum? Zobaczmy dane z modułu Zainteresowanie według podregionu i wybierzmy opcję Miasto:

Popularność tematu 'Muzeum II Wojny Światowej w Gdańsku' w określonych miastach / Źródło: trends.google.com

Stegna, Hel, Sopot czy Władysławowo to popularne miejscowości turystyczne - być może turyści, będąc tam na wczasach, przygotowywali się do odwiedzin muzeum i szukali o nim podstawowych informacji. Wyszukiwania z Gdańska sugerować mogą, że osoby, które przyjechały już do tego miasta, w ramach planu zwiedzania kierowały się do Muzeum II Wojny Światowej, szukając np. trasy dotarcia do jego siedziby. Lub zastanawiały się, czy i jak mogą je odwiedzić - zaplanować wizytę, kupić bilety itp.

W weekend do muzeum czy do biblioteki?

Pracując z Google Trends, jesteśmy ograniczani w naszych analizach do okresu od 2004 roku. Chociaż wykresy trendów generowane są dla skali miesięcznej, w ustawieniach Niestandardowy zakres czasu możemy otrzymać skalę dzienną. To cenne, ponieważ pozwala analizować zmiany weekendowe.

Ustawienia skali czasowej / Źródło: trends.google.com

Wybierzmy skalę Ostatnie 90 dni dla tematów (nie haseł) muzeum i biblioteka. Otrzymamy następujący wykres:

Trendy dla tematów muzeum i biblioteka / Źródło: trends.google.com

Pobierzmy dane CSV o takiej strukturze:

Dzień Muzeum: (Polska) Biblioteka: (Polska)
2024-08-26 61 52
2024-08-27 58 47
2024-08-28 57 44
2024-08-29 54 43
2024-08-30 59 40
2024-08-31 62 26
2024-09-01 69 27

Możemy teraz użyć ChatGPT albo zrobić to ręcznie np. w Excelu, aby dla każdej daty dziennej wyznaczyć nazwę dnia tygodnia:

Dzień Muzeum: (Polska) Biblioteka: (Polska) Day of Week
2024-08-26 61 52 Monday
2024-08-27 58 47 Tuesday
2024-08-28 57 44 Wednesday
2024-08-29 54 43 Thursday
2024-08-30 59 40 Friday

Użyjmy promptu

na podstawie podanych danych porównaj popularność muzeum i biblioteki w dni weekendowe (sobota-niedziela) i robocze (poniedzialek-piatek)

aby wyliczyć wartości z weekendów (sobota i niedziela) i dni roboczych dla obu tematów wyszukiwania. ChatGPT stworzył nową kolumnę, w której oznaczył, czy dany dzień jest dniem roboczym czy weekendowym, po czym wyliczył średnie wartości dla każdej z tych grup dla tematu muzeum i biblioteka (dane na GitHub). Efekty naszej analizy nie są zaskakujące:

Trendy dla tematów muzeum i biblioteka w ujęciu weekendowym / Źródło: trends.google.com

W dni powszednie frazy odnoszące się do bibliotek i muzeów są niemal tak samo popularne, ale weekendy to zdecydowanie czas muzeów (w końcu wszystkie biblioteki poza uczelnianymi są wtedy zamknięte 😎). Oczywiście, udostępniane przez Google Trends dane na ten temat można przebadać w ciekawszym kierunku - co dzieje się w sesji, kiedy studenci szturmują biblioteki nawet w weekend? Albo w wakacje? Możliwość korzystania z danych zebranych w ujęciu dziennym, zamiast miesięcznym czy rocznym, otwiera wiele nowych perspektyw.

Znów jednak to nie dane są naszym głównym wyzwaniem, ale ciekawe pytanie badawcze. I znowu musimy mieć świadomość ograniczeń, wynikających z danych źródłowych. Wyszukiwanie tematu biblioteka czy muzeum w żaden sposób nie sugeruje, że osoby wyszukujące mają zamiar tego dnia udać się do biblioteki - być może po prostu planują pracę albo zwiedzanie w kolejnych dniach (na temat korelacji trendów z Google Trends i danych o odwiedzinach muzeum, przeczytaj w części Wykorzystanie metod).

Więcej informacji mogłoby nam dostarczyć wyszukiwanie według nazw konkretnych instytucji - pozwoliłoby to uwzględnić lokalny kontekst oraz specyfikę poszczególnych placówek:

Trendy dla tematu Biblioteka Uniwersytecka w Warszawie / Źródło: trends.google.com

Podsumowanie

Google Trends to źródło ciekawych danych o popularności określonych fraz czy tematów wyszukiwania. To, czy są to dane wartościowe, zależy już od stawianych im pytań. Musimy uważać, aby łatwa dostępność danych nie zaburzyła nam krytycznego podejścia i odpowiedniego zrozumienia ich ograniczeń. Wyszukiwanie informacji o konkretnym muzeum nie oznacza jeszcze decyzji o jego odwiedzeniu - może być jedynie elementem planowania wizyty lub zdobywania wiedzy na inny temat. Zainteresowanie widoczne w danych wyszukiwań nie zawsze przekłada się na konkretne działania, podejmowane przez użytkowników. Wyszukiwanie może mieć różne motywacje.

Wykorzystanie metod

Efektywność Google Trends w ujawnianiu prawdziwych trendów doczekała się wielu opracowań. Na ograniczenia tej metody zwraca uwagę artykuł z Wired. Mechanizmy pozyskiwania i przetwarzania danych o wyszukiwaniach wykorzystano w projekcie Google Flu Trends, którego celem było przewidywanie skali zachorowań na grypę.

Ten system sprawdzał się aż do 2013 roku, kiedy to przeszacował szczyt sezonu grypowego o 140 proc., co mocno podważyło jego wiarygodność i doprowadziło do zamknięcia projektu. Przyczyną nieskuteczności przewidywania opartego o wyszukiwanie był m.in. overfitting (nadmierne dopasowanie) - algorytm uwzględniał w generowaniu trendów frazy niezwiązane z grypą, takie jak high school basketball. Google wprowadził też nowe rozwiązania do swojej wyszukiwarki, m.in. funkcję sugerowanych wyszukiwań, co podważyło dokładność modelu predykcji. Równocześnie nie ujawniano szczegółów dotyczących metod i danych używanych w narzędziu, co uniemożliwiło odpowiednie zrozumienie zasad jego działania i zablokowało możliwość poprawy modelu.

W artykule In search of art: rapid estimates of gallery and museum visits using Google Trends (2020) porównano miesięczne dane o liczbie odwiedzin w szesnastu instytucjach kultury danymi z Google Trends dotyczącymi wyszukiwań związanych z tymi instytucjami. W tym przypadku ocena efektywności Google Trends była pozytywna: okazało się, że istnieje silna korelacja między liczbą wyszukiwań a rzeczywistą liczbą wizyt, co sugeruje, że dane z Google Trends mogą być użyteczne w szacowaniu frekwencji w instytucjach kultury. Autorzy opracowania podkreślają, że wykorzystanie danych z wyszukiwań internetowych może dostarczać na bieżąco szacunki o zmianach we frekwencji, ułatwiając przez to podejmowanie konkretnych decyzji związanych z zarządzaniem publicznością.

Poniższa tabela prezentuje poziom błędów w prognozowaniu frekwencji w analizowanych muzeach. Zestawiono poziomy błędów generowane przez modele szeregów czasowych (narzędzia statystycze) i przez predykcje bazujące na Google Trends:

Szacowanie frekwencji na podstawie Google Trends / Źródło: doi.org/10.1140/epjds/s13688-020-00232-z

Pomysł na warsztat

Warto przemyśleć koncepcję warsztatu tak, aby odnosił się on do lokalnych instytucji. Lokalnym kontekstem może być regionalne muzeum, ale też szkoła albo wspólna przestrzeń (park, stadion, kościół). Pamiętajmy tylko, że Google Trends nie wizualizuje trendu, jeśli szacunkowa liczba zapytań nie jest odpowiednio wysoka.

Pierwszym etapem pracy może być przygotowanie i przetestowanie fraz czy tematów wyszukiwania - próbujemy zgadnąć, czego użytkownicy mogą wyszukiwać, odnosząc się do wspólnych przestrzeni. Godziny otwarcia? Dojazd do budynku? Dostępność zajęć dla dzieci? Po wybraniu fraz albo tematów, które mogłyby być wizualizowane w Google Trends, próbujemy zanalizować te dane - to druga część warsztatu. Zastanówmy się, jaka skala nas interesuje - czy potrzebujemy danych miesięcznych, a może dziennych? Czy skorzystamy z danych o popularności wyszukiwań, czy raczej użyteczniejsze będą informacje o tym, z jakiej miejscowości wysyłano te wyszukiwania?

Trzeci etap warsztu powinien podsumowywać efekt pracy - być może jest tak, że nie udało nam się rozpoznać żadnego zaskakującego trendu. W ramach podsumowania możemy porozmawiać nie tylko o tym, jakie ograniczenia mają dane z Google Trends i ich interpretowanie w kontekście konkretnych zachowań (np. wizyty w muzeum czy udziału w wyborach), ale też jakie dane zbiera o nas Google. Czy Google Trends można wykorzystać w marketingu? Albo dezinformacji? To ciekawy temat do rozmowy.