Subskrybuj newsletter o cyfrowej humanistyce i innowacjach w sektorze kultury

Cechy postaci cyfrowej i ich znaczenie dla zbiorów kultury i dziedzictwa

Okładka lekcji: kot układający klocki / Źródło: AI

Wprowadzenie

Digitalizację dziedzictwa określa się czasem mianem rewolucji. To radykalna zmiana nie tylko w dostępie do zbiorów, ale też w ich zabezpieczaniu, przechowywaniu, sposobach udostępniania i możliwościach przetwarzania. Spróbujmy w tym materiale przedstawić niewielki przegląd cech postaci cyfrowej zdigitalizowanych artefaktów. Sprawdźmy, w jaki sposób posługiwanie się plikami zamiast obiektami fizycznymi wpływa na pracę instytucji kultury i dziedzictwa. Jakie nowe możliwości interakcji ze zbiorami daje nam dostęp do ich postaci cyfrowej? Żeby nie było to zbyt teoretyczne i nużące, podajmy też jakieś przykłady.

Część merytoryczna

Warunkiem tego, żebyśmy w ogóle mogli mówić o obiektach cyfrowych w muzeum czy archiwum jest digitalizacja. Digitalizacja to proces tworzenia interpretacji obiektu fizycznego (odbitki fotograficznej, starej mapy, książki, ale też filmu na taśmie nitro, muzyki zarejestrowanej na płycie gramofonowej, ale też stanowiska archeologicznego) do pamięci komputera (plików). Dlaczego interpretacji a nie kopii? Digitalizacja to proces złożony, wymagający odpowiedniego sprzętu i oprogramowania z mnóstwem opcji. Od jakości tego sprzętu, ustawień oprogramowania i wymogów instytucji zależeć będzie ostateczny efekt. Już w samych technicznych podstawach digitalizacji (próbkowanie sygnału ciągłego) istnieje pewnien margines wyboru - częstość próbkowania, rozdzielczość itp.

Digitalizacja to wciąż nieukończony proces

Digitalizacja zbiorów instytucji kultury i dziedzictwa wciąż trwa. To proces kosztowny, obwarowany wieloma ograniczeniami - nie wszystkie zdigitalizowane zbiory są dostępne w internecie. Ważnym ograniczeniem są tu prawa autorskie, ale też poziom finansowania projektów digitalizacyjnych, możliwości przechowywania i zabezpieczania plików oraz wydajność narzędzi do ich publikowania online. Skalę zadania, jakim jest digitalizacja, pokazują statystyki na temat archiwów państwowych (GUS Kultura i dziedzictwo narodowe w 2022 r., 2022):

Digitalizowane były m.in. akta stanu cywilnego, akta miast i gmin, akta urzędów administracji państwowej, akta sądowe, akta notariuszy, archiwa rodzin, akta cechów, fotografie oraz akta związane ze stratami wojennymi. Łącznie w 2022 r. zdigitalizowano ponad 161 tys. j.a. [jednostek archiwalnych], uzyskując: 6,2 mln kopii cyfrowych z materiałów statycznych, prawie 84 tys. minut kopii materiałów audiowizualnych oraz 1,7 mln kopii cyfrowych wykonanych z mikrofilmów.

To ogromny zasób, ale wciąż jedynie część dostępnych zbiorów. Przykładowo, w 2015 roku w Narodowym Archiwum Cyfrowym przechowywano około 15 mln fotografii powstałych od lat 40. XIX w. do czasów współczesnych. Były to nie tylko klasyczne odbitki, ale też dawne formaty fotograficzne takie jak dagerotypy czy diapozytywy na szkle oraz fotografie cyfrowe, nieposiadające postaci fizycznej. Wśród tych 15 mln zdjęć, w zbiorach NAC dominowała kolekcja Centralnej Agencji Fotograficznej (1944-90), dokumentująca czasy PRL i zawierająca około 12 mln fotografii. Tymczasem w 2015 roku na stronach NAC publikowano… 140 tys. fotografii. Jak mówił Filip Kwiatek (wówczas kierownik Oddziału Zbiorów Fotograficznych),

jeśli roczny przyrost fotografii zeskanowanych i opisanych w bazie to ok. 20 tys., to wychodzi, że opublikowanie 15 mln zajmie nam… 750 lat!

Znamy także założenia digitalizacji dla archiwów amerykańskich. W aktualnie obowiązującej strategii NARA (National Archives and Records Administration) zapisano, że do 2026 roku zostanie zdigitalizowane 85 proc. zasobów archiwalnych tej instytucji.

Nie tylko skany

Digitalizacja to proces długotrwały i kosztowny, a publikowanie zbiorów online to dodatkowe koszty i ryzyka związane np. z prawem autorskim. Dlatego instytucje kultury i dziedzictwa decydują się czasem na publikowanie wyłącznie metadanych swoich zbiorów.

Metadane zastrzeżonego obiektu w zbiorach Polony (zrzut ekranu) / Źródło: Polona

Metadate to informacje o obiektach, ich cechach zewnętrznych, kontekście powstania i treści. W praktyce tworzenia bibliotek, archiwów czy muzeów cyfrowych przyjęto (oczywiście, z pewnymi wyjątkami) zasadę, że metadane nie są utworami w rozumieniu prawa autorskiego i można je swobodnie upowszechniać.

Dostęp do metadanych, nawet jeśli równolegle nie mamy swobodnego dostępu do zdigitalizowanego obiektu, pozwala na wytwarzanie nowych obiektów cyfrowych! Brzmi to dość skomplikowanie, ale jest bardzo proste. Wystarczy wyobrazić sobie listę kilkuset fotografii, których metadane dostępne są na witrynie muzeum regionalnego. Jeśli w tych metadanych znajduje się informacja o miejscu wykonania fotografii, możemy przygotować mapę cyfrową, która wyświetli te punkty w określonej przestrzeni geograficznej. Stworzymy w ten sposób nowy obiekt cyfrowy i być może dzięki niemu będziemy mogli udokumentować jakiś fakt związany z powstawaniem tych zdjęć, np. szlak, którym poruszała się ich autorka oraz obecność na trasie miejscowości związanych z jej biografią.

Metadane mogą być też podstawą do opracowania kolejnych metadanych. Do przygotowania naszej mapy musimy znać koordynaty punktów, które w fotografii opisane są jako nazwy miejscowości. Aby to zrobić, możemy skorzystać z narzędzi do automatycznego mapowania nazw geograficznych.

Możliwości i ograniczenia postaci cyfrowej

Spróbujmy teraz wypisać najważniejsze cechy postaci cyfrowej, możliwości ich wykorzystania oraz potencjalne wyzwania z nimi związane. Lista ta na pewno jest niepełna - temat właściwości obiektów cyfrowych podejmowany jest szeroko w teorii mediów, kulturoznawstwie czy nawet filozofii.

Reprezentacja numeryczna

Reprezentacja numeryczna polega na przedstawieniu obiektu za pomocą wartości liczbowych, które reprezentują jego cechy lub właściwości. Liczby opisują jego charakterystyczne cechy, strukturę lub stan, co umożliwia jego przechowywanie, przetwarzanie i analizę za pomocą oprogramowania i komputerów. Dzięki takiej postaci obiekty cyfrowe nawet w dużej skali możemy analizować automatycznie za pomocą rozmaitych narzędzi. Przykładowo, w pracy naukowej Extraction of Color Information and Visualization of Color Differences between Digital Images through Pixel-by-Pixel Color-Difference Mapping przedstawiono metodę analizowania kolorów skanów i zdjęć, która ma pomóc m.in. w tym ocenie wieku obrazów olejnych, jakości formatu użytego przy digitalizacji czy ułatwić analizę historycznych artefaktów takich jak portrety na jedwabiu czy odbicia pieczątek na kartach papieru. Automatyczna analiza koloru możliwa dzięki postaci cyfrowej źródła (zrzut ekranu) / Źródło: https://doi.org/10.3390/heritage5040202

Zmienność i dynamiczne przetwarzanie

Zmienność i dynamiczne przetwarzanie - dzięki reprezentacji numerycznej możemy automatycznie i masowo zmieniać obiekty cyfrowe. Dobrym przykładem takiego efektu jest IIIF. IIIF (International Image Interoperability Framework) to standard i zestaw specyfikacji, które opisują wymianę i prezentację obrazów cyfrowych oraz innych zasobów kulturowych między różnymi platformami i instytucjami. Dzięki IIIF użytkownicy mogą łatwo przeglądać i analizować cyfrowe zbiory, korzystając z zaawansowanych funkcji, takich jak przybliżanie, przewijanie i porównywanie obrazów, dodawanie anotacji czy pobieranie metadanych. Zoom obrazka udostępnianego za pomocą IIIF jest dynamicznym przetworzeniem obiektu cyfrowego albo przynajmniej korzysta z takiego przetworzenia wykonanego w czasie publikowania pliku w archiwum czy muzeum cyfrowym. W IIIF postacią wyświetlanego pliku graficznego steruje się za pomocą zmian w jego adresie URL.

Dynamiczne przetwarzanie obiektu cyfrowego przez manipulację adresem URL / Źródło: https://iiif.io/api/image/3.0/

Łatwość dystrybucji i konwergencja

Łatwość dystrybucji i konwergencja - dzięki postaci cyfrowej artefakty kultury i dziedzictwa mogą być swobodnie udostępniane i bezstratnie kopiowane. To kluczowa cecha dla zabezpieczania tych zbiorów czy wykorzystywania ich np. w edukacji. Konwergencja mediów to zjawisko mieszania się różnych typów mediów między sobą - dobrym jego przykładem jest choćby obecność zdigitalizowanej fotografii historycznej w filmie udostępnionym na YouTube czy wydrukowany fragment mapy cyfrowej. Nieraz zwraca się jednak uwagę na negatywny aspekty powszechnej dostępności zbiorów cyfrowych. Z różnych względów wciąż nie wszystkie muzea, archiwa i biblioteki digitalizują swoje zasoby i umieszczają je w internecie. Ponieważ dostęp do zbiorów online jest łatwy i wygodny, może istnieć problem preferowania zbiorów zdigitalizowanych nad tymi, które dostępne są na miejscu. “Analogowe wykluczenie” negatywnie wpływa na jakość badań i może profilować to, w jaki sposób widzimy kulturę i dziedzictwo.

Interaktywność

Interaktywność nie jest najlepszym pojęciem do opisu cech postaci cyfrowej, ponieważ interaktywne są także obiekty fizyczne (drukowaną książkę można otworzyć i zamknąć, a jej lektura jest interakcją z wyrażonymi znakami alfabetu konstrukcjami językowymi, stworzonymi w wyobraźni autorki). W przypadku obiektów cyfrowych interaktywność może być jednak bardziej zaawansowana niż w przypadku obiektów fizycznych - książkę w postaci cyfrowej możemy błyskawicznie przeszukać lub szybko zrobić zestawienie najczęściej występujących słów w jej treści. W przypadku prezentacji multimedialnych interaktywność jest dodatkową warstwą mającą zaangażować użytkownika. Przykładowo, w aplikacji StoryMaps mapa cyfrowa jest jedynie wstępem do prezentacji bogatych treści, przedstawianych wokół zaprezentowanych na niej punktów geograficznych.

Personalizacja

Personalizacja to efekt niektórych cech obiektów cyfrowych oraz przestrzeni, w jakiej są one udostępniane (internet, muzeum czy galeria cyfrowa). Łatwe zmienianie kształtu obiektu cyfrowego oraz dostosowywanie go do wymagań użytkownika, połączone z mechanizmami zapamiętywania jego wyborów albo nawet śledzenia jego działań online, pozwala na tworzenie osobnych wersji kolekcji cyfrowych czy prezentowanie zbiorów w określony sposób. Dobrym przykładem potencjału personalizacji jest witryna Rijksstudio, systemu tworzenia własnych kolekcji cyfrowych na bazie zbiorów Rijksmuseum w Amsterdamie.

Łatwe przetwarzanie na dane

Łatwe przetwarzanie na dane to cecha obiektów cyfrowych bezpośrednio wynikająca z ich postaci numerycznej. Postać numeryczna pozwala przetworzyć wybrane cechy obiektu (np. zestaw dominujących w nim kolorów) na dane, które następnie można zwizualizować lub poddać analizie. W wizualizacji przygotowanej przez Olivię Vane na podstawie cyfrowych zbiorów Smithsonian Design Museum możliwe jest przeglądanie obiektów na podstawie ich schematów kolorystycznych. Aplikacja łączy też ze sobą różnorakie obiekty na podstawie ich kolorystycznego podobieństwa, co pozwala użytkowniczkom na budowanie nowych ścieżek korzystania z kolekcji. Powszechnie wykorzystywaną metodą przetwarzania skanów na dane jest OCR (Optical Character Recognition), rozwiązania umożliwiające rozpoznawanie tekstu z obrazów lub zeskanowanych dokumentów i przekształcanie go na postać, którą można edytować i przetwarzać komputerowo.

Przeglądanie zbiorów za pomocą filtrów kolorystycznych / Źródło: https://www.oliviavane.co.uk/dive-into-color

Modularność

Modularność to ważna cecha obiektów cyfrowych, polegająca na tym, że istnieją one w postaci pozwalającej na wyodrębnienie z nich mniejszych, wewnętrznych elementów. W artykule Enriching Image Archives via Facial Recognition wyodrębnianie z fotografii historycznych wizerunków twarzy opisane jest jako metoda na wzbogacenie opisów tych obiektów - w ramach eksperymentu wykonanego dla bazy 150 tys. zdjęć udało się zidentyfikować 62 tys. osób! W tym przypadku zeskanowane fotografie stały się podstawą nowych obiektów (wizerunków twarzy), które dzięki postaci cyfrowej mogły być analizowane i porównywane wybranymi metodami. Innym oczywistym przykładem modularnego obiektu cyfrowego jest każda strona WWW, zbudowana z wielu elementów (od treści tekstowej poprzez kod HTML, grafikę czy nagłówki HTTP wysyłane przez serwer).

Automatyczne rozpoznawanie twarzy na fotografiach historycznych / Źródło: https://doi.org/10.1145/3606704

Nietrwałość

Nietrwałość to negatywna cecha postaci cyfrowej. Błędy na nośnikach takich jak dyski czy taśmy oraz ewolucja formatów plików może prowadzić do problemów z odczytywaniem zbiorów cyfrowych. Osobnym problemem jest niestabilność obiektów cyfrowych udostępnianych w internecie.

Podsumowanie

Dzięki niektórym właściwościom postaci cyfrowej zdigitalizowanych zbiorów kultury i dziedzictwa, możliwe jest wypracowywanie nowych sposobów ich prezentacji, badania, upowszechniania czy zabezpieczania. Digitalizacja jest tu oczywiście warunkiem wstępnym, ale nie musi być końcem procesu. Lekcje publikowane w serwisie humanistykacyfrowa.pl są zaproszeniem do odkrywania nowych metod interakcji ze zbiorami muzeów, bibliotek czy archiwów, które niemałym kosztem opracowywane i udostępniane są w internecie.