6-7 października 2016 r., Wrocław

1 6-7 października 2016 r., WrocławFormalne, techniczne ...
Author: Filip Kowalik
0 downloads 1 Views

1 6-7 października 2016 r., WrocławFormalne, techniczne i praktyczne aspekty ekspozycji dżs-ów w bibliotekach cyfrowych dr hab. Małgorzata Kowalska Instytut Informacji Naukowej i Bibliologii Uniwersytet Mikołaja Kopernika w Toruniu Dokumenty życia społecznego w badaniach i praktyczne ich wykorzystanie, 6-7 października 2016 r., Wrocław

2 6-7 października 2016 r., WrocławPlan wystąpienia Cele cyfryzacji dżs-ów Liczba cyfrowych dżs-ów w dLibrze (na r.) Wyszukiwanie dżs-ów Lokalizacja dżs-ów w bibliotekach cyfrowych Prezentacja dżs-ów Atrybuty opisu dżs-ów Język publikacji dżs-ów Prawa dostępu Wnioski – 3,7 mln, dziś jest 4,2 mln – ale nie zmieniły się wartości Dokumenty życia społecznego w badaniach i praktyczne ich wykorzystanie, 6-7 października 2016 r., Wrocław

3 CELE CYFRYZACJI DŻS-ÓWkonieczność zabezpieczania obiektów przed zniszczeniem i utratą potrzeba dokumentowania dziedzictwa kulturowego i organizacyjnego chęć poprawy dostępu do zbiorów chęć poszerzenia oferty informacyjnej budowa i integracja społeczności wokół biblioteki W Polsce zdigitalizowane dżs-y najczęściej udostępniane są w zasobach cyfrowych zbudowanych w oparciu o oprogramowanie dLibra. Do rzadkości należy rozwiązanie, gdy zeskanowane obiekty eksponuje się bezpośrednio ze strony internetowej biblioteki (np. Gminna Biblioteka Publiczna w Stromcu). Jeśli takie rozwiązanie ma miejsce, to z reguły ma ono służyć jako element promocyjny, zachęcający do zapoznania się z pełną kolekcją, będącą w posiadaniu danej placówki (np. Biblioteka Narodowa), bądź znak graficzny odsyłający do katalogu online (np. Biblioteka Publiczna w Gnieźnie) i/lub skierowujący do odrębnej biblioteki cyfrowej (np. Wojewódzka i Miejska Biblioteka Publiczna w Rzeszowie). Niekiedy wybrane obiekty ze zbiorów dżs udostępnia się także na specjalnie im dedykowanych fanpage’ach w mediach społecznościowych (np. Biblioteka Uniwersytecka w Toruniu). Kilka bibliotek stosuje także inne rodzaje oprogramowania, niemniej dLibra jest rozwiązaniem wybieranym najczęściej. na platformie dLibra agregowane są różne rodzaje zasobów cyfrowych (repozytoria cyfrowe, biblioteki cyfrowe, archiwa cyfrowe, platformy czasopism) warto zauważyć, że cyfrowe dżs-y „trafiają” przede wszystkim do zasobów posiadających status „biblioteki cyfrowej” lub „cyfrowego archiwum”. celem tworzenia archiwów i bibliotek cyfrowych jest zapewnienie ogółowi społeczeństwa dostępu do elektronicznych wersji materiałów o szczególnym znaczeniu historycznym, kulturowym i naukowym znajdujących się w zbiorach instytucji ochrony dorobku dokumentalnego oraz ich archiwizacja dla przyszłych pokoleń. W te funkcje doskonale wpisują się dżs-y. Dlatego próżno szukać ich w większości polskich repozytoriów (wyjątek na tym tle stanowią Repozytorium Cyfrowe Instytutów Naukowych ze 107 obiektami oraz Repozytorium Instytucjonalne PCSS, w którym zgromadzono 9 obiektów). Dokumenty życia społecznego w badaniach i praktyczne ich wykorzystanie, 6-7 października 2016 r., Wrocław

4 Liczebność dżs-ów w dLibrzeStatystyki FBC obiektów z 3,7 mln (1,4%) oraz odrębnie traktowany zbiór pocztówek liczący dokumentów (1,4%). Mając na uwadze fakt, że tradycyjnie dżs-y mogą przejawiać cechy kilku rodzajów dokumentów, można przyjąć, że nie jest to wynik miarodajny 117 zasobów, w 45 z nich nie udostępnia się dżs-ów.  Cyfrowa Biblioteka Druków Ulotnych Polskich i Polski Dotyczących XVI, XVII i XVIII wieku oraz Cyfrowe Archiwum KK NSZZ Solidarność.??? druki zwarte, artykuły czy fotografie tez mają dsz za niereprezentatywnością przywołanej sumarycznej liczby dżs-ów w dLibrze przemawia jeszcze zakwalifikowanie obiektów takich, jak dokumenty urzędowe, dokumenty archiwalne, wymienione już pocztówki czy grafiki – zaliczanych tradycyjnie do dżs-ów – do odrębnych typów zasobów. Wątpliwości budzi także licząca około 11% całości zasobów dLibry wyodrębniona w statystykach kategoria „inne”, w której – jak można przypuszczać – znalazły się także pewne rodzaje dżs-ów Dokumenty życia społecznego w badaniach i praktyczne ich wykorzystanie, 6-7 października 2016 r., Wrocław

5 Liczebność dżs-ów w dLibrzeWg FBC najwięcej dżs-ów gromadzą: CBN Polona (ponad 25 tys.), Śląska Biblioteka Cyfrowa (ponad 4 tys.), Wielkopolska Biblioteka Cyfrowa i Mazowiecka Biblioteka Cyfrowa (ponad 2 tys.), Biblioteka Cyfrowa Uniwersytetu Łódzkiego (ponad 1,9 tys.), Biblioteka Cyfrowa Ośrodka KARTA (ponad 1,8 tys.), Zachodniopomorska Biblioteka Cyfrowa „Pomerania” (około 1,7 tys.), Kujawsko-Pomorska Biblioteka Cyfrowa (ponad 1,5 tys.), Cyfrowy Dolny Śląsk (ponad 1,2 tys.), Bałtycka Biblioteka Cyfrowa i Chełmska Biblioteka Cyfrowa (niewiele ponad 1 tys.). niemiarodajne Dokumenty życia społecznego w badaniach i praktyczne ich wykorzystanie, 6-7 października 2016 r., Wrocław

6 Liczebność dżs-ów w dLibrze1) statystyki FBC są nieaktualne, bowiem mechanizmy analityczne FBC nie działają automatycznie (dane pobierane są okresowo), a tym samym nie odnotowują na bieżąco wprowadzania nowych obiektów, co odnotowują z kolei strony startowe poszczególnych zasobów, 2) statystyki FBC w swoich zestawieniach jako dżs-y obejmują obiekty, które przez redaktorów poszczególnych bibliotek cyfrowych zostały skatalogowane bardzo ogólnie jako dżs (pole „typ zasobu”), 3) część dżs-ów nie została uwzględniona w statystykach FBC, bowiem sami redaktorzy poszczególnych bibliotek cyfrowych katalogują je w sposób niekonsekwentny (klasyfikują je jako różne typy obiektów i stosując różne metadane), 4) lokalne statystki bibliotek cyfrowych (zwłaszcza w poszczególnych podkolekcjach) są zawyżone na skutek przypisywania danego obiektu do jednej lub kilku podkolekcji (nawet w obrębie tej samej kolekcji głównej), włączania do sumarycznej liczby dokumentów również obiektów planowanych do digitalizacji oraz uwzględniania w zestawieniach sumarycznych części składowych obiektów wieloczęściowych. Dokumenty życia społecznego w badaniach i praktyczne ich wykorzystanie, 6-7 października 2016 r., Wrocław

7 Lokalizacja DŻS-ÓW w BCwskazanie liczby reprezentantów poszczególnych typów nie jest możliwe. Dzieje się tak dlatego, iż niektórzy redaktorzy w polu „typ zasobu/obiektu/dokumentu” wprowadzają różnorodne zapisy, tj. wpisują wyłącznie ogólną kategorię dokumentu (np. dokument życia społecznego lub druk ulotny), albo szczegółowo podają konkretny jego typ (np. afisz, folder, kalendarz). Rozwiązaniem najczęściej stosowanym w polskich bibliotekach cyfrowych jest umieszczanie dżs-ów w podkolekcjach do kolekcji głównych, najczęściej do kolekcji „dziedzictwo kulturowe” , regionalia, zbipry s[ecjalne

8 Lokalizacja DŻS-ÓW w BCW części bibliotek cyfrowych dokumenty życia społecznego wydziela się także w odrębne kolekcje (np. Biblioteka Cyfrowa Uniwersytetu Łódzkiego, Mazowiecka Biblioteka Cyfrowa, Cyfrowa Ziemia Sieradzka). Niekiedy kolekcje dżs-ów określa się mianem „druki ulotne”. Mimo wyodrębnienia samodzielnych zbiorów dżs-ów, w niektórych bibliotekach cyfrowych pewne ich typy (np. pocztówki, dokumenty urzędowe) wyłącza się z kolekcji zasadniczych i tworzy dla nich osobne podkolekcje (np. CBN Polona, Cyfrowy Dolny Śląsk). W tych bibliotekach cyfrowych, które na pierwszym poziomie klasyfikacji zasobu stosują porządkowanie według kategorii tematycznych, organizacyjnych (zasoby instytucji współtworzących zasób) bądź według dziedzin nauki, z reguły nie wyodrębnia ani ogólnych kolekcji czy podkolekcji dżs-ów, ani działów rejestrujących ich poszczególne typy (np. Dolnośląska Biblioteka Cyfrowa, Biblioteka Cyfrowa Ośrodka Karta, Biblioteka Cyfrowa Politechniki Warszawskiej). Dokumenty tego typu prezentuje się łącznie z innymi publikacjami z reguły w układzie tematycznym lub dziedzinowym, a w ramach kolekcji instytucjonalnych – formalno-rzeczowym. Niestety, bez względu na to czy dżs-y tworzą odrębne kolekcje, czy też włączane są do podkolekcji do rzadkości należą sytuacje, gdy w pełni charakteryzuje się zawartość tych kolekcji (np. Elbląska Biblioteka Cyfrowa, Podkarpacka Biblioteka Cyfrowa). Najczęściej opisy zawartości ograniczają się do podania liczby dokumentów włączonych do kolekcji głównej i jej podkolekcji (np. Kujawsko-Pomorska Biblioteka Cyfrowa, Radomska Biblioteka Cyfrowa). Niekiedy bardziej wyczerpujące informacje nt. umieszcza się w dziale „Informacje o projekcie” (np. Cyfrowy Dolny Śląsk, Opolska Biblioteka Cyfrowa).

9 Wyszukiwanie cyfrowych DŻs-ÓWWYSZUKIWANIE PROSTE dwie opcje wyszukiwania: prostego i zaawansowanego. Wyszukiwanie proste realizowane lokalnie umożliwia wprowadzanie dowolnego terminu wyszukiwawczego do pola wyszukiwawczego i zainicjowanie (domyślnie) procesu wyszukiwania w całym opisie publikacji i w tekście dokumentu (opcja „Wszędzie”), zaś w przypadku serwisu FBC – w całym opisie metadanowym lub w obrębie ściśle wskazanego atrybutu opisu bibliograficznego (brak tu możliwości wyszukiwania w tekście publikacji).

10 WYSZUKIWANIE ZAAWANSOWANEWyszukiwanie zaawansowane przebiegające w pojedynczych bibliotekach cyfrowych pozwala natomiast na wyszukiwanie w opisie publikacji (w całym opisie, polu konkretnie wskazanym lub kilku polach jednocześnie) oraz/ lub w tekście publikacji. Poza możliwością przeszukiwania tekstu dokumentu, analogicznymi funkcjonalnościami dysponuje serwis FBC. Zarówno w przypadku wyszukiwania według formularza prostego, jak i zaawansowanego – tak na poziomie lokalny, jaki zdalnym, możliwe jest korzystanie z operatorów logicznych, techniki maskowania, funkcji ujmowania fraz wyszukiwawczych w cudzysłów oraz łączenia ich za pomocą nawiasów. By ułatwić wprowadzanie zapytań, użytkownikom oferuje się szeroko rozbudowany system podpowiedzi (podpowiadanie wpisywanych wyrazów, powiązanie terminów z synonimami, weryfikacja poprawności zapytań w formie „czy chodziło ci o” lub automatyczna korekta terminów). Warto pamiętać, że opcja wyszukiwania pełnotekstowego możliwa jest jedynie wówczas, gdy dokument został poddany obróbce techniką rozpoznania pisma, lub gdy został wyposażony w tekstową transkrypcję. obok okna wyszukiwawczego pojawia się odnośnik do listy terminów wzorcowych/wartości danego atrybutu („Pokaż listę” lub „Lista”), pozwalający na przeniesienie wybranego z listy terminu do pola wyszukiwawczego. Na poziomie lokalnym możliwe jest także wyszukiwanie z wykorzystaniem zawartości indeksów (z reguły są to indeks autorów, tytułów i słów kluczowych). Przebiega ono analogicznie jak proces wyszukiwania w opisie publikacji – wybór terminu z indeksu powoduje automatyczne przeniesienie go do okna wyszukiwawczego.

11 Poza wyszukiwaniem prowadzonym w zasobach pojedynczych bibliotek cyfrowych i serwisie FBC innym sposobem docierania do cyfrowych dżs-ów jest rozpoczynanie procesu wyszukiwania od katalogów online bibliotek, w których są one skatalogowane. Trzeba mieć jednak świadomość, że ta metoda wyszukiwania nie zawsze przynosi oczekiwane rezultaty, bowiem – jak zauważono poniżej – nie wszystkie katalogi online zawierają odsyłacze do kopii cyfrowych dokumentów oryginalnych (sa czasopisma, ksiazki, czy inne, ale np. folderow i broszur niue ma). Podobnie jak w przypadku wyszukiwania innych rodzajów dokumentów czy informacji w lokalizacji cyfrowych dżs-ów pomocne okazują się także standardowe wyszukiwarki internetowe. Korzystanie z nich wymaga jednak znajomości szczegółów dotyczących danej publikacji (np. autorów i/lub tytułów, wydawców, znaków szczególnych, itp.) lub formułowania kwerend wyszukiwawczych w sposób intuicyjny, tj. z zastosowaniem asocjacyjnych terminów wyszukiwawczych (np. „afisz” i „biblioteka cyfrowa”).

12 Prezentacja Dżs-ów w lokalnych BCWidok prosty i rozbudowany W obu widokach lista wyników przybiera postać skróconych opisów bibliograficznych, które porządkowane są według kryterium przyjętego za domyślne w danej bibliotece (np. układ alfabetyczny, data wydania lub stopień trafności). W widoku prostym wyświetla się ikonka sygnalizująca typ obiektu, tytuł oraz autor publikacji, w widoku rozbudowanym – tytuł, autor, słowa kluczowe i towarzysząca miniaturka obiektu. Zarówno w widoku prostym, jak i rozbudowanym pod opisem każdego obiektu znajdują się odnośniki „znajdź podobne” i „dodaj do bibliografii”.

13 Prezentacja Dżs-ów w Zasobach FBCRezultaty wyszukiwania pochodzące z FBC prezentowane są w nieco inny sposób, tj. w postaci widoku listy lub kafelków. Lista ma formę tabeli, w której pojawiają się kolejno: miniatura obiektu lub ikonka sygnalizująca typ obiektu tytuł, autor, język publikacji, data utworzenia, słowa kluczowe oraz nazwa zasobu, z której pochodzi obiekt. W widoku kafelków z kolei wyświetlają się: miniatura obiektu lub ikonka sygnalizująca typ obiektu tytuł, nazwa zasobu, z której pochodzi obiekt, oraz autor. Niestety, na poziomie lokalnych bibliotek cyfrowych nie ma możliwości porządkowania rezultatów wyszukiwania według dowolnych kryteriów (brak tego rozwiązania częściowo rekompensuje jednak opcja wyszukiwania zaawansowanego, pozwalająca na ograniczenie wyników wyszukiwania do konkretnych pól opisu publikacji). Filtrowanie rezultatów według tytułów, twórców, trafności i daty dodania publikacji oferuje natomiast serwis FBC.

14 Prezentacja obiektu na poziomie lokalnymWybór konkretnego obiektu z listy wyników (czy to w lokalnej bibliotece cyfrowej, czy w FBC) pociąga za sobą wyświetlenie pełnego opisu danej publikacji. Opis bibliograficzny w większości bibliotek cyfrowych przybiera postać schematu Dublin Core. Zgodnie z jego specyfikacją, najczęściej do opisu obiektów cyfrowych używa się 15 podstawowych atrybutów metadanych: tytuł, twórca, temat i słowa kluczowe, opis, wydawca, współtwórca, data wydania, typ zasobu, format, identyfikator zasobu, źródło, język, powiązania, zakres, prawa (zob. atrybuty opisu zdigitalizowanych dżs-ów w niniejszym tekście). Każdemu opisowi bibliograficznemu towarzyszy miniatura obiektu, będąca odnośnikiem umożliwiającym przeglądanie treści (konieczna wtyczka djvu lub aplet Java). Poza metadanymi każdy obiekt wyposażony jest w informacje dodatkowe. Ich zakres w poszczególnych bibliotekach cyfrowych może się różnić. Najczęściej jednak w tym miejscu umieszcza się informacje nt. kolekcji, do których przypisany został dokument, datę dodania kopii cyfrowej do zasobu i datę ostatniej modyfikacji, liczbę wyświetleń oraz odnośniki do innych wydań danej publikacji oraz publikacji podobnych (podobieństwo metadanych). W przypadku obiektów, do których prawa autorskie wygasły użytkownikom udostępnia się dodatkowe opcje: automatyczną kompresję i pobieranie w postaci pliku. Ponadto w większości bibliotek cyfrowych oferuje się także funkcje takie, jak powiększanie i obracanie dokumentów, ich drukowanie z pełnego tekstu, dodawanie zakładek, sugerowanie słów kluczowych, ocenianie oraz eksport metadanych do menadżerów zarządzania bibliografią. Kilka bibliotek cyfrowych posługuje się także innymi schematami metadanych, w tym także MARC21.

15 Atrybuty opisu zdigitalizowanych dżs-ówRóżne nazwy atrybutów Mimo istnienia swoistych „wytycznych” dotyczących struktury opisu obiektów w schemacie Dublin Core, analiza metadanych dżs-ów dowodzi znacznych różnic w tym zakresie. Pierwszą istotną kwestią jest stosowane różnych nazw atrybutów podstawowych. Jak nietrudno zauważyć, najmniej konsekwentnie nazywane są atrybuty „Typ zasobu” oraz „Temat i słowa kluczowe”. Warto dodać, że cechą charakterystyczną wprowadzanych w tych polach danych jest niekonsekwencja, przejawiająca się m.in. w stosowaniu różnych wariantów językowych danego wyrazu: liczba pojedyncza i mnoga, odmienne formy pisowni oraz rodzajowe dookreślenia (np. czasopismo/Czasopismo/Czasopisma w Małopolskiej Bibliotece Cyfrowej, afisz/plakat vs. plakat w Elbląskiej Bibliotece Cyfrowej, ulotka/ulotki/ulotki reklamowe/ulotki wyborcze w Wielkopolskiej Bibliotece Cyfrowej).

16 Atrybuty opisu zdigitalizowanych dżs-ówRóżnorodne interpretacje docelowej zawartości elementów Dublin Core różnorodnych interpretacji elementów Dublin Core w atrybucie „Powiązania” (ang. Relations) użytkownik znajdzie: odesłania do obiektów podobnych pod względem tematycznym lub/i formalnym (np. Biblioteka Cyfrowa Uniwersytetu Wrocławskiego), informacje o pozostałych częściach publikacji w przypadku obiektów wieloczęściowych (np. Zachodniopomorska Biblioteka Cyfrowa „Pomerania”), równoległe tłumaczenia tytułu (np. Biblioteka Cyfrowa UMCS), nazwy kolekcji tematycznych, do których należy obiekt (np. Dolnośląska Biblioteka Cyfrowa); w atrybucie „Opis” (ang. Description) widnieją z kolei: opis fizyczny obiektu (np. Śląska Biblioteka Cyfrowa), omówienie jego problematyki (np. Biblioteka Cyfrowa Ośrodka Karta), dopowiedzenia dotyczące jego znaków szczególnych lub opracowania cyfrowego dodane przez katalogujących (np. Radomska Biblioteka Cyfrowa), informacje na temat okoliczności powstania dokumentu lub/i jego pochodzenia oraz sposobów jego pozyskania przez bibliotekę (np. Elbląska Biblioteka Cyfrowa), a także źródeł finansowania procesu jego digitalizacji (np. Biblioteka Cyfrowa Uniwersytetu Łódzkiego).

17 Atrybuty opisu zdigitalizowanych dżs-ówDoprecyzowania do podstawowych atrybutów W efekcie takiego stanu rzeczy w różnych bibliotekach ten sam atrybut opisu przybiera różną postać. Podczas gdy w części bibliotek dane dotyczące polityki prywatności i praw do korzystania z publikacji opisane są za pomocą kilku odrębnych podatrybutów

18 Atrybuty opisu zdigitalizowanych dżs-ówTworzenie nowych elementów opisu Jeśli chodzi o tworzenie nowych (tj. zdefiniowanych dla lokalnych bibliotek cyfrowych) atrybutów opisu, to możliwość taką wykorzystuje duża liczba redaktorów bibliotek cyfrowych. Wśród nowych elementów opisu dżs-ów pojawiają się np. „Lokalizacja źródła” (np. Cyfrowa Ziemia Sieradzka), „Pochodzenie” (np. Warmińsko-Mazurska Biblioteka Cyfrowa), „Udostępnienie” (np. Mazowiecka Biblioteka Cyfrowa), „Źródła finansowania” (np. Jagiellońska Biblioteka Cyfrowa), „Seria” (np. Cyfrowy Dolny Śląsk), „Cytata bibliograficzna” (np. Biblioteka Cyfrowa Uniwersytetu Wrocławskiego), „Sygnatura” (np. Elbląska Biblioteka Cyfrowa), „Uwagi” (np. Biblioteka Cyfrowa Uniwersytetu Łódzkiego), „Tagi użytkowników” (np. Zachodniopomorska Biblioteka Cyfrowa „Pomerania”), „Rekord bibliograficzny” (np. CBN Polona). Wydaje się, że najwięcej elementów dodatkowych wprowadzają redaktorzy Wielkopolskiej Biblioteki Cyfrowej oraz Biblioteki Cyfrowej Uniwersytetu Wrocławskiego.

19 Atrybuty opisu zdigitalizowanych dżs-ówWzajemne linkowanie Takie rozwiązanie, zwłaszcza gdy opisowi publikacji oryginału w OPAC lub/i NUKAT towarzyszy także odesłanie do wersji elektronicznej dokumentu (tzw. wzajemne linkowanie), z pewnością przyczynia się do upowszechniania informacji o zbiorach. Niestety, w polskich bibliotekach cyfrowych nie jest ono stosowane powszechnie: odesłania do opisów dokumentów w OPAC oraz w opisach z OPAC i NUKAT do bibliotek cyfrowych uwidocznione są najlepiej w Bibliotece Cyfrowej Politechniki Warszawskiej, Bibliotece Cyfrowej Politechniki Krakowskiej i Repozytorium Cyfrowym Instytutów Naukowych. Warto nadmienić, że powiązania na linii biblioteka cyfrowa – katalog lub katalog – biblioteka cyfrowa występują wyłącznie w odniesieniu do takich typów wydawnictw, jak książki i czasopisma. Szansę na wzajemnie linkowanie mają zatem jedynie te dżs-y, które zostały sklasyfikowane jako tego typu wydawnictwa. Oczywiście odesłania z bibliotek cyfrowych do katalogów online spotyka się także w innych bibliotekach cyfrowych, np. Bibliotece Cyfrowej Politechniki Śląskiej, Warmińsko-Mazurskiej Bibliotece Cyfrowej, Bibliotece Cyfrowej Uniwersytetu Wrocławskiego, CBN Polonie, Jagiellońskiej Bibliotece Cyfrowej, Zachodniopomorskiej Bibliotece Cyfrowej „Pomerania”. W OPAC-ach bibliotek nadzorujących tworzenie tych zasobów brak jednak odesłań do kopii cyfrowych dokumentów.

20 Język publikacji cyfrowych dżs-ówjęzyki oficjalne, dialekty, etnolekty i makrojęzyki Najliczniejsze: język polski - 44 tys. obiektów (ok. 87%), język niemiecki - 4,8 tys., jidysz – ok. 1,2 tys. Dość licznie: - język angielski (596), język rosyjski (559), język francuski (467), język ukraiński (410), język łaciński (400). Z innych warto odnotować jeszcze dokumenty w językach: hebrajskim (96), czeskim (80), włoskim (34) oraz węgierskim (16). Publikacje w pozostałych językach narodowych występują w zasobach w mniejszej ilości (szwedzkie, duńskie, belgijskie, arabskie, hiszpańskie, greckie, tureckie itp.). Poza dżs-ami w językach oficjalnych, w bibliotekach cyfrowych zasobach dLibry występują także dokumenty sporządzone w dialektach, etnolektach czy makrojęzykach (uznane warianty tego samego języka), np. 18 w asturyjskim, 15 obiektów w języku kaszubskim, 4 w górnołużyckim, 2 w starogreckim. W zasobach wszystkich 72 bibliotek cyfrowych udostępniających dżs-y zaledwie jeden dokument skatalogowany jest jako dokument wielojęzyczny. Pod względem języka publikacji najbardziej różnorodna okazuje się CBN Polona, w której zgromadzono dżs-y aż w 42 językach. Dokumenty życia społecznego w badaniach i praktyczne ich wykorzystanie, 6-7 października 2016 r., Wrocław

21 Formaty cyfrowych dżs-ów46% image/text, 38% djvu, 12% pdf, 1% jpeg, 1% html, 2% wszystkie pozostałe (png, video, ppt). 62% zasobów widoczna w Sieci, reszta w Sieci Głębokiej. Niestety, ani statystyki FBC, ani statystyki lokalnych bibliotek cyfrowych nie umożliwiają dokładnego oszacowania liczby dżs-ów zapisanych w poszczególnych formatach danych. Takich ustaleń nie można dokonać także w oparciu o wyniki wyszukiwania zaawansowanego prowadzonego w pojedynczych bibliotekach dLibry za pomocą atrybutów „typ zasobu” i „format”, bowiem – jak już wskazywano w niniejszym artykule – w poszczególnych bibliotekach cyfrowych większość dżs-ów nie została skatalogowana jako „dokumenty życia społecznego”, lecz jako konkretne ich typy (np. afisz, plakat, broszura itp.). Aby wskazać dominujący format zapisu dżs-ów należy przeprowadzić przeszukiwanie wszystkich zasobów FBC pod kątem występowania określonego formatu (z obecnych w lokalnych bibliotekach: jpeg, djvu, pdf, html, png, mpeg, ppt), a następnie przefiltrować rezultaty wyszukiwania według rodzaju zawartości obiektu (z listy należy wybrać kategorię zdefiniowaną jako „dżs”). polskie biblioteki cyfrowe nie umożliwiają użytkownikom zmiany formatu wyświetlania dokumentów według własnych upodobań stosowanie różnego rodzaju formatu zapisów danych przekładają się nie tylko na trudności ze znajdowywaniem, analizowaniem i porównywaniem dokumentów ze sobą, ale także ich dostarczaniem do różnego rodzaju agregatorów danych (dla przykładu Europeana może mieć ono tylko jedną z czterech dozwolonych wartości: text, image, audio, video, co powoduje konieczność generowania wartości atrybutu „Type” na podstawie atrybutów „Typ zasobu” i „Format”) oraz widzialnością w Sieci. Dominacja tekstowej zawartości (djvu) polskich bibliotek sprawia, że większość zasobów polskich bibliotek cyfrowych nie jest widoczna w powszechnie dostępnym Internecie, lecz stanowi zasoby tzw. Sieci Głębokiej (ang. Deep Web). To z kolei przekłada się na fakt, że korzystając ze standardowych wyszukiwarek użytkownik może dotrzeć przede wszystkim do dokumentów udostępnianych w formatach powszechnie przez nie indeksowanych (np. jpeg, pdf, html) oraz takich, w których nastąpiła ekstrakcja warstwy tekstowej z dokumentów do osobnego (ukrytego) pliku i podpięcie go do opisu. W odniesieniu do dżs-ów przekłada się to zatem na widoczność około 62% ich całego zasobu cyfrowego (12% pdf, 1% jpeg, 1% jpeg i png, 46% image/text). M. Werla, Polskie biblioteki cyfrowe, FBC i Europeana – etapy i bariery w przepływie informacji. „Biuletyn EBIB” [online] 2010, nr 1 [dostęp 30 września 2016]. Dostępny w World Wide Web: A. Pulikowski, Wyszukiwanie pełno tekstowe w zasobach bibliotek cyfrowych [prezentacja]. W: X Krajowe Forum Informacji Naukowej i Technicznej, Zakopane,22– [online] [dostęp 30 września 2016]. Dostępny w World Wide Web: Dokumenty życia społecznego w badaniach i praktyczne ich wykorzystanie, 6-7 października 2016 r., Wrocław

22 6-7 października 2016 r., WrocławPrawa dostępu Analizy dowodzą, że w zasobach dLibry największy odsetek (86% całego zbioru dżs-ów) stanowią dżs-y udostępniane w powszechnym, otwartym i nieograniczonym dostępie. Znacznie mniejszą część zasobu tworzą materiały o ograniczonym dostępie (12%) oraz planowane do udostępnienia (2%). 56% wszystkich cyfrowych dżs-ów ( publikacje) znajduje się w domenie publicznej, 44% ( publikacje) objętych jest ochroną prawa autorskiego. Zaledwie 20 publikacji udostępnia się na wolnych licencjach. Kopie cyfrowe publikacji, do których nie wygasła jeszcze ochrona autorskoprawna, lub które powierzone zostały bibliotekom na specjalnych zasadach udostępniane są użytkownikom bądź w ramach lokalnej biblioteki cyfrowej (po zalogowaniu i uzyskaniu zgody administratora systemu), bądź prezencyjnie, na terminalach bibliotecznych w czytelniach placówek będących dysponentem praw do nich. Dokumenty życia społecznego w badaniach i praktyczne ich wykorzystanie, 6-7 października 2016 r., Wrocław

23 6-7 października 2016 r., Wrocławwnioski zbiór bardzo różnorodny, choć nieliczny pod względem liczebnym (1,4% zasobów dLibry), zbiór klasyfikowany niekonsekwentnie  w procesach ucyfrownienia dżs-ów odzwierciedlają się trudności wynikające z tradycyjnego podejścia do nich, tj. różne motywy i kryteria selekcji przyjmowane w procesie gromadzenia, selekcji i digitalizacji, odmienne sposoby organizowania kolekcji, niekonsekwencje w opracowywaniu, odmienności w zakresie form prezentacji i udostępniania  Dokumenty życia społecznego w badaniach i praktyczne ich wykorzystanie, 6-7 października 2016 r., Wrocław

24 6-7 października 2016 r., WrocławNegatywne implikacje z punktu widzenia użytkownika: rozmywanie się samej definicji dżs-ów i pogłębianie braku świadomości charakteru dokumentów z jakimi ma się do czynienia, obniżanie standardów procesu wyszukiwania (opóźnianie procesu wyszukiwania, zmniejszanie jego dokładności i kompletności) i wywoływania negatywnych skutków z tego płynących (nieumiejętność interpretacji rezultatów wyszukiwania, analizy dokumentów i pracy z nimi). z perspektywy bibliotekarzy i redaktorów bibliotek cyfrowych: trudności w dokładnym oszacowaniu sumarycznej liczby dżs-ów cyfrowych (i ich poszczególnych rodzajów), trudności w ich porównywaniu (kwestia duplikatów), trudności we wprowadzaniu nowych zaawansowanych funkcji dla czytelników i twórców bibliotek cyfrowych, w kontekście globalnym – trudności w przekazywaniu metadanych do zagranicznych serwisów. Ponieważ kolekcje specjalne, a takimi są bez wątpienia dżs-y, mają ogromną wartość dla procesów nauczania i uczenia się oraz prowadzenia badań, warto zadbać o spójne uwidocznienie ich w Internecie, powiązanie z innymi zasobami, by w ten sposób umożliwić współdziałanie i wymianę danych, a w konsekwencji – tworzenie zasobów o wysokiej jakości i autorytatywności. Dokumenty życia społecznego w badaniach i praktyczne ich wykorzystanie, 6-7 października 2016 r., Wrocław

25 6-7 października 2016 r., WrocławDziękuję za uwagę  kontakt: Haus Stolzenfels und Rheingold : Bad Flinsberg im Isergebirge [Dokument życia społecznego] Z zasobów: Cyfrowy Dolny Śląsk Dokumenty życia społecznego w badaniach i praktyczne ich wykorzystanie, 6-7 października 2016 r., Wrocław