Case study: Archiwa Państwowe w Bydgoszczy i Toruniu

System Atmos umożliwia poszukiwanie przodków

Archiwa Państwowe, działające w formie jednostek budżetowych, prowadzą działalność archiwalną w zakresie państwowego zasobu archiwalnego. Wchodzą one w skład państwowej sieci archiwalnej i podlegają Naczelnemu Dyrektorowi Archiwów Państwowych. Archiwum Państwowe w Bydgoszczy (z oddziałem w Inowrocławiu oraz Archiwum Państwowe w Toruniu (z oddziałem we Włocławku) reprezentują państwową sieć archiwalną w województwie kujawsko-pomorskim gromadząc dokumenty administracji państwowej, samorządowej, część materiałów życia społeczno-gospodarczego oraz dokumenty obrazujące ruch i ewidencję ludności takie, jak akta metrykalne i stanu cywilnego, a także prowadzą działalność edukacyjną.

Obecnie zasoby Archiwów są stopniowo digitalizowane i udostępniane w formie obrazów cyfrowych. W 2006 roku w Archiwum Państwowym w Bydgoszczy utworzono pracownię reprograficzno-digitalizacyjną i podjęto planowe prace nad przenoszeniem zasobów do postaci cyfrowej. Archiwum Państwowe w Toruniu rozpoczęło analogiczne działania w 2010 roku, m.in. poprzez uczestnictwo Programie Wieloletnim KULTURA+ Ministerstwa Kultury i Dziedzictwa Narodowego.

Wyzwanie

Rosnąca popularność badań genealogicznych oraz zainteresowanie historią i swoim pochodzeniem spowodowały, że coraz większym zainteresowaniem specjalistów i amatorów cieszą się historyczne dokumenty metrykalne urzędów stanu cywilnego, a także akta meldunkowe, rejestry i księgi parafialne, księgi małżeństw i zgonów oraz inne dokumenty umożliwiające prześledzenie dziejów przodków i poszukiwanie korzeni. Takie dokumenty, niejednokrotnie istniejące w pojedynczych egzemplarzach, wymagają specjalnej ochrony i przechowywania w stałej temperaturze i wilgotności. Dlatego z dostępu do oryginałów mogą korzystać jedynie osoby umiejące z nimi pracować – i to wyłącznie na miejscu. Także przeszukiwanie takich dokumentów jest bardzo czasochłonne. Prześledzenie dziejów kilku pokoleń wymaga wielokrotnego odwiedzania Archiwów i spędzenia wielu godzin w pracowni naukowej, co – zwłaszcza dla osób nie zajmujących się tą tematyką zawodowo – nie zawsze jest możliwe.

Dlatego Archiwa Państwowe w Toruniu i w Bydgoszczy podjęły się digitalizacji swoich zasobów i udostępnienia wszystkim osobom zainteresowanym genealogią i poszukiwaniami swoich korzeni elektronicznej wersji archiwum, zarówno na terminalach w pracowniach naukowych, jak i przez dedykowany portal internetowy. Ponieważ Archiwa nie dysponowały wówczas systemem informatycznym umożliwiającym gromadzenie, przechowywanie i zarządzanie informacjami metrykalnymi w formie elektronicznej, zdecydowano o zbudowaniu i wdrożeniu takiego systemu działającego w chmurze. Cały projekt „Źródła genealogiczne mieszkańców województwa kujawsko-pomorskiego” zyskał finansowanie ze środków unijnych pochodzących z Europejskiego Funduszu Rozwoju Regionalnego w ramach Regionalnego Programu Operacyjnego województwa kujawsko-pomorskiego na lata 2007-2013.

Rozwiązanie

W wyniku przeprowadzonego postępowania stworzono dedykowaną infrastrukturę składającą się z czterech macierzy ATMOS G3 FLEX 240. Dwie z nich zostały ulokowane w centrali Archiwum Państwowego w Bydgoszczy, jedna – w drugim obiekcie także w Bydgoszczy, natomiast czwarta – w siedzibie Archiwum  Państwowego w Toruniu.

Systemy zostały ze sobą połączone przy pomocy wydzielonej sieci rozległej o przepustowości 100 Mb/s, obydwie centrale zostały też podłączone do Internetu
przez łącza o przepustowości 20 Mb/s. Choć macierze zostały zainstalowane w dwóch formalnie odrębnych instytucjach tworzą jednolitą, wspólną chmurę do przechowywania danych obiektowych, zawierającą dane z obydwu archiwów. Dzięki chmurowej architekturze oraz automatycznej replikacji informacji zapewniono ciągłość działania całego systemu na wypadek awarii, a zarazem zapewniono bezpieczeństwo przechowywanych informacji. W ramach projektu zbudowano także dedykowany portal umożliwiający przeglądanie, wyszukiwanie, ewidencjonowanie i opisywanie dokumentów – zarówno przez osoby przebywające w pracowniach naukowych Archiwów, jak i przez osoby łączące się przez Internet. Proces digitalizacji archiwów objął też zeskanowanie do plików TIFF i JP2000 3,6 mln stron dokumentów zajmujących 580 metrów bieżących, ich podstawowe opisanie oraz walidację poprawności. Skanowanie dokumentów przeprowadzono w specjalnie utworzonym do tego ośrodku w siedzibie Archiwum Państwowego w Bydgoszczy. Systemy dostarczyła firma Logon S.A.

„Obiektowe systemy dyskowe Atmos firmy Dell EMC w połączeniu z przechowywaniem danych w chmurze umożliwiły łatwy i szybki dostęp do akt metrykalnych bez wychodzenia z domu. Rozproszenie danych pomiędzy różnymi ośrodkami oraz ich replikacja pozwoliły na zapewnienie wysokiej dostępności i bezpieczeństwa danych”.
Bolesław Rassalski, koordynator projektu

Rezultaty

W ramach projektu została stworzona bezpieczna i funkcjonalna platforma do rozwoju wirtualnego archiwum województwa kujawsko-pomorskiego. W momencie udostępnienia portalu genealogicznego w czerwcu 2015 roku udostępniono zeskanowane obrazy 3,6 mln stron dokumentów metrykalnych oraz innych dokumentów niezbędnych do prac genealogicznych. Dzięki natychmiastowemu dostępowi do zapisanych obrazów korzystanie z dokumentów jest znacznie szybsze i wygodniejsze, niż przeglądanie oryginałów w pracowni. Przechowywanie informacji w chmurze z wykorzystaniem wbudowanego w systemy Atmos mechanizmu Geoparity zapewnia, że dane są automatycznie replikowane pomiędzy różnymi ośrodkami. Dzięki temu są one zabezpieczone przed awariami sprzętu, oprogramowania i łączy.

Zainteresowani użytkownicy mogą teraz poszukiwać informacji na temat swojej rodziny nie ruszając się z domu. Aplikacja umożliwia przeglądanie aktów urodzenia, chrztu, małżeństw i zgonów online, a także rejestrowanie powiązań pomiędzy odnalezionymi osobami i budowę drzewa genealogicznego bezpośrednio na portalu. W początkowym okresie dokumenty zostały oznakowane jedynie symbolami katalogowymi (takimi, jak roczniki, rodzaje i numery ksiąg, miejsca przechowywania itp.), jednak system umożliwia użytkownikom opisywanie dokumentów przy pomocy takich wyznaczników, jak imiona i nazwiska osób, których dotyczą, dat i innych informacji. Dzięki zaangażowaniu środowisk genealogicznych zdigitalizowane dokumenty zostaną zindeksowane w krótszym czasie, niż byłoby to możliwe wyłącznie siłami Archiwów. Ponadto, w tym systemie dokumenty najczęściej przeglądane i wykorzystywane są też najszybciej opisywane, a kolejne osoby poszukujące informacji o tych samych przodkach mogą opierać się na efektach pracy poprzedników. Przy okazji postępowania przetargowego opracowano metodykę umożliwiającą obiektywną ocenę ofert przetargowych w oparciu nie tylko o cenę, ale także o jakość oferowanych usług, opracowano również procedury walidacji skanowanych dokumentów i ksiąg.

Planowane jest też stopniowe skanowanie kolejnych roczników akt oraz rozszerzenie funkcjonalności portalu o możliwość powiązania osób opisanych w bazach z innymi materiałami i źródłami archiwalnymi, jak np. akty własności, akta wyborcze, szkolne, akta związane z prawami ziemskimi lub miejskimi, akta własnościowe, akta związane z grobownictwem itp. Rozważane jest też poszerzenie źródłowej bazy dokumentów o dokumenty związane z terenem województwa kujawsko-pomorskiego, lecz znajdujące się w innych archiwach polskich i zagranicznych.

Podsumowanie

Branża

Sektor publiczny

Wielkość organizacji

  • 10 656 metrów bieżących akt w Archiwum Państwowym w Bydgoszczy
  • 6 459 metrów bieżących akt w Archiwum Państwowym w Toruniu

Wyzwania

  • Łatwy dostęp do dokumentów metrykalnych z pracowni naukowych i przez Internet
  • Przechowywanie obrazów 3,6 mln stron dokumentów metrykalnych wraz z metadanymi
  • Możliwość przeszukiwania zgromadzonych dokumentów

Rozwiązania

  • 4 macierze ATMOS
  • Dedykowane aplikacje do zarządzania informacjami

Wyniki

  • Chmura o całkowitej pojemności brutto 1 PB (540 TB po zastosowaniu polityk bezpieczeństwa)
  • Dostęp do archiwów przez stronę: www.genealogiawarchiwach.pl
  • Bezpieczna i funkcjonalna platforma do rozwoju wirtualnego archiwum

ZOBACZ TEŻ

Case study: Medicover – Opieka medyczna oparta na technologii

Case study: Medicover – Opieka medyczna oparta na technologii

Case study: Intratel x Instytut Matki i Dziecka – Dell PowerProtect DD6400 – nowoczesny backup w służbie cyberbezpieczeństwa

Case study: Intratel x Instytut Matki i Dziecka – Dell PowerProtect DD6400 – nowoczesny backup w służbie cyberbezpieczeństwa

Case study: Servers24.pl x Bioseco – Stacje robocze Dell Precision w służbie ochrony ptaków

Case study: Servers24.pl x Bioseco – Stacje robocze Dell Precision w służbie ochrony ptaków