Aktualne wydanie
Poprzednie numery
2008 rok
Systemy analityczne jako skuteczne narzędzie pracy organów bezpieczeństwa publicznego
dr Andrzej Machnacz
Ministerstwo Spraw Wewnętrznych i Administracji
Systemy analityczne jako skuteczne narzędzie pracy organów bezpieczeństwa publicznego
Współcześnie żyjemy w jednym z przełomowych momentów dziejowych, kiedy cała struktura ludzkiej wiedzy drży w posadach (…). Dzisiaj nie gromadzimy już tylko faktów, dokonujemy totalnego przekształcenia dystrybucji wiedzy i symboli. Budujemy cywilizację informacji.
Alvin Toffler
Organy administracji rządowej nie będą działać efektywnie i nie będą w stanie spełniać pokładanych w nich oczekiwań bez korzystania z nowoczesnych technologii. Bez sprawnie funkcjonujących systemów teleinformatycznych trudno sobie wyobrazić także nowoczesne oraz dobrze zorganizowane organy państwa działające na rzecz bezpieczeństwa obywateli i porządku publicznego. Jednym z nich jest Policja, która jako umundurowana oraz uzbrojona formacja służąca społeczeństwu i przeznaczona do ochrony bezpieczeństwa ludzi, a także do utrzymywania bezpieczeństwa i porządku publicznego, bez dostępu do nowoczesnych rozwiązań informatycznych, nie może skutecznie realizować swoich zadań.
Obecnie działania Policji coraz częściej opierają się m.in. na gromadzeniu, analizie i wykorzystywaniu informacji we wszystkich obszarach jej aktywności. Szybki i niezawodny dostęp do nowoczesnych technologii jest niezbędny zarówno w działaniach służb kryminalnych, prewencyjnych, jak i wspomagających. Wykorzystywanie zaawansowanych rozwiązań informatycznych umożliwia m.in. bezzwłoczną reakcję na zdarzenie, niezawodną wymianę informacji oraz typowanie sprawców przestępstw, a także skuteczne dysponowanie siłami Policji. W walce z przestępczością, w tym z zorganizowaną, wręcz nieodzowne jest wykorzystywanie najnowocześniejszych oraz najskuteczniejszych narzędzi, umożliwiających wymianę informacji, szybkie przetwarzanie i analizę danych. Brak ograniczeń terytorialnych w działaniach przestępnych sprawia, że bez wsparcia zaawansowanymi technologiami pracy Policji służba społeczeństwu, ochrona obywateli oraz utrzymywanie bezpieczeństwa i porządku publicznego staną się niemożliwe.
Policyjne systemy informacyjne, ze względu na swoją swoistość, stały się magazynami wartościowych danych, których łatwość przesyłania, przechowywania oraz przetwarzania ogromnie zwiększyło wydajność pracy na rzecz bezpieczeństwa i porządku publicznego. Jednocześnie zgromadzone w wielu systemach (przez lata) terabajty danych — w obliczu pojawiających się wciąż nowych form przestępczości — stały się na tyle istotne w procesie zwiększenia skuteczności działań Policji, że należało dokonać przeorganizowania, uporządkowania i zoptymalizowania przechowywanych w różnych miejscach informacji pod kątem pewnego wycinka rzeczywistości. W ten sposób powstał w Policji system analityczny, wykorzystujący mechanizmy hurtowni danych (data wherehouse)[1].
Sposób organizacji danych w systemie analitycznym Policji zapewnia dostęp do takich funkcjonalności analizowania informacji, których uzyskanie bez wcześniejszej ich przebudowy byłoby niemożliwe. W skład systemu wchodzą specjalizowane tematycznie podzbiory (data marts), zorganizowane odpowiednio do bieżących potrzeb służb kryminalnych i prewencyjnych Policji.
Koncepcja systemu analitycznego
Koncepcja budowy policyjnego systemu analitycznego, wykorzystującego mechanizmy hurtowni danych, zakładała stworzenie wyodrębnionego od innych systemów informatycznych Policji środowiska aplikacyjnego, posiadającego dedykowaną bazę danych[2]. Miało to na celu przede wszystkim wydzielenie funkcji analitycznych z systemów nieprzeznaczonych to tego typu operacji, w tym głównie z Krajowego Systemu Informacyjnego Policji (KSIP)[3]. Przyjęto, że zasilanie bazy analitycznej będzie odbywać się z różnorodnych źródeł danych, a gromadzone w niej informacje będą uporządkowane tematycznie, zintegrowane, zasilane przyrostowo, często redundantne i odpowiednio zagregowane oraz będą zawierały wymiar czasowy. Na podstawie pobieranych danych będą tworzone odpowiednie agregaty, tj. postać przekształcona na potrzeby raportowania statystycznego oraz dodatkowe struktury danych umożliwiające prowadzenie analiz.
Założono, że system ten — ze względu na zastosowane zaawansowane rozwiązania techniczne, w tym implementację najnowszych rozwiązań z dziedziny wyszukiwania danych, ich wszechstronnego analizowania, modelowania i prezentacji — będzie wspierał działania funkcjonariuszy i pracowników cywilnych Policji bezpośrednio na ich stanowiskach pracy, w zakresie określonym ich potrzebami oraz posiadanymi przez nich uprawnieniami.
W systemie tym, jako centralnej bazie danych fizycznie wydzielonej od innych systemów, będą gromadzone informacje pozyskiwane okresowo z wszelkich innych policyjnych i pozapolicyjnych baz danych. W trakcie ładowania dokonywane będzie scalanie i ujednolicanie danych oraz ich transformacja i agregacja. Struktura i użyte do budowy systemu analitycznego narzędzia będą zoptymalizowane pod kątem przetwarzania analitycznego w sposób pozwalający na:
— tworzenie przekrojowych analiz danych, w tym weryfikację podjętych przez odpowiednie służby decyzji oraz badanie ich skuteczności;
— identyfikację i odkrywanie przyczyn zjawisk oraz zależności pomiędzy nimi, w tym wyszukiwanie współzależności przestępnych przez analizę porównawczą wpływu pojawienia się na danym obszarze zjawiska (przestępstwa) i korelację z pojawieniem się lub zanikaniem innych zjawisk (rodzajów przestępstw, innych faktów towarzyszących);
— formułowanie prognoz zachowań czy też doszukiwanie się określonych trendów na skutek rejestrowanych i przechowywanych przez długi czas zdarzeń oraz innych faktów towarzyszących;
— otrzymywanie na czas aktualnej informacji, np. lokalnej lub globalnej mapy przestępczości pomocnej w planowaniu i alokacji służb;
— przeprowadzanie analiz gromadzonych danych zarówno w formie liczbowej, jak i graficznej, w celu wyboru wąskiej grupy najistotniejszych informacji, wymagających ciągłej obserwacji (dzięki zwężeniu danych, sam nadzór nad nimi staje się dużo bardziej efektywny i mniej czasochłonny);
— analizę przyczyn powstawania zjawisk przestępnych przez umożliwienie „zagłębienia się” w dane, drążenia ich od ogólnego spojrzenia na organizację jako całość do szczegółowej analizy wybranych, interesujących składników,
— zaawansowaną kontrolę dostępu do danych wrażliwych w celu śledzenia i eliminacji zjawisk nielegalnego wykorzystania informacji,
— wspomaganie grup dochodzeniowo-śledczych przez typowanie informacji szczegółowych na podstawie niepełnych danych, a tym samym zawężanie listy poszukiwanych osób lub przedmiotów.
Wdrożenie systemu analitycznego pozwoli także na zwiększenie czytelności danych, gdyż o ich umiejscowieniu decyduje tematyka, a nie przykładowo ich pochodzenie czy też przeznaczenie. Założono, że ułatwienie dostępu do zagregowanych danych zwiększy także jakość planowania, prognozowania i określania strategii. Wszelkie decyzje podejmowane na podstawie danych zgromadzonych w systemie analitycznym będą skuteczniejsze ze względu na rzetelne i aktualne informacje oraz dedykowany dla tego rodzaju funkcjonalności model danych.
Architektura systemu analitycznego
Konstrukcja policyjnego systemu analitycznego zakładała wykorzystanie centralnej bazy danych jako miejsca przechowywania informacji. Dlatego też dane główne oraz pomocnicze wraz z repozytorium danych systemu analitycznego zostały umieszczone w nowej bazie, oddzielonej od systemów zasilających bazę analityczną, w tym bazę danych KSIP.
W skład systemu analitycznego wchodzą:
1. Elementy zasilające (interfejsy do systemów źródłowych, w tym głównie do KSIP).
2. System analityczny, w tym:
— obszar przejściowy,
— repozytorium danych i narzędzi analitycznych oraz narzędzi do przekształcania i ładowania danych.
3. Metadane przetwarzania, praw dostępu i raportowe.
4. Narzędzia do publikacji danych umożliwiające dostęp do danych.
5. Główne i pomocnicze zbiory danych.
Logiczną architekturę policyjnego systemu analitycznego obrazującą zależności funkcjonalne pomiędzy wymienionymi elementami prezentuje rysunek 1.
System analityczny jest zasilany ze źródeł danych (tabele źródłowe, dzienniki zmian), w tym z bazy KSIP. Dane źródłowe są najpierw weryfikowane i przetwarzane (procesy ETL — Extraction, Transformation, Loading) w obszarze przejściowym, a następnie ładowane do struktur docelowych, tzw. repozytorium danych. W ten sposób, po zakończeniu procesów ETL wszelkie zapytania, analizy, statystki oraz typowania mogą być wykonywane na podstawie docelowych, zoptymalizowanych struktur danych.
W obszarze przejściowym informacje są sprawdzane pod względem ich zgodności z założonymi kryteriami poprawności, które dotyczą ewentualnych sytuacji nieprawidłowych.Mogą one być poprawione automatycznie lub wymagać interwencji użytkownika. Takiej weryfikacji dokonują procesy, które mogą korzystać z metadanych obszaru przejściowego, np. dla operacji mapowania, przekodowania, ze zbiorów dozwolonych wartości, reguł zachowania kolejności. Chronologicznie, w obszarze tym odbywa się właściwe przetwarzanie danych źródłowych, czyli m.in. nadawanie wartości domyślnych, kluczy sztucznych oraz przeprowadzanie analiz składniowych złożonych zapisów. Dane przetworzone i odpowiednio przygotowane umieszczone są w strukturach docelowych, tj. w repozytorium danych. Sposób zaprojektowania tych struktur zależy prawie w całości od:
— wymaganych raportów,
— formy i zakresu danych źródłowych,
— wymagań dotyczących przechowywania historii,
— wyznaczonego czasu na odpowiedź.
Metadane opisują zawartość systemu analitycznego, przedstawiają proces przetwarzania danych i administracji hurtownią oraz sposób ich prezentacji w raportach. Metadane obszaru przejściowego służą parametryzacji procesów walidacji, przetwarzania i konsolidacji danych źródłowych. Repozytoria narzędzi analitycznych przechowują zarówno informacje niezbędne do przygotowania raportów, jak i ich definicji. Znajdują się one w bazie danych, w oddzielnym schemacie bądź są przechowywane we wskazanych plikach. Repozytorium narzędzi do przekształcania i ładowania danych przechowuje informacje o strukturach danych wszystkich obszarów hurtowni, w tym mapowania, transformacje oraz kolejność przetwarzania procesów. Są to wszelkie metadane, pozwalające na zaprojektowanie i późniejsze zarządzanie hurtownią w jej pełnym cyklu życia, tj.: zasilanie, odświeżanie oraz wprowadzanie zmian do struktur.
Więcej w numerze...
[1]W.H. Inmon, T. Tech, What is a Data Warehouse? Prism Solutions, Volume 1, 1995 <http://pl.wikipedia.org/wiki/Hurtownia_danych>, 3 listopada 2008 r.
[2]J. Yang, WareHouse Information Prototype at Stanford (WHIPS), Stanford University, July 7, 1998. W. Abramowicz, P. Kalczyński, K. Węcel, Enhanced Data Warehouse (w:) Proceedings of Information Systems Architecture and Technology — ISAT 2001, A. Grzech, Z. Wilimowska (eds.), The Wrocław University of Technology Publishing House, Wrocław 2001.