Słów kilka nt. eksploracji danych w finansach
Świat dzisiejszych finansów bez narzędzi informatycznych przestałby istnieć. Wraz z postępującą informatyzacją otoczenia wykładniczo rośnie ilość "produkowanych" i przechowywanych danych. Finanse nie należą tutaj do wyjątków.
Dane makroekonomiczne, notowania instrumentów finansowych, informacje o zawieranych transakcjach bankowych, sprawozdania finansowe spółek, czy informacje o kredytach składają się na ocean danych, które - potencjalnie - mogą być przedmiotem analizy w celu wykrycia powtarzających się schematów, bądź prawidłowości. Te z kolei są szansa na skuteczniejsze zarządzanie, wyszukiwanie okazji inwestycyjnych, zapobieganie praniu brudnych pieniędzy, czy skuteczne zarządzanie ryzykiem kredytowym. Stale dokonujący się postęp technologiczny, rosnąca świadomość decydentów, poszukiwanie źródeł przewagi konkurencyjnej, chęć zysku, czy zagrożenie terroryzmem to tylko przykładowe czynniki, które wpływają na strukturalizację ogromnego wolumenu danych finansowych produkowanych codziennie przez wszystkie instytucje finansowe na świecie. Z kolei tak uporządkowane i odpowiednio przygotowane dane umożliwiają ich dogłębną i w znacznym stopniu zautomatyzowaną analizę.
Gwoli przypomnienia - eksplorację danych można krótko zdefiniować jako "proces odkrywania nowych, wcześniej nieznanych, potencjalnie użytecznych, zrozumiałych i poprawnych wzorców w bardzo duzych wolumenach danych". Dziedziny, z których czerpie data mining czerpie pełnymi garściami m.in. sztuczna inteligencja i uczenie maszynowe, statystyka, systemy baz danych, systemy wspomagania decyzji oraz metody wizualizacji danych.
Lista zastosowań metod eksploracji danych w dziedzinie finansów jest całkiem długa. Zwłaszcza jeśli pod uwagę brane są nie tylko stosunkowo nowe podejścia, które pojawiły sie wraz z wkroczeniem nowoczesnych narzedzi informatycznych do instytucji finansowych, ale także te znane od pewnego czasu - wywodzące się najczęściej ze statystyki, które w dobie powszechnej informatyzacji zyskały nową jakość. Przykładowa, bardzo niepełna lista mogłaby przyjąć postać prezentowaną poniżej:
- Wykrywanie oszustw i nadużyć finansowych (np. związanych z kartami płatniczymi)
- Analiza metod prania brudnych pieniędzy
- Prognozowanie bankructw
- Analiza wniosków o udzielenie kredytu/pożyczki
- Profilowanie klientów (w działalności finansowej)
- Analiza kondycji finansowej przedsiębiorstw
- Klasyfikacja papierów wartościowych
- Prognozowanie zachowania rynków finansowych
- Prognozowanie notowań giełdowych i kursów walutowych
- Wycena instrumentów pochodnych
- Selekcja papierów wartościowych w celu budowy optymalnego portfela Optymalizacja portfela papierów wartościowych
- Zarządzanie ryzykiem
- Klasyfikacja ryzyka
- Prognozowanie wskazników ekonomicznych
- Przewidywanie przepływów gotówkowych
Część z wyżej wymienionych zadań jest wspólna z innymi polami zastosowań; przykładowo analiza szeregów czasowych - związana ściśle z prognozowaniem - niekoniecznie musi dotyczyć danych finansowych. Podobnie profilowanie klientów banku niewiele różni się co do zasady od tego typu działań w innych sektorach. Oczywiście każda branża posiada swoją własną specyfikę, która determinuje sposób wykorzystania konkretnych narzędzi i algorytmów. Nie inaczej jest w przypadku finansów. Innych bowiem cech szeregu będzie dotyczyć analiza techniczna kursu akcji, a innych zużycia dobowego prądu. Inaczej będą analizowani klienci hipermarketu, a innych wzorców zachowań będzie szukał analityk w przypadku towarzystwa ubezpieczeń. Warto zauważyć, że znaczna część, literatury dotyczącej zastosowań eksploracji danych, dotyczy prognozowania szeregów czasowych. W dziedzinie modelowania finansowego wykorzystuje się właściwie wszystkie dostępne metody obliczeniowe i - podobnie - każda z metod i technik eksploracji danych została także w tym celu zbadana i wdrożona do wykonywania odpowiednich zadań. Przykładowa lista obejmuje szereg liniowych i nieliniowych modeli, wielowarstwowe sieci neuronowe, sieci Kohonena, algorytmy minimalnoodległościowe (np. k-średnich) i hierarchiczne metody klasteryzacji, drzewa decyzyjne, regresje, ARIMA, PCA i logikę bayesowską. Nieco mniej popularne to stosowanie zbiorów rozmytych, relacyjne metody eksploracji danych, metoda wektorów wspierających (SVM), modele Markowa oraz ukryte modele Markowa.
Bibliografia:
1. Indranil Bose, Radha K. Mahapatra. Business data mining - a machine learning perspective. Information & Management, 39:211–225, 2001.
2. Boris Kovalerchuk, Evgenii Vityaev. Data Mining in Finance: From Extremes to Realism. Journal of Financial Transformation, 11:81–89, August 2004.
3. Usama M. Fayyad, Gregory Piatetsky-Shapiro, Padhraic Smyth, Ramasamy Uthurusamy. Advances in Knowledge Discovery and Data Mining. AAAI/MIT Press, 1996.
4. Wojciech Wilusz. Zastosowanie metod eksploracji danych w dziedzinie finansów. Praca magisterska. Uniwersytet Ekonomiczny w Krakowie. Kraków 2007.
