Seminarium doktoranckie (K. Borowska) 01.12.21, 12: 00
24-11-2021Zapraszamy na seminarium doktoranckie, które odbędzie się 01.12.2021 o godzinie 12:00 w sali 130. Przewidziane jest wystąpienie pani mgr inż. Katarzyny Borowskiej w związku z planowanym złożeniem rozprawy doktorskiej w celu kontynuowania czynności w przewodzie doktorskim.
Tytuł: Obliczenia granularne w przetwarzaniu danych niezbalansowanych
Promotor: prof. dr hab. Jarosław Stepaniuk
Promotor pomocniczy: dr inż. Magdalena Topczewska
Streszczenie:
Rozprawa doktorska, której dotyczyć będzie prezentacja, obejmuje zagadnienie przetwarzania danych niezbalansowanych. Dane tego typu charakteryzują się znaczną dysproporcją liczebności próbek reprezentujących poszczególne klasy decyzyjne. W sytuacji braku wystarczających informacji na temat klasy mniejszościowej, przy jednoczesnej dużej ilości danych z klasy większościowej, standardowe klasyfikatory mają tendencję do podejmowania decyzji na korzyść dominującej klasy. Dodatkowych trudności w procesie uczenia przysparza znaczna złożoność dystrybucji danych, rozumiana jako dekompozycja klasy mniejszościowej, niejednoznaczność strefy brzegowej oraz szum na poziomie obserwacji. Udowodniono, że współwystępowanie dwóch wymienionych czynników (dysproporcji w liczebnościach danych z różnych klas i wysokiej złożoności dystrybucji danych) powoduje zauważalną degradację wyników klasyfikacji. Problem ten występuje powszechnie w wielu dziedzinach. W ramach rozprawy doktorskiej przedstawiony jest nowy algorytm Rough Granular Approach (RGA), umożliwiający niwelowanie wspomnianych trudności z wykorzystaniem obliczeń granulanych. Podejście to umożliwia identyfikowanie określonych rodzajów obserwacji, formujących granule informacyjne i w rezultacie selektywne generowanie danych, dążąc do wyrównania liczebności przykładów z różnych klas. W celu dodatkowej poprawy jakości klasyfikacji, usuwane są niejednoznaczności wykryte wśród syntetycznych próbek reprezentujących klasę mniejszościową. Zakres rozprawy doktorskiej obejmuje również zbadanie wpływu zmian parametrów algorytmu na wyniki klasyfikacji.
Publikacje:
- K. Borowska, Obliczenia granularne w przetwarzaniu danych niezbalansowanych, Wybrane zagadnienia informatyki technicznej. Oficyna Wydawnicza PB, 2021, (w druku)
- K. Borowska, J. Stepaniuk, A rough-granular approach to the imbalanced data classification problem, Applied Soft Computing, vol. 83, 2019, Web of Science, Scopus
- K. Borowska, J. Stepaniuk, Granular Computing and Parameters Tuning in Imbalanced Data Preprocessing, Lecture Notes in Computer Science 11127, Springer, 2018, 233-245, Web of Science, Scopus
- K. Borowska, J. Stepaniuk, Rough Sets in Imbalanced Data Problem: Improving Re-sampling Process, Lecture Notes in Computer Science 10244, Springer, 2017, 459-469, Web of Science, Scopus
- K. Borowska, J. Stepaniuk, Imbalanced Data Classification: A Novel Re-sampling Approach Combining Versatile Improved SMOTE and Rough Sets, Lecture Notes in Computer Science 9842, Springer, 2016, 31-42, Web of Science, Scopus
- K. Borowska, M. Topczewska, New Data Level Approach for Imbalanced Data Classification Improvement, Proceedings of the 9th International Conference on Computer Recognition Systems: CORES 2015, vol. 403, 283-294, 2016
- K. Borowska, M. Topczewska, Data preprocessing in the classification of the imbalanced data, Advances in Computer Science Research, 31-46, 2014