Wydział Informatyki PB

Seminarium doktoranckie (K. Borowska) 01.12.21, 12: 00

24-11-2021

Zapraszamy na seminarium doktoranckie, które odbędzie się 01.12.2021 o godzinie 12:00 w sali 130. Przewidziane jest wystąpienie pani mgr inż. Katarzyny Borowskiej w związku z planowanym złożeniem rozprawy doktorskiej w celu kontynuowania czynności w przewodzie doktorskim.

Tytuł: Obliczenia granularne w przetwarzaniu danych niezbalansowanych

Promotor: prof. dr hab. Jarosław Stepaniuk

Promotor pomocniczy: dr inż. Magdalena Topczewska

Streszczenie:

Rozprawa doktorska, której dotyczyć będzie prezentacja, obejmuje zagadnienie przetwarzania danych niezbalansowanych. Dane tego typu charakteryzują się znaczną dysproporcją liczebności próbek reprezentujących poszczególne klasy decyzyjne. W sytuacji braku wystarczających informacji na temat klasy mniejszościowej, przy jednoczesnej dużej ilości danych z klasy większościowej, standardowe klasyfikatory mają tendencję do podejmowania decyzji na korzyść dominującej klasy. Dodatkowych trudności w procesie uczenia przysparza znaczna złożoność dystrybucji danych, rozumiana jako dekompozycja klasy mniejszościowej, niejednoznaczność strefy brzegowej oraz szum na poziomie obserwacji. Udowodniono, że współwystępowanie dwóch wymienionych czynników (dysproporcji w liczebnościach danych z różnych klas i wysokiej złożoności dystrybucji danych) powoduje zauważalną degradację wyników klasyfikacji. Problem ten występuje powszechnie w wielu dziedzinach. W ramach rozprawy doktorskiej przedstawiony jest nowy algorytm Rough Granular Approach (RGA), umożliwiający niwelowanie wspomnianych trudności z wykorzystaniem obliczeń granulanych. Podejście to umożliwia identyfikowanie określonych rodzajów obserwacji, formujących granule informacyjne i w rezultacie selektywne generowanie danych, dążąc do wyrównania liczebności przykładów z różnych klas. W celu dodatkowej poprawy jakości klasyfikacji, usuwane są niejednoznaczności wykryte wśród syntetycznych próbek reprezentujących klasę mniejszościową. Zakres rozprawy doktorskiej obejmuje również zbadanie wpływu zmian parametrów algorytmu na wyniki klasyfikacji.

Publikacje:

  1. K. Borowska, Obliczenia granularne w przetwarzaniu danych niezbalansowanych, Wybrane zagadnienia informatyki technicznej. Oficyna Wydawnicza PB, 2021, (w druku)
  2. K. Borowska, J. Stepaniuk, A rough-granular approach to the imbalanced data classification problem, Applied Soft Computing, vol. 83, 2019, Web of Science, Scopus
  3. K. Borowska, J. Stepaniuk, Granular Computing and Parameters Tuning in Imbalanced Data Preprocessing, Lecture Notes in Computer Science 11127, Springer, 2018, 233-245, Web of Science, Scopus
  4. K. Borowska, J. Stepaniuk, Rough Sets in Imbalanced Data Problem: Improving Re-sampling Process, Lecture Notes in Computer Science 10244, Springer, 2017, 459-469, Web of Science, Scopus
  5. K. Borowska, J. Stepaniuk, Imbalanced Data Classification: A Novel Re-sampling Approach Combining Versatile Improved SMOTE and Rough Sets, Lecture Notes in Computer Science 9842, Springer, 2016, 31-42, Web of Science, Scopus
  6. K. Borowska, M. Topczewska, New Data Level Approach for Imbalanced Data Classification Improvement, Proceedings of the 9th International Conference on Computer Recognition Systems: CORES 2015, vol. 403, 283-294, 2016
  7. K. Borowska, M. Topczewska, Data preprocessing in the classification of the imbalanced data, Advances in Computer Science Research, 31-46, 2014

Na skróty
× W ramach naszego serwisu www stosujemy pliki cookies zapisywane na urządzeniu użytkownika w celu dostosowania zachowania serwisu do indywidualnych preferencji użytkownika oraz w celach statystycznych.
Użytkownik ma możliwość samodzielnej zmiany ustawień dotyczących cookies w swojej przeglądarce internetowej.
Więcej informacji można znaleźć w Polityce Prywatności
Korzystając ze strony wyrażają Państwo zgodę na używanie plików cookies, zgodnie z ustawieniami przeglądarki.
Akceptuję Politykę prywatności i wykorzystania plików cookies w serwisie.