Nie jesteś zalogowany | Zaloguj się

Kombinacja metody najbliższych sąsiadów z indukcją reguł dla danych niezbalansowanych

Prelegent(ci)
Grzegorz Góra
Termin
14 czerwca 2019 14:15
Pokój
p. 5820
Seminarium
Seminarium badawcze Zakładu Logiki: Wnioskowania aproksymacyjne w eksploracji danych

Chciałbym przedstawić wyniki mojej powstającej pracy doktorskiej. Praca dotyczy klasyfikacji binarnych danych niezbalansowanych. Są to takie dane, w których mamy dwie klasy decyzyjne, a przykłady z jednej klasy (większościowej) występują znacznie częściej niż przykłady z drugiej klasy (mniejszościowej). Jednocześnie klasa mniejszościowa jest ważniejsza z punktu widzenia predykcji np. są to pacjenci zagrożeni jakąś chorobą. Tego typu dane często występują w praktyce i ważne jest zastosowanie metod, które uwzględniają ten aspekt. Istotą problemu niezbalansowania jest fakt, że zastosowanie klasycznych mechanizmów uczenia na niezbalansowanym zbiorze danych może prowadzić do faworyzowania przez wyuczony klasyfikator klasy większościowej kosztem klasy mniejszościowej. Moja praca bazuje na opracowanym kiedyś systemie łączącym metody najbliższych sąsiadów z indukcją reguł (RIONA). System ten był jednakże przeznaczony do danych zbalansowanych. Rozwinięciem tego systemu jest system RIONIDA służący do klasyfikacji binarnych danych niezbalansowanych. Zaprezentuję główne idee związane z tym algorytmem oraz wyniki porównawcze z innymi podejściami do danych niezbalansowanych.