Nie jesteś zalogowany | zaloguj się

Wydział Matematyki, Informatyki i Mechaniki Uniwersytetu Warszawskiego

  • Skala szarości
  • Wysoki kontrast
  • Negatyw
  • Podkreślenie linków
  • Reset

Aktualności — Wydarzenia

Seminarium badawcze Zakładu Logiki: Wnioskowania aproksymacyjne w eksploracji danych

 

Kombinacja metody najbliższych sąsiadów z indukcją reguł dla danych niezbalansowanych


Prelegent: Grzegorz Góra

2019-06-14 14:15

Chciałbym przedstawić wyniki mojej powstającej pracy doktorskiej. Praca dotyczy klasyfikacji binarnych danych niezbalansowanych. Są to takie dane, w których mamy dwie klasy decyzyjne, a przykłady z jednej klasy (większościowej) występują znacznie częściej niż przykłady z drugiej klasy (mniejszościowej). Jednocześnie klasa mniejszościowa jest ważniejsza z punktu widzenia predykcji np. są to pacjenci zagrożeni jakąś chorobą. Tego typu dane często występują w praktyce i ważne jest zastosowanie metod, które uwzględniają ten aspekt. Istotą problemu niezbalansowania jest fakt, że zastosowanie klasycznych mechanizmów uczenia na niezbalansowanym zbiorze danych może prowadzić do faworyzowania przez wyuczony klasyfikator klasy większościowej kosztem klasy mniejszościowej. Moja praca bazuje na opracowanym kiedyś systemie łączącym metody najbliższych sąsiadów z indukcją reguł (RIONA). System ten był jednakże przeznaczony do danych zbalansowanych. Rozwinięciem tego systemu jest system RIONIDA służący do klasyfikacji binarnych danych niezbalansowanych. Zaprezentuję główne idee związane z tym algorytmem oraz wyniki porównawcze z innymi podejściami do danych niezbalansowanych.