You are not logged in | Log in

Dywersyfikacja wyników w wyszukiwaniu informacji

Speaker(s)
dr Marcin Sydow
Affiliation
PJWSTK
Seminar
Seminarium badawcze Zakładu Logiki: Wnioskowania aproksymacyjne w eksploracji danych

Podstawowym klasycznym zalozeniem przy obliczaniu porzadku wyników w wyszukiwarkach jest zalozenie o niezaleznosci przydatnosci poszczególnych wyników w odpowiedzi na zapytanie uzytkownika (ang. Independent Relevance Assumption). Wyniki prezentuje sie wtedy w nierosnacej kolejnosci dopasowania do zapytania. Podejscie takie jest efektywne, gdyz umozliwia stosowanie prostych algorytmów zachlannych do obliczania listy wyników.  Tak uproszczony model ma jednak powazne wady, gdyz moze zwracac wyniki wysoce powtarzalne albo zdominowane przez najpopularniejsza  interpretacje zapytania w przypadku zapytan wieloznacznych.

Podejscie bardziej subtelne, uwzgledniajace zaleznosci pomiedzy  zwróconymi dokumentami przy obliczaniu ich przydatnosci, które nazywac bedziemy roboczo "dywersyfikacja wyników", stanowi obecnie jeden z najgoretszych tematów w dziedzinie wyszukiwania informacji (ang. Information  Retrieval).

Na seminarium przedstawione zostana podstawy zagadnienia, rozszerzenia klasycznych miar przydatnosci wyników (NDCG), które uwzgledniaja dywersyfikacje, oraz wybrane aspekty algorytmiczne tego zagadnienia. Zreferowane zostana wybrane najnowsze prace z dziedziny oraz wymienione potencjalne kierunki dalszych badan, w tym autora, oraz pokazane beda zwiazki z podobnymi badaniami w pokrewnych dziedzinach takich jak bazy danych czy systemy rekomendacyjne.


W drugiej części seminarium odbędzie się ciąg dalszy dyskusji na temat prowadzonych projektów.