Klasyfikacja polskich tekstów w oparciu o preferencje użytkownika
- Prelegent(ci)
- Krzysztof Sopyła
- Termin
- 15 stycznia 2010 14:15
- Pokój
- p. 5080
- Seminarium
- Seminarium badawcze Zakładu Logiki: Wnioskowania aproksymacyjne w eksploracji danych
Najczęstszym zadaniem klasyfikacji tekstów jest przypisanie
danego dokumentu do klasy zawierającej informację czego ten
tekst dotyczy (sportu, medycyny itp.) W swojej pracy
postanowiłem zbadać czy nowoczesne algorytmy jak SVM (suport
vector machines) potrafią dobrze klasyfikować tekst na
podstawie subiektywnych ocen ludzi - tak aby w automatyczny
sposób weryfikować, czy tekst jest interesujący z punktu
widzenia danego użytkownika? Próbowano także odpowiedzieć na
pytanie jakie jądra w tej sytuacji będą działały dobrze oraz
wybrać stosowną reprezentację tekstu. Jako dane testowe
posłużyły polskie artykuły z wikipedii.