next up previous
Następny: O tym dokumencie ...

Rok akademicki 2003/2004

Seminarium magisterskie
Narzędzia i metody przetwarzania tekstów
    
dr hab. Janusz S. Bień, prof. UW
dr Krzysztof Szafran
    


czwartki, godz. 1215-1345
sala 4081 (trzecie piętro, wejście przez s. 4080)

Seminarium jest przeznaczone dla studentów informatyki zainteresowanych różnymi aspektami przetwarzania języka naturalnego, a także globalizacją i lokalizacją oprogramowania.

Tematyka seminarium jest bardzo szeroka, o czym świadczą tematy już ukończonych prac magisterskich (patrz np. http://www.mimuw.edu.pl/~jsbien/ i http://www.mimuw.edu.pl/~kszafran/). Niepełna lista proponowanych tematów znajduje się dalej na niniejszej stronie (w wielu wypadkach temat już obronionej pracy może być wykorzystany ponownie w celu np. zastosowania nowszych narzędzi czy istotnie szerszego potraktowania problemu).

Obejmuje ona m.in. metody ścisłego opisu różnych aspektów języka naturalnego -- w szczególności morfologii i składni języka polskiego -- oraz wykorzystanie w praktyce dostępnych zasobów lingwistycznych np. do różnych form automatycznej analizy tekstów. Interesują nas również problemy tłumaczenia dokumentacji technicznej (na przykładzie Linux Documentation Project), narzędzia do wspomagania takiego tłumaczenia przez automatyczna analizę tekstów oryginalnych oraz porównywanie istniejących tłumaczeń (tzw. korpusy równoległe), tworzenie i uaktualnianie słowników terminologicznych itp.

W naturalny sposób do zakresu seminarium należy również problematyka reprezentacji tekstów, w tym wielojęzycznych (XML, SGML, TEI, DocBook) oraz narzędzi do ich edycji i składu, w szczególności konwersji między różnymi formatami (np. WVware, LaTeX2html).

Preferowane są tematy prac magisterskich prowadzące do powstania oprogramowania dostępnego na licencji GNU i nadającego się do włączenia do oficjalnych dystrybucji. Najbardziej pożądaną formą wyników programistycznych jest pakiet dystrybucyjny systemu Debian GNU/Linux, dostarczony na samobootującej się płycie z odpowiednio zmodyfikowanym systemem Knoppix (http://www.knoppix.org). Stąd w tematyce seminarium mieszczą sie zagadnienia takie, jak tworzenie pakietów dla dystrybucji Debian GNU/Linux, bug tracking systems itp.

Konkretne tematy prac magisterskich będą formułowane w trakcie naszych wykładów monograficznych. Uczestnicy mogą też zgłaszać swoje własne propozycje inspirowane materiałami (lub odsyłaczami do nich), które są dostępne m.in. na witrynie seminarium Lingwistyka informatyczna i przetwarzanie tekstów (http://www.orient.uw.edu.pl/~zzi/lipt/ lub http://www.mimuw.edu.pl/~zzi/lipt/) oraz pod adresami http://www.mimuw.edu.pl/polszczyzna/ (strona w budowie) i ftp://ftp.mimuw.edu.pl/pub/users/polszczyzna/.

Oferujemy też tematy prac magisterskich wymagających tylko kwalifikacji czysto informatycznych. Oto niepełna lista przykładowych tematów tego typu (będzie ona sukcesywnie uzupełniana o adresy internetowe i dodatkowe wyjaśnienia). Kolejność jest nieistotna.

Nie stawiamy uczestnikom żadnych konkretnych warunków wstępnych, ale w razie nadmiaru zgłoszeń preferowani są słuchacze naszych własnych wykładów monograficznych a także słuchacze wykładów XML i nowoczesne technologie zarządzania treścią oraz Programowanie WWW. Pożyteczna może być też znajomość języków perl i Prolog.

Uczestnicy seminarium są zobowiązani do subskrypcji zamkniętej listy pocztowej nmtp-l (http://duch.mimuw.edu.pl/mailman/listinfo/nmpt-l) oraz do przedstawiania streszczeń swoich referatów na ogólnodostępnej moderowanej liście nmpt-ann (http://duch.mimuw.edu.pl/mailman/listinfo/nmpt-ann). Na listach tych można uzyskać dodatkowe informacje na temat seminarium.


Skrócona wersja niniejszego zawiadomienia jest również dostępna w formacie PDF i PostScript





next up previous
Następny: O tym dokumencie ...
Janusz S. Bień 2004-01-21