next up previous
Następny: O tym dokumencie ...

Rok akademicki 2004/2005

Seminarium magisterskie
Narzędzia i metody przetwarzania tekstów
    
dr hab. Janusz S. Bień, prof. UW
dr Krzysztof Szafran
    


czwartki, godz. 1215-1345
Instytut Informatyki UW, ul. Banacha 2 (wejście od ul. Pasteura)
sala 4030 [ZMIANA!] (trzecie piętro)

Seminarium jest przeznaczone dla studentów informatyki zainteresowanych różnymi aspektami przetwarzania języka naturalnego, a także globalizacją i lokalizacją oprogramowania. Na indywidualnie ustalonych zasadach mogą w nim również uczestniczyć zainteresowani humaniści.

Tematyka seminarium jest bardzo szeroka, o czym świadczą już ukończone prace magisterskie (patrz np. http://www.mimuw.edu.pl/~jsbien/ i http://www.mimuw.edu.pl/~kszafran/). Niepełna lista proponowanych tematów znajduje się dalej na niniejszej stronie (w wielu wypadkach temat już obronionej pracy może być wykorzystany ponownie w celu np. zastosowania nowszych narzędzi czy istotnie szerszego potraktowania problemu). Obejmuje ona m.in. metody ścisłego opisu różnych aspektów języka naturalnego -- w szczególności morfologii i składni języka polskiego -- oraz wykorzystanie w praktyce dostępnych zasobów lingwistycznych np. do różnych form automatycznej analizy tekstów. Interesują nas również problemy tłumaczenia dokumentacji technicznej (na przykładzie Linux Documentation Project), narzędzia do wspomagania takiego tłumaczenia przez automatyczna analizę tekstów oryginalnych oraz porównywanie istniejących tłumaczeń (tzw. korpusy równoległe), tworzenie i uaktualnianie słowników terminologicznych itp.

W naturalny sposób do zakresu seminarium należy również problematyka reprezentacji tekstów, w tym wielojęzycznych (XML, SGML, TEI, DocBook) oraz narzędzi do ich edycji i składu, w szczególności konwersji między różnymi formatami (np. WVware, LaTeX2html).

Preferowane są tematy prac magisterskich prowadzące do powstania oprogramowania dostępnego na licencji GNU i nadającego się do włączenia do oficjalnych dystrybucji. Najbardziej pożądaną formą wyników programistycznych jest pakiet dystrybucyjny systemu Debian GNU/Linux, dostarczony na samobootującej się płycie z odpowiednio zmodyfikowanym systemem Knoppix (http://www.knoppix.org) lup podobnym (np. Morphix). Stąd w tematyce seminarium mieszczą sie zagadnienia takie, jak tworzenie pakietów dla dystrybucji Debian GNU/Linux, bug tracking systems itp.

Uczestnicy seminarium mogą zgłaszać swoje własne propozycje tematów prac, np. inspirowane kwestiami poruszanymi na liście pocztowej nmpt-ann, której archiwum jest publicznie dostępne pod adresem http://duch.mimuw.edu.pl/mailman/pipermail/nmpt-ann/, a także informacjami i materiałami dostępnymi pod adresami http://www.mimuw.edu.pl/~zzi/lipt/, http://www.mimuw.edu.pl/polszczyzna/ i ftp://ftp.mimuw.edu.pl/pub/users/polszczyzna/.
Oferujemy też tematy prac magisterskich wymagające tylko kwalifikacji czysto informatycznych (szczególnie atrakcyjne dla ,,zesłańców'', którzy nie dostali się na preferowane przez siebie seminarium).

Oto niepełna lista przykładowych tematów (będzie ona sukcesywnie uzupełniana o adresy internetowe i dodatkowe wyjaśnienia). Kolejność jest nieistotna.

Nie stawiamy uczestnikom żadnych konkretnych warunków wstępnych, ale w razie nadmiaru zgłoszeń preferowani są słuchacze naszych własnych wykładów monograficznych a także słuchacze wykładów Inżynieria lingwistyczna, XML i nowoczesne technologie zarządzania treścią oraz Programowanie WWW. Pożyteczna może być też znajomość języków perl i Prolog.

Uczestnicy seminarium są zobowiązani do subskrypcji zamkniętej listy pocztowej nmtp-l (http://duch.mimuw.edu.pl/mailman/listinfo/nmpt-l) oraz do przedstawiania streszczeń swoich referatów na ogólnodostępnej moderowanej liście nmpt-ann (http://duch.mimuw.edu.pl/mailman/listinfo/nmpt-ann).


Skrócona wersja niniejszego zawiadomienia jest również dostępna w formacie PDF i PostScript





next up previous
Następny: O tym dokumencie ...
Janusz S. Bień 2004-09-27