Rok akademicki 2007/2008 (semestr letni)



Wykład monograficzny

Słowniki elektroniczne.
Budowa i użytkowanie
    

dr hab. Janusz S. Bień, prof. UW
Katedra Lingwistyki Formalnej
jsbien@uw.edu.pl


Laboratorium: mgr Aleksander Buczyński     




Celem zajęć jest przygotowanie studentów do efektywnego korzystania z dostępnych słowników elektronicznych oraz do aktywnego uczestnictwa przy ich rozbudowie i tworzeniu nowych specjalistycznych słowników (w tym na potrzeby lokalizacji oprogramowania). Zostanie to osiągnięte przez praktyczną znajomość najważniejszych krajowych i zagranicznych słowników elektronicznych (jedno- i dwujęzycznych) oraz opanowanie umiejętności tworzenia i rozbudowy słowników za pomocą odpowiednich narzędzi informatycznych.

Wykładowca jest informatykiem (do 1998 r. pracownikiem Instytutu Informatyki UW) i lingwistą. Prowadzący laboratorium mgr Buczyński jest informatykiem zatrudnionym w Zespole Inżynierii Lingwistycznej Instytutu Podstaw Informatyki PAN.

Warunkiem zaliczenia laboratorium będzie wykonanie dwóch zadań. Jedno proste zadanie będzie obowiązkowe dla wszystkich uczestników.Drugie zadanie może być wybrane z obszernej oferty lub zaproponowane przez uczestnika. Niektóre zadania mogą nawiązywać tematycznie do zadań z edycji 2005/2006 (http://duch.mimuw.edu.pl/~abuczyns/slowniki/).

Egzamin w formie testu będzie przeznaczony dla tych studentów, którzy będą chcieli poprawić ocenę zaproponowaną na laboratorium.

Do wyników prac studenckich wykonywanych w ramach zajęć stosowana będzie odpowiednia licencja GNU (GPL lub GFDL) lub podobna.


Planowane terminy:

Program:

1. Graficzne digitalizacje słowników tradycyjnych (np. Century, epSJPDor).

2. Tekstowe digitalizacje słowników tradycyjnych (np. OED, TLF, KSJP).

3. Słowniki internetowe - protokół HTTP (np. Wiktionary, PWN).

4. Słowniki internetowe - protokół DICT (np. Webster).

5. Inne słowniki elektroniczne, w tym terminologiczne -- np. IATE.

6. Struktura słowników - podstawowe pojęcia (na podstawie m.in. Zrozumieć leksykografię).

7. Korpusy tekstów (na przykładzie m.in. IPI PAN) i ich wykorzystanie w leksykografii.

8. Rekomendacje TEI dotyczące słowników.

9. Zdecentrowalizowane tworzenie słowników (np. Wiki)

10. Słowniki systemów wspomagających tłumaczenie, np. OmegaT.

Ważniejsze źródła:

Text Encoding Initiative. http://www.tei-c.org/
FreeDict. http://freedict.org/
Wiktionary. http://en.wiktionary.org/




Janusz S. Bień 2007-05-15