Celem zajęć jest przygotowanie studentów do efektywnego korzystania z dostępnych słowników elektronicznych oraz do aktywnego uczestnictwa przy ich rozbudowie i tworzeniu nowych specjalistycznych słowników (w tym na potrzeby lokalizacji oprogramowania). Zostanie to osiągnięte przez praktyczną znajomość najważniejszych krajowych i zagranicznych słowników elektronicznych (jedno- i dwujęzycznych) oraz opanowanie umiejętności tworzenia i rozbudowy słowników za pomocą odpowiednich narzędzi informatycznych.
Wykładowca jest informatykiem (do 1998 r. pracownikiem Instytutu Informatyki UW) i lingwistą. Prowadzący laboratorium mgr Buczyński jest informatykiem zatrudnionym w Zespole Inżynierii Lingwistycznej Instytutu Podstaw Informatyki PAN.
Warunkiem zaliczenia laboratorium będzie wykonanie dwóch zadań. Jedno proste zadanie będzie obowiązkowe dla wszystkich uczestników.Drugie zadanie może być wybrane z obszernej oferty lub zaproponowane przez uczestnika. Niektóre zadania mogą nawiązywać tematycznie do zadań z edycji 2005/2006 (http://duch.mimuw.edu.pl/~abuczyns/slowniki/).
Egzamin w formie testu będzie przeznaczony dla tych studentów, którzy będą chcieli poprawić ocenę zaproponowaną na laboratorium.
Do wyników prac studenckich wykonywanych w ramach zajęć stosowana będzie odpowiednia licencja GNU (GPL lub GFDL) lub podobna.
Planowane terminy:
Program:
1. Graficzne digitalizacje słowników tradycyjnych (np. Century, epSJPDor).
2. Tekstowe digitalizacje słowników tradycyjnych (np. OED, TLF, KSJP).
3. Słowniki internetowe - protokół HTTP (np. Wiktionary, PWN).
4. Słowniki internetowe - protokół DICT (np. Webster).
5. Inne słowniki elektroniczne, w tym terminologiczne -- np. IATE.
6. Struktura słowników - podstawowe pojęcia (na podstawie m.in. Zrozumieć leksykografię).
7. Korpusy tekstów (na przykładzie m.in. IPI PAN) i ich wykorzystanie w leksykografii.
8. Rekomendacje TEI dotyczące słowników.
9. Zdecentrowalizowane tworzenie słowników (np. Wiki)
10. Słowniki systemów wspomagających tłumaczenie, np. OmegaT.
Ważniejsze źródła:
Text Encoding Initiative. http://www.tei-c.org/
FreeDict. http://freedict.org/
Wiktionary. http://en.wiktionary.org/