Oto cz komentarza Kasi dla nieodmiennych:
> Staralam sie dopasowac kody do kazdego slowa. Jak cos nigdzie nie pasowalo, 
> to uznawalam to za partykule. Czasami mozliwych jest kilka kodow 
> (to zalezy od kontekstu, ktorego nie mam czasu sprawdzac - zreszta nie mam
> plikow korpusu). Poza tym chyba powinno sie cos zrobic ze spojnikami, 
> do ktorych dolaczono koncowki czasownikowe, np. "alem, eby" itd. 
> Jesli trzeba, to zapisze to w postaci tagow kombinowanych: 
> spojnikowo-czasownikowych, tzn. wiadomo bedzie, ze to spojnik, 
> ale bedzie mial informacje morfologiczne czasownika (liczba, osoba, tryb).
> Pogadaj o tym z Marcinem - moze on ma inna propozycje.

I dla nieznanych:
> 4. Zostalo nie rozpoznanych 58 hasel (oznaczone !!! lub ??? jesli wyraz
> znam, ale nie wiem, co z nim zrobic). Sa to przede wszystkim cytaty (wyrazy
> wziete zywcem z innego jezyka) niemieckie i lacinskie. Mysle, ze trzeba dac
> im jakis neutralny kod (czy mamy jakis X na oznaczenie, ze czesc mowy
> nieznana), zwlaszcza ze tych wyrazow sie nie odmienia.

Wydaje mi si, e z garstk zupenie nieklasyfikowalnych (bez wikszego
wysiku) wyrazw nie warto robi nic wicej ni to, co proponuje Kasia.
Jeli chcesz, moge je oznaczy inaczej - na razie na licie kodw maj one
przypisany znacznik 'X' (i dziesi minusw, dla zachowania staej dugoci
tagu). Znaki interpunkcyjne oznaczam 'Y'-kiem, zgodnie z tym, co
napisalicie w tagsecie.
