Strona zawiera informacje dotyczące zasobów i narzędzi związanych z przetwarzaniem języka naturalnego, które można uruchomić lokalnie lub poprzez internet. Strony WWW, opisujące jedynie działanie takich zasobów czy narzędzi lub podające jedynie przykłady ich działania, ale nie mające pełnej funkcjonalności ostatecznego produktu, nie są tutaj podane. Z kolei dowiązania do stron WWW przedstawiających istotne i pożyteczne próbki zasobów zostały tu umieszczone. Ponieważ kryteria wyboru prezentowanych poniżej zasobów nie są jednoznaczne, wszelkie uwagi mile widziane.
Korpusy tekstów języka polskiego:
Korpus PICLE (polska część korpusu International Corpus of Learner English; P. Kaszubski)
Analizatory morfologiczne / Słowniki fleksyjne:
Analizator morfologiczny [[http://sgjp.pl/morfeusz/|Morfeusz SGJP]
- Analizator morfologiczny SAM-95 (K. Szafran)
- Fleksyjna baza danych (W. Lubaszewski et al.; demo)
Neurosoft Gram (demo)
- Narzędzia Xerox (tokenizator, analizator morfologiczny, dezambiguator; demo)
Narzędzia leksykalne wykorzystujące automaty skończone (J. Daciuk)
lematyzator D. Weissa
Stempel, jeszcze jeden lematyzator (A. Białecki)
Analizatory składniowe / Gramatyki elektroniczne:
- Prototyp gramatyki HPSG języka polskiego (IPI PAN)
Systemy tłumaczenia maszynowego (demo dostępne przez internet):
Translatica (dwukierunkowy angielsko-polski system tłumaczący)
InterTran (różne pary języków)
LingvoBit (dwukierunkowy angielsko-polski system tłumaczący)
Systran (z angielskiego na polski i z polskiego na francuski, oprócz innych par języków)
- Thetos (system tłumaczący polski tekst na polski język migowy)
Inne:
Kolokacje, program do znajdowania kolokacji (A. Buczyński)
Bibliografia polskiej lingwistyki kwantytatywnej (A. Pawłowski)