Attachment 'README_pl.txt'
Download 1 Spejd 0.8.4
2
3 Copyright (C) IPI PAN, 2007-2010. Wszelkie prawa zastrzeżone.
4 Spejd jest rozprowadzany na warunkach Powszechnej Licencji Publicznej
5 GNU (GNU GPL); patrz plik doc/gpl.txt
6
7 O PROGRAMIE
8
9 Spejd to Składniowy Parser (Ewidentnie Jednocześnie Dezambiguator).
10
11 Spejd jest parserem powierzchniowym, umożliwiającym jednoczesne
12 identyfikowanie konstrukcji składniowych i ujednoznacznianie wyników
13 analizy morfologicznej, opracowanym w Instytucie Podstaw Informatyki PAN.
14
15 Strona o Spejdzie:
16
17 http://nlp.ipipan.waw.pl/Spejd/
18
19 Ostatnie wersje:
20 0.8.4: bugfix
21 0.8.3: bugfix
22 0.8.2: bugfix
23 0.8.1:
24
25 Zmiany w porównaniu z ostatnią stabilną wersją programu obejmują między innymi:
26 - Zintegrowany z programem moduł przetwarzania czystego tekstu oraz
27 analizator morfosyntaktyczny Morfologik (http://morfologik.blogspot.com/).
28 Moduł przetwarzania czystego tekstu wymaga, aby pliki wejściowe posiadały
29 rozszerzenie .txt oraz kodowanie znaków określone przez parametr
30 inputEncoding w pliku konfiguracyjnym. Przetwarzanie czystego tekstu
31 określa parametr inputType (auto lub txt).
32 - Równoległe przetwarzanie (efekty widoczne na maszynach wieloprocesorowych).
33 Liczba wątków przetwarzających określona jest parametrem maxThreads
34 w pliku konfiguracyjnym.
35 - Nieskomplikowany moduł korekty pisowni, a zwłaszcza braku polskich znaków
36 diakrytycznych ("ogonków"). Listę przekształceń zawiera plik ogonkifier.ini.
37 - Zmiany opisane w doc/changes0_5.txt.
38
39 WYMAGANIA
40
41 Sun Java Runtime Environment w wersji 1.5 lub wyższej.
42
43 Uwaga: program może dać się uruchomić na alternatywnych
44 implementacjach Javy, jednak ze względu na różnice w implementacji
45 wyrażeń regularnych, nie możemy zagwarantować jego poprawnego
46 działania.
47
48 INSTALACJA
49
50 Wystarczy rozpakować plik z programem do dowolnie wybranego katalogu.
51
52 WYWOŁANIE PROGRAMU
53
54 java -jar spejd.jar sciezka [opcje]
55
56 Gdzie:
57
58 - sciezka - plik lub katalog zawierający pliki do przetworzenia w
59 formacie XML CES (.xml) lub tekstowym (.txt); dodatkowo, parsowane
60 bedą tylko pliki pasujące do wzorca zdefiniowanego w config.ini
61 (parametr inputFiles); podkatalogi bedą sprawdzane rekurencyjnie).
62
63 - opcje - opcjonalny ciąg argumentów postaci zmienna=wartość; zmienne
64 odpowiadają zmiennym z pliku config.ini, wartości przekazane jako
65 parametr wywołania "nadpisują" konfigurację domyślną z pliku
66
67 Przykłady:
68
69 java -jar spejd.jar corpus nullAgreement=1
70 java -jar spejd.jar corpus rules=rules2.sr logDir=log2
71 java -jar spejd.jar corpus discardDeleted=true outputSuffix=.sh2.xml
72
73 WYNIKI
74
75 W przypadku plików xml, dla każdego podkatalogu, w którym znaleziony
76 zostanie plik.xml lub plik.xml.gz, tworzony jest plikSh.xml,
77 który stanowi kopię plik.xml z przydzielonymi identyfikatorami,
78 oznakowanymi wyrazami i grupami składniowymi. W przypadku plików
79 tekstowych tworzony jest nowy plik xml.
80
81 W podkatalogu log generowane są ponadto następujące pliki:
82
83 rules.compiled - skompilowany zbiór reguł
84
85 rules.matched.csv - statystyki reguł: dla każdej reguły podawana jest
86 liczba ukończonych (ewaluowanych do true) dopasowań, liczba
87 dopasowań w ogóle, czas dopasowywania, czas ewaluacji, łączny czas
88
89 tagdict.ini - słowniczek tłumaczeniowy z tagsetu zdefiniowanego
90 w pliku konfiguracyjnym na wewnętrzny format pozycyjny
91
92 DOKUMENTACJA
93
94 doc/spade.pdf - artykuł o Spejdzie
95 doc/xcesAnaIPI.dtd - DTD wejściowego formatu plików
96 api/ - dokumentacja techniczna
97
98 PRZYKŁAD
99
100 ./sample-morfeusz.cfg - przykładowy tagset Morfeusza
101 ./sample-morfologik.cfg - przykładowy tagset Morfologika (wymagany dla plików tekstowych)
102 ./rules.sr - przykładowy zbiór reguł
103 doc/morph.xml - przykładowe wejście (XML) do parsera
104 doc/morphSh.xml - przykładowe wyjście
105 doc/display.* - arkusze stylów i przykładowe wyjście
106
107 KONTAKT
108
109 Pytania, uwagi, nowe lepsze wersje Spejda można umieszczac na bugtrackerze
110 Spejda na sourceforge (link ze strony domowej).
Attached Files
To refer to attachments on a page, use attachment:filename, as shown below in the list of files. Do NOT use the URL of the [get] link, since this is subject to change and can break easily.You are not allowed to attach a file to this page.