Locked History Actions

attachment:README_pl.txt of Spejd

Attachment 'README_pl.txt'

Download

   1 Spejd 0.8.4
   2 
   3 Copyright (C) IPI PAN, 2007-2010. Wszelkie prawa zastrzeżone.
   4 Spejd jest rozprowadzany na warunkach Powszechnej Licencji Publicznej
   5 GNU (GNU GPL); patrz plik doc/gpl.txt
   6 
   7 O PROGRAMIE
   8 
   9 Spejd to Składniowy Parser (Ewidentnie Jednocześnie Dezambiguator). 
  10 
  11 Spejd jest parserem powierzchniowym, umożliwiającym jednoczesne 
  12 identyfikowanie konstrukcji składniowych i ujednoznacznianie wyników
  13 analizy morfologicznej, opracowanym w Instytucie Podstaw Informatyki PAN.
  14 
  15 Strona o Spejdzie:
  16 
  17 http://nlp.ipipan.waw.pl/Spejd/
  18 
  19 Ostatnie wersje:
  20 0.8.4: bugfix
  21 0.8.3: bugfix
  22 0.8.2: bugfix
  23 0.8.1:
  24 
  25 Zmiany w porównaniu z ostatnią stabilną wersją programu obejmują między innymi:
  26 - Zintegrowany z programem moduł przetwarzania czystego tekstu oraz 
  27   analizator morfosyntaktyczny Morfologik (http://morfologik.blogspot.com/). 
  28   Moduł przetwarzania czystego tekstu wymaga, aby pliki wejściowe posiadały 
  29   rozszerzenie .txt oraz kodowanie znaków określone przez parametr 
  30   inputEncoding w pliku konfiguracyjnym. Przetwarzanie czystego tekstu 
  31   określa parametr inputType (auto lub txt).
  32 - Równoległe przetwarzanie (efekty widoczne na maszynach wieloprocesorowych).
  33   Liczba wątków przetwarzających określona jest parametrem maxThreads 
  34   w pliku konfiguracyjnym.
  35 - Nieskomplikowany moduł korekty pisowni, a zwłaszcza braku polskich znaków
  36   diakrytycznych ("ogonków"). Listę przekształceń zawiera plik ogonkifier.ini.
  37 - Zmiany opisane w doc/changes0_5.txt.
  38 
  39 WYMAGANIA
  40 
  41 Sun Java Runtime Environment w wersji 1.5 lub wyższej.
  42 
  43 Uwaga: program może dać się uruchomić na alternatywnych
  44 implementacjach Javy, jednak ze względu na różnice w implementacji
  45 wyrażeń regularnych, nie możemy zagwarantować jego poprawnego
  46 działania.
  47 
  48 INSTALACJA
  49 
  50 Wystarczy rozpakować plik z programem do dowolnie wybranego katalogu.
  51 
  52 WYWOŁANIE PROGRAMU
  53 
  54 java -jar spejd.jar sciezka [opcje]
  55 
  56 Gdzie:
  57 
  58 - sciezka - plik lub katalog zawierający pliki do przetworzenia w
  59   formacie XML CES (.xml) lub tekstowym (.txt); dodatkowo, parsowane
  60   bedą tylko pliki pasujące do wzorca zdefiniowanego w config.ini
  61   (parametr inputFiles); podkatalogi bedą sprawdzane rekurencyjnie).
  62 
  63 - opcje - opcjonalny ciąg argumentów postaci zmienna=wartość; zmienne
  64   odpowiadają zmiennym z pliku config.ini, wartości przekazane jako
  65   parametr wywołania "nadpisują" konfigurację domyślną z pliku
  66 
  67 Przykłady:
  68 
  69 java -jar spejd.jar corpus nullAgreement=1
  70 java -jar spejd.jar corpus rules=rules2.sr logDir=log2
  71 java -jar spejd.jar corpus discardDeleted=true outputSuffix=.sh2.xml
  72 
  73 WYNIKI
  74 
  75 W przypadku plików xml, dla każdego podkatalogu, w którym znaleziony
  76 zostanie plik.xml lub plik.xml.gz, tworzony jest plikSh.xml,
  77 który stanowi kopię plik.xml z przydzielonymi identyfikatorami,
  78 oznakowanymi wyrazami i grupami składniowymi.  W przypadku plików
  79 tekstowych tworzony jest nowy plik xml.
  80 
  81 W podkatalogu log generowane są ponadto następujące pliki:
  82 
  83 rules.compiled - skompilowany zbiór reguł
  84 
  85 rules.matched.csv - statystyki reguł: dla każdej reguły podawana jest
  86     liczba ukończonych (ewaluowanych do true) dopasowań, liczba
  87     dopasowań w ogóle, czas dopasowywania, czas ewaluacji, łączny czas
  88 
  89 tagdict.ini - słowniczek tłumaczeniowy z tagsetu zdefiniowanego
  90     w pliku konfiguracyjnym na wewnętrzny format pozycyjny
  91 
  92 DOKUMENTACJA
  93 
  94 doc/spade.pdf      - artykuł o Spejdzie
  95 doc/xcesAnaIPI.dtd - DTD wejściowego formatu plików
  96 api/               - dokumentacja techniczna
  97 
  98 PRZYKŁAD
  99 
 100 ./sample-morfeusz.cfg      - przykładowy tagset Morfeusza
 101 ./sample-morfologik.cfg    - przykładowy tagset Morfologika (wymagany dla plików tekstowych)
 102 ./rules.sr                 - przykładowy zbiór reguł
 103 doc/morph.xml              - przykładowe wejście (XML) do parsera
 104 doc/morphSh.xml            - przykładowe wyjście 
 105 doc/display.*              - arkusze stylów i przykładowe wyjście
 106 
 107 KONTAKT
 108 
 109 Pytania, uwagi, nowe lepsze wersje Spejda można umieszczac na bugtrackerze
 110 Spejda na sourceforge (link ze strony domowej).

Attached Files

To refer to attachments on a page, use attachment:filename, as shown below in the list of files. Do NOT use the URL of the [get] link, since this is subject to change and can break easily.
  • [get | view] (2014-12-29 14:19:30, 3.8 KB) [[attachment:README_en.txt]]
  • [get | view] (2014-12-29 14:19:30, 4.0 KB) [[attachment:README_pl.txt]]
  • [get | view] (2014-12-29 14:19:30, 4847.8 KB) [[attachment:spejd0_84.zip]]
 All files | Selected Files: delete move to page

You are not allowed to attach a file to this page.