Dla sprawdzenia napisaem may program zliczajcy liczby wystpie poszczeglnych 
znakw ASCII w plikach po korekcie. Wynik jego dziaania znajduje si w zaczniku -
moe pomc w wykryciu bdw, np. poprzez sprawdzenie wystpie znakw o "niepodanych" 
kodach (poniej).


Znaki interpunkcyjne:
- kropka, przecinek, rednik, dwukropek, wykrzyknik, znak zapytania - stosowane poprawnie,
  po kodzie liczbowym (pytanie[141]:)

  (czy zawsze? do sprawdzenia przy dopisywaniu).

- mylnik, dywiz - zgodnie z intuicj;

- wielokropek - oddzielony lub nie oddzielony spacj od sowa poprzedzajcego.
  Czasem wydaje mi si, e zosta uyty w zastpstwie lub wraz z oznaczeniem koca prbki.

- podwjna kropka - w prozie i dramacie - czasami wydaje si, e wyrnia dialogi
  (wystpuj rwnie zwyczajne wielokropki), ale to moe nie by dobra intuicja,
  bo wystpuj cigi ".. .."

- nawias - zgodnie z intuicj; zamykajcy midzy kodem fleksyjnym a znakiem interpunkcyjnym.

- cudzysw:

"
\textit{Cudzysw oryginalny, wystpujcy na papierowej fiszce korpusu.}

Przykad:

... przedsiwzili "wszelkie[242] konieczne[242] kroki[142] bezpieczestwa[121]" ...

Uwaga:
Powyszy format dotyczy wszystkich stylw prcz publicystyki, gdzie cudzysowy 
oznaczane s znakami #132 i #148.


W dramacie i prozie cudzysowy s wyraane podwjnymi apostrofami i przecinkami:

,,Alicja[/][111] W[/][66] Krainie[/][161] Czarw[/][122]'' 
wykrztusia sowo[141] ,,tam[8]'' 




Oto przykady oznacze cudzysoww w nagwkach prbek:

974~K. Lubelczyk~"wity" od fizylierw~MON~1967~s. 50
1693~Ajnenkiel A.~Od >>rzdw ludowych<< do przewrotu majowego~WP~1964~273~24
1174~J. Janicki~Kuzyn z cyklu: "Dzielnica Maliniaka~P R~X 66~s. 16




Uwaga na oznaczenia wielowyrazowych nazw wasnych: 

- imiona wasne - oznaczany jest kady czon:
  Barbara[/] Toeplitz[/] 

- nazwy geograficzne - rnie, take jeli chodzi o oznaczenia cznoci:
  Sao[+] Paulo[/]
  Ogrd[/][111] Saski[/][211] 

- tytuy - oznaczenie po kadym czonie:
  Sztandar[/] Pracy[/]
  pod[65] tytuem ["]Psychologiczne[/][212] aspekty[/][112] kierowania[/][121] 
  zespoami[/] ludzkimi[/]["] 



Polskie litery:

 185
 230
 198
 234
 202
 179
 163
 241
 243
 211
 156
 140
 159
 143
 191
 175


Pozostae znaki:

138    (pojedyncze wystpienie: Roska[/] tefanova[/])
154    (dwa wystpienia: Frane[/] Ilei[/], Uro[/] Kraigher[/])
225    (W[66] kronikach Quauhtinchn[/] mwi si[41]...)
232    (miejscowo[111] Galinik[/])
233    (profesor Mol[/])
246    (z[65] silnikiem Gnme[/])
252    (fhrera[141])


Zwracam te uwag na znaki o kodach 146, 150 i 151 - inny zapis apostrofu i dywizw
(mylnikw?)


Nie wiem, jak dokadnej korekty dokonano, gdy gdzieniegdzie pozostay bdne formy
zawierajce znaki interpunkcyjne (B:oll[/], postanowiy utworzy').
By moe takie teksty zawieray fiszki. Oczywicie takie bdy znajduj przypadkowo,
wic trudno oceni, ile ich pozostao.





Oznaczenia metatekstowe

Wyjanienia kursyw pochodz z pracy Marty.

[#]
\textit{Oznaczenia koca prbki, z oryginau ktrej wykrelono wicej ni jeden znak;
przed oznaczeniem wystpuje spacja; pojawia si na kocu prbki.}

Niedokoczone prbki powstay ju na etapie zbierania materiaw i nie mog by
uzupenione na podstawie fiszek (ich zawarto jest take ucita).

Przykad:

...Pocztek prbki... 
W[66] slalomie[161] specjalnym[261] mczyzn, w[66] tych[262] trudnych[262] warunkach 
najlepszy[211] okaza[501] si jeden[211] z[62] weteranw[122] naszego[221] [#]




[$]
\textit{Uyte w tekcie fiszki nie przyswojone wyrazy obce (bezporednie cytaty z jzykw
obcych).}

Przy opisie wielowyrazowych - po drugim czonie.

Przykad:

... tygodnika ["]Jeune[+] Afrique[$]["] ...


[&]
\textit{Urwany tekst ostatniego zdania prbki; zdanie nie koczy si kropk, znakiem zapytania
lub wykrzyknikiem, na kocu tekstu prbki wystpuje wielokropek lub nie ma adnego znaku
interpunkcyjnego; przed oznaczeniem wystpuje spacja.}

Przykad:

Z[62] bardziej interesujcych[222] pojedynkw naley oczekiwa nastpujcych[222] 
walk: [&]

ale te w rodku!

W[66] imieniu dwu[32] tysicy[122] studentw[122] Uniwersytetu Warszawskiego[221] 
zgromadzonych[222] w[66] auli[161] Auditorium[+] Maximum[&], rektor uczelni[121], 
profesor Stanisaw[/] Turski[/] powita wicepremiera[141] Zenona[/][141] Nowaka[/][141] ...


'
Tylko w funkcji apostrofu (czasem te jakie nie poprawione bdy):

Z[62] Aten[/] donosz, i rzdy[112] Grecji[/][121] i Turcji[/][121] 
postanowiy utworzy' wsplny[241] organ[141] ...

Ruby'ego, Gaulle'a

(
) - dlaczego rna liczba?

[+]
\textit{Wystpuje pomidzy wyrazami jednej sowoformy analitycznej, bezporednio 
po pierwszym wyrazie sowoformy; po oznaczeniu wystpuje spacja.}

Przykad:

przeksztacajcego[221][+] si 
po[+] prostu 
przede[65][+] wszystkim[45]


[/]
\textit{Nazwy wasne; pojawia si bezporednio po wyrazie; jeli forma skada si
z czci poczonych dywizem (np. nazwiska), oznaczenie pojawia si na kocu formy;
w przypadku form analitycznych po kadym wyrazie wystpuje osobne oznaczenie;
czsto pojawia si tylko przy wyrazach, ktre byy niezrozumiae dla analizatora.}

Przykad

Iwaszkiewicza[/][121]
Polsce[/][161]


[~]
\textit{W treci prbki brak fragmentu tekstu; wystpuje w miejscu wykrelonych formu,
np. wzorw, symboli etc.; przed oznaczeniem wystpuje spacja.}

Przykad:

... po[66] mierci[161] Johna[/][121] [~] Kennedy'ego[/][121] ...



[||]
\textit{Pojawia si przy kocu prbki, w miejscu, w ktrym na papierowej fiszce 
midzy sowoformami zaznaczono pionow kresk; prawdopodobnie zaznaczenie granicy
po pidziesitym wyrazie.}

Wystpuje jedynie w trzech miejscach w pliku poprawianym przez Mart
(styl popularno-naukowy).

Przykady:

... zuycie[111] drewna[121] dla[62] celw energetycznych[222] 
byo dwukrotnie wiksze[211] [||] ni zuycie[111] wgla. 

... jedenacie tysicy sto osiemdziesit metrw na[64] [||] sekund, 
tor[111] pocisku stanie[501] si paraboliczny[211]. 

... Co[44] mona powiedzie wwczas o[66] cechach [||] jego[42] pamici[121]? 




[=]

\textit{Oznaczenie skrtowcw.}

Przykady:

ZSRR[=], NRF[=][161], KW[=] PZPR[=] 


[>]
\textit{Wystpuje na pocztku prbki (fiszki), jeeli pierwsze zdanie na papierowej 
fiszce nie rozpoczynao si du liter (moliwe, e nie przepisano pocztku zdania
z pozycji rdowej, gdy wystpowa na poprzedniej stronie).}

[>] s problemami caego[221] spoeczestwa[121] ...




["]
\textit{Cudzysw wystpujcy wok tytuw, bez wzgldu na to, czy pojawia si na 
oryginalnej fiszce.}

Przykad:

tureckiego[221] dziennika ["]Hurryet[$]["] 
["]Pejza[/][111] z[/][62] wyspy[/][121]["]

Uwaga:
Powyszy format dotyczy wszystkich stylw prcz publicystyki, gdzie cudzysowy 
oznaczane s znakami #132 i #148.


@

Proza, 531
Masz @@syrek, 
masz placki[142] w[66] kobiace[161] w[66] butelce[161] @@mliko, starczy[5] ci[43] 
do[62] wieczora! .. [&] ???

Pozostae: Proza 1747, 1769; dramat 147, 772 (nawet w nawiasach kwadratowych).





^

Publicystyka (numery uchwa):
 numer[111] dziesi[31] [^] pidziesit[31]  trzy[31] [^] szedziesit[31] sze[31] 
 numer[111] czternacie[31] [^] siedemdziesit[31] trzy[31] [^] szedziesit[31] trzy[31]


` (apostrof w drug stron)

Prasa 
 1858 - {atach`e}
Popularno-naukowy
  405 - Bl` eriot[/][111] x 2
  408 - Lev` eque[/] 
  423 - de[+] Lamb` ere[/] x 2             
 1584 - Jaur` es[/]







Kody fleksyjne

Napisaem te program ekstrahujcy z korpusu wszystkie kody liczbowe. 
Ich wykaz wraz z komentarzem znajduje si w drugim zaczniku. 

Nie wiem, czy bdy w kodach bd poprawione, na pewno jednak sprawi problemy
przy dopisywaniu nowych kodw. Z mojej strony mog je co najwyej ignorowa.

