Kőbe dermedve illeszkedik a szikra |
Harmóniakert |
Copyright © Mező Tibor, 2007 Minden jog fenntartva |
Kezdőlap |
Opus |
Szótagtár és Szótár |
Szolgáltatás |
Szótagszám-követés a szövegben
A szövegben előforduló szóalakok a szótagszámuk alapján kötött rendben követik és váltják egymást. A szótagszám-követés azt jelenti, hogy ebben a rendben egy szóalakra közvetlenül következő másik szóalak mennyi szótaggal rendelkezik, a szótagszám-váltáson pedig azt értjük, hogy a szóalakok lépésenként előrehaladva funkciót cserélnek. A szövegvizsgálat során mindegyik elem egy párból áll: egy indexből és egy értékből, amiket kettőspont választ el: Pl. szotagszam = {"3":2, "2":8, "8":8, "8":2, "2":2, "2":1, "1":2}. Ugyanezt látjuk az alábbi táblázatban, ahol az első oszlopban az indexnek, a második oszlopban az értéknek tekintett szótagszám szerepel:
|
Az indexeket kulcsnak, az elemeket pedig kulcs-érték pároknak hívjuk. A megvizsgált szövegben 37.351 szóalak volt megtalálható, és ugyanennyi kulcs-érték pár fordult elő. (Forrás: Szentkuthy Miklós: Szent Orpheus Breviáriuma, 2. kiadás, Budapest, 2. kötet, 11-110. oldal, ill. www.szotagtar.harmoniakert.hu/szotagolas)
A szavakat szótagszámuk alapján különböztetem meg, és változónevet adok nekik az alábbiak szerint: d = ’egy szótagos szó’ 11.998 a = ’két szótagos szó’ 10.250 b1 = ’három szótagos szó’ 7.654 b2 = ’négy szótagos szó’ 4.496 b3 = ’öt szótagos szó’ 1.795 b4 = ’hat szótagos szó’ 777 b5 = ’hét szótagos szó’ 246 b6 = ’nyolc szótagos szó’ 101 b7 = ’kilenc szótagos szó’ 25 b8 = ’tíz szótagos szó’ 9 Összesen: 37.351 szóalak 89.926 szótaggal. (A jobb oldali oszlopban a megfelelő szóalakok összegét közlöm a forrásszöveg alapján.)
A szótagszám alapján 10 szótípus létezik: d, a, b1, b2, b3, b4, b5, b6, b7, b8. A szótípusok mindegyike 10 db kulcs-érték párt alkot, elméletileg tehát van 100 db kulcs-érték pár típus. A szövegvizsgálat során az alábbi táblázat kimutatása tartalmazza, hogy milyen kulcs-érték párokat találtam (pl. d-szótípusra következő 1 szótagos szavak 3530 db stb.): |
Megfigyelések: 1. A bal felső negyedbe tartozó kulcs-érték párok képviselik a jelkészlet 2. A vízszintes tengelytől a felső tartományba eső kulcs-érték párok képviselik a jelkészlet 96,9 %-át: 36.193 : 1.158. 3. A függőleges tengelytől balra eső tartományba tartozó kulcs-érték párok képviselik a jelkészlet 96,9 %-át: 36.193 : 1.158, ugyanazt az értéket hordozza, amit a vízszintes tengely eredményezett. 4. Átlós tengely: A) bal-felső átló a jelkészlet kulcs-érték párjait megfelezi: 14.368 : 14.322, a tengely tartalma: 8.661 kulcs-érték pár. B) bal-alsó átló a jelkészletet teljesen megosztja rövid és hosszú kulcs-érték párokra, döntő mértékben a rövidek javára: 37.011 : 147, a tengely tartalma: 193 kulcs-érték pár. 5. A szövegben nem következnek hosszú szavakra hosszú szavak, mert eldöntő mértékben hiányoznak a vízszintes tengely alatt a kulcs-érték párok (nulla mutatószám), a vízszintes tengely alatti és fölötti tartományban ez az arány: 16 : 1. 6. A jelkészlet csúcsát képezik az egy szótagos szóalakokra következő egy szótagos szóalakok (3530 kulcs-érték pár), amelyeknek lépcsőzetesen csökkenő holdudvara van.
A vizsgálat azt bizonyította, hogy a magyar nyelvben a hosszú szótagos szavak 6-10 szótagosak, valamint a nyelvhasználat a jelkészlet optimalizálására törekszik, mert rövid szavaknak a felhasználásával alkotja meg gazdaságosan a kulcs-érték párokat.
Mező Tibor
|
|
Szótagok száma: |
|
|||||||||
Szótípusok |
1 |
2 |
3 |
4 |
5 |
6 |
7 |
8 |
9 |
10 |
Összesen: |
d |
3530 |
3457 |
2660 |
1428 |
566 |
233 |
77 |
34 |
11 |
2 |
11998 |
a |
3525 |
2817 |
1957 |
1230 |
434 |
199 |
62 |
18 |
7 |
1 |
10250 |
b1 |
2495 |
2075 |
1581 |
894 |
368 |
174 |
48 |
13 |
3 |
3 |
7654 |
b2 |
1471 |
1122 |
894 |
590 |
256 |
102 |
37 |
20 |
2 |
2 |
4496 |
b3 |
579 |
484 |
342 |
224 |
114 |
34 |
11 |
6 |
1 |
0 |
1795 |
b4 |
260 |
204 |
144 |
87 |
40 |
26 |
10 |
5 |
0 |
1 |
777 |
b5 |
95 |
55 |
52 |
26 |
12 |
4 |
0 |
2 |
0 |
0 |
246 |
b6 |
35 |
24 |
19 |
11 |
5 |
3 |
1 |
3 |
0 |
0 |
101 |
b7 |
4 |
11 |
4 |
4 |
0 |
2 |
0 |
0 |
0 |
0 |
25 |
b8 |
4 |
1 |
1 |
2 |
0 |
0 |
0 |
0 |
1 |
0 |
9 |
|
|
|
|
|
|
|
|
|
|
|
37351 |
"3" |
2 |
"2" |
8 |
"8" |
8 |
"8" |
2 |
"2" |
2 |
"2" |
1 |
"1" |
2 |