Kőbe dermedve illeszkedik a szikra

Harmóniakert

Szövegdoboz: Sárkány

Copyright © Mező Tibor, 2007 Minden jog fenntartva

Kezdőlap

Opus

Szótagtár és Szótár

Szolgáltatás

Szótagszám-követés a szövegben

 

 

A szövegben előforduló szóalakok a szótagszámuk alapján kötött rendben követik és váltják egymást. A szótagszám-követés azt jelenti, hogy ebben a rendben egy szóalakra közvetlenül következő másik szóalak mennyi szótaggal rendelkezik, a szótagszám-váltáson pedig azt értjük, hogy a szóalakok lépésenként előrehaladva funkciót cserélnek.

A szövegvizsgálat során mindegyik elem egy párból áll: egy indexből és egy értékből, amiket kettőspont választ el:

Pl. szotagszam = {"3":2, "2":8, "8":8, "8":2, "2":2, "2":1, "1":2}.

Ugyanezt látjuk az alábbi táblázatban, ahol az első oszlopban az indexnek, a második oszlopban az értéknek tekintett szótagszám szerepel:

 

Egyedi keresés

Az indexeket kulcsnak, az elemeket pedig kulcs-érték pároknak hívjuk. A megvizsgált szövegben 37.351 szóalak volt megtalálható, és ugyanennyi kulcs-érték pár fordult elő. (Forrás: Szentkuthy Miklós: Szent Orpheus Breviáriuma, 2. kiadás, Budapest, 2. kötet, 11-110. oldal, ill. www.szotagtar.harmoniakert.hu/szotagolas)

 

A szavakat szótagszámuk alapján különböztetem meg, és változónevet adok nekik az alábbiak szerint:

             d = ’egy szótagos szó’                                         11.998

             a = ’két szótagos szó’                                          10.250

             b1 = ’három szótagos szó’                                 7.654

             b2 = ’négy szótagos szó’                                    4.496

             b3 = ’öt szótagos szó’                                         1.795

             b4 = ’hat szótagos szó’                                      777

             b5 = ’hét szótagos szó’                                      246

             b6 = ’nyolc szótagos szó’                                  101

             b7 = ’kilenc szótagos szó’                                  25

             b8 = ’tíz szótagos szó’                                       9

                                                    Összesen: 37.351 szóalak 89.926 szótaggal.

(A jobb oldali oszlopban a megfelelő szóalakok összegét közlöm a forrásszöveg alapján.)

 

A szótagszám alapján 10 szótípus létezik: d, a, b1, b2, b3, b4, b5, b6, b7, b8. A szótípusok mindegyike 10 db kulcs-érték párt alkot, elméletileg tehát van 100 db kulcs-érték pár típus. A szövegvizsgálat során az alábbi táblázat kimutatása tartalmazza, hogy milyen kulcs-érték párokat találtam (pl. d-szótípusra következő 1 szótagos szavak 3530 db stb.):

Megfigyelések:

1. A bal felső negyedbe tartozó kulcs-érték párok képviselik a jelkészlet
 94 %-át:
35.093 : 2.258, amelyek rövid szavakkal, 5 szótagos határig képződtek.

2. A vízszintes tengelytől a felső tartományba eső kulcs-érték párok képviselik a jelkészlet 96,9 %-át: 36.193 : 1.158.

3. A függőleges tengelytől balra eső tartományba tartozó kulcs-érték párok képviselik a  jelkészlet 96,9 %-át: 36.193 : 1.158, ugyanazt az értéket hordozza, amit a vízszintes tengely eredményezett.

4. Átlós tengely:

A) bal-felső átló a jelkészlet kulcs-érték párjait megfelezi: 14.368 : 14.322, a tengely tartalma: 8.661 kulcs-érték pár.

B) bal-alsó átló a jelkészletet teljesen megosztja rövid és hosszú kulcs-érték párokra, döntő mértékben a rövidek javára: 37.011 : 147, a tengely tartalma: 193 kulcs-érték pár.

5. A szövegben nem következnek hosszú szavakra hosszú szavak, mert eldöntő mértékben hiányoznak a vízszintes tengely alatt a kulcs-érték párok (nulla mutatószám), a vízszintes tengely alatti és fölötti tartományban ez az arány: 16 : 1.

6. A jelkészlet csúcsát képezik az egy szótagos szóalakokra következő egy szótagos szóalakok (3530 kulcs-érték pár), amelyeknek lépcsőzetesen csökkenő holdudvara van.

 

A vizsgálat azt bizonyította, hogy a magyar nyelvben a hosszú szótagos szavak 6-10 szótagosak, valamint a nyelvhasználat a jelkészlet optimalizálására törekszik, mert rövid szavaknak a felhasználásával alkotja meg gazdaságosan a kulcs-érték párokat.

 

Mező Tibor

 

Vissza

 

Szótagok száma:

 

Szótípusok

1

2

3

4

5

6

7

8

9

10

Összesen:

d

3530

3457

2660

1428

566

233

77

34

11

2

11998

a

3525

2817

1957

1230

434

199

62

18

7

1

10250

b1

2495

2075

1581

894

368

174

48

13

3

3

7654

b2

1471

1122

894

590

256

102

37

20

2

2

4496

b3

579

484

342

224

114

34

11

6

1

0

1795

b4

260

204

144

87

40

26

10

5

0

1

777

b5

95

55

52

26

12

4

0

2

0

0

246

b6

35

24

19

11

5

3

1

3

0

0

101

b7

4

11

4

4

0

2

0

0

0

0

25

b8

4

1

1

2

0

0

0

0

1

0

9

 

 

 

 

 

 

 

 

 

 

 

37351

"3"

2

"2"

8

"8"

8

"8"

2

"2"

2

"2"

1

"1"

2