Entrópia és redundancia az ábécé

Az entrópia az ábécé - az információk mennyisége per egyetlen szimbólum. Szimbólumok az ábécé egyformán valószínű maximális forgalmi terhelést

Ábécé természetes nyelvek nem egyformán valószínű. Például a relatív előfordulási gyakorisága egyes karakterek orosz nyelv változik 0,175-0,002.

Mivel a statisztikai tulajdonságait ábécé terhelés információ per jel csökken

Redundancia az ábécé nevezik csökkentése forgalmi terhelésének egy karakter miatt nonequiprobability és a kölcsönös függés megjelenése az ő karakter.

Információ redundancia jellemzi, hogy a relatív alulterhelik ábécé alábbiak szerint kell kiszámítani:

Egységes kódok jellemzi a minimális szó hosszúságú kódszót, amelynek kiszámítása a következő képlettel

ahol N - mennyisége forrás ábécé A;

M - az összeg a kódot az ábécé;

[LogM N] jelöli az egész részét száma logm N

Úgy véljük, ezek a képletek esetében bináris kódolás (m. E. m = 2). Minimális bites egységes kódot az ábécé 8 szimbólumok egyenlő lesz

rmin = log 2 8 = 3 bináris karakterek

A 9-levél ábécé

Entrópia és redundancia az ábécé

Szabálytalan kódok átlagos kódszó hosszúságú

li - hossza kódszó i-edik szimbólum;

pi - a valószínűsége az i-edik szimbólum;

N - térfogata az eredeti ábécé.

Például, ha az ábécé A = a, b, c, d, e> valószínűségekkel előfordulási karakterek az üzenet (pa = 0,5; pb = 0,2; PC = 0,1; PD = 0,15; pe = 0 , 05) bináris kódolású egyenetlen kódot (a - 0; b - 10 c - 1110; d - 110; e - 1111), az átlagos hossza a kódszó erre ábécé tenné

Így az átlagos kódszó hossza a hosszúságok összegét az összes kódszót, kombinálva a tömege azonos a valószínűségét a kódolt jel.

Száma és mennyiségű információ

Entrópia és redundancia az ábécé

Entrópia és redundancia az ábécé

Módszer Shannon - Fano

1. lépés: megrendelések a karakterek az eredeti ábécé növekvő sorrendben valószínűsége. (Rögzítsük a sorban).

2. lépés megváltoztatása nélkül a karakter a sorrendben osztjuk őket két csoportra, hogy a teljes valószínűsége a csoportokban lévő szimbólumok voltak esélyegyenlőséget.

3. lépés jóvá a csoport a bal oldalon, a „0”, és a csoport a jobb oldalon a „1”, mint egy elem azok kódok.

4. lépés: Keressük meg a csoportot. Ha az elemek száma a csoportban egynél több, folytassa a 2. lépéssel Ha a csoport egyik eleme kód építkezés befejeződött neki.

Entrópia és redundancia az ábécé

1. lépés: megrendelések a karakterek az eredeti ábécé növekvő sorrendben valószínűsége. (Írd a oszlop).

2. lépés: a két karakter a legkevésbé valószínű. A szimbólum nagyobb valószínűséggel attribútum „1”, egy szimbólum egy alacsonyabb - „0”, mint annak elemeit a kódokat.

3. lépés: Tekintsük az unió karakter egy karakter valószínűséggel összegével egyenlő annak a valószínűségét kombinált szimbólumok.

4. lépés: Menj vissza a 2. lépésre, amíg az összes karakter összevonásra került egy, a valószínűsége egyenlő egységét.

Entrópia és redundancia az ábécé

Kapcsolódó cikkek