Bináris kódolás karakter (szöveg) adatok - studopediya

A fő művelet történik az egyes karakterek a szöveg - egy összehasonlító karakterek.

Ha összehasonlítjuk a karakterek legfontosabb szempont az egyedi kódot minden karaktert, és a hossza a kódot, és kiválasztani a kódolás elvét szinte lényegtelen.







Különböző konverziós táblákat kódolására használjuk a szövegben. Fontos, hogy ugyanazt a táblázatot használjuk a kódolás és dekódolás, ugyanazt a szöveget.

Keresési tábla - olyan táblázat, amely egy rendezett listát valamilyen módon kódolt karakterek, ahol a karakter átalakítása van bináris kódot, és vissza.

A legnépszerűbb táblázatkikeresési: DKOI-8, ASCII, CP1251, Unicode.

Történelmileg, a kód hossza 8 bit vagy 1 byte került kiválasztásra a kódoláshoz karaktereket. Ezért gyakran egyetlen karakter a szöveg van a számítógépben tárolt megfelel egy bájtot.

Különböző kombinációi 0 és 1, a kódhosszúság a 8 bit lehet 28 = 256, így segítségével egyetlen keresési táblázat képes kódolni legfeljebb 256 karakter. Amikor egy kódot 2 bájt hosszúságú (16 bit) kódolhatók 65,536.

Jelenleg a legtöbb ember használ számítógépet folyamatok a szöveget, amely a karakterek: betűk, számok, írásjelek, stb ..

Hagyományosan, annak érdekében, hogy kódolják egyetlen szimbólum felhasználásával szám információjának 1 bájt, T. E. I = 1 bájt = 8 bit. Segítségével egy képletbe, amellyel a számos lehetséges eseményeket az információk mennyiségét és azt, ki tudjuk számítani, hogy hány különböző karakter kódolható (feltételezve, hogy a karakterek - ez lehetséges események):

t. e. hogy képviselje a szöveges információ akkor használja a hatalmát az ábécé 256 karaktert.

A lényege a kódolás, hogy minden karakter kerül egy megfelelő bináris kódot 00000000-11111111 és a megfelelő decimális kód 0 és 255 között.

Emlékeztetni kell arra, hogy jelen pillanatban a kódolás a magyar betűk öt különböző karakterkészletek (KOI - 8, SR1251, SR866, Mac, ISO), a szövegeket kódolva ugyanannál az asztalnál nem jelenik meg helyesen a különböző kódolás. Szemléletesen, ez lehet képviseli, mint egy töredék egy egységes karakterkódolás táblázatot.

Ugyanez bináris kód társul a különböző karakterek.

Binary Code decimális kód KOI8 SR1251 SR866 Mas ISO

11000010 194 B B - - T

Azonban a legtöbb esetben az átalakítás a szöveges dokumentumok a felhasználó gondokat és speciális programok - átalakítók, amelyeket beépítettek a kérelmet.

Annak megállapításához, a numerikus kódot a Windows karakterkódolást (SR1251) kell használni az egeret vagy a nyilakkal válassza ki a kívánt karaktert, majd kattintson a gombra gombot. Ezt követően a képernyőn megjelenik egy párbeszédablak beállításai, amelyben a bal alsó sarokban tartalmaz egy tizedes számkód a kiválasztott szimbólum.

Három megközelítések meghatározása „mennyiségű információt”

1 Kombinatorikus megközelítés

Legyen az x változó tudja venni tartozó értékek egy véges halmaza X, amely áll a N elemek. Azt mondják, hogy az entrópia egyenlő AC

Jelezve egy bizonyos érték x = x, akkor az „eltávolítás” ez entrópia mondja Infomatsiya

Ha az x1, x2. xk futhat függetlenül a beállított, amelyek állnak rendre az N1, N2. Nk elemek,

Átadni az információk mennyisége azt kell használni

bináris számjegy. Például, a számos különböző „szavakat” álló nullák és k és az egyik két egység egyenlő 2k (k + 1),

Ezért, az összeg az ilyen jellegű információkat egyenlő Message

azaz a „kódoló” ilyen szó tiszta bináris rendszer szükséges (a továbbiakban f≈g mindenütt azt jelenti, hogy a különbség F-G korlátozott, és az f

g, amely az aránya az f: g közelítőleg egységes)

nullák. Az előadásban az elmélet az információ általában nem habozik sokáig ilyen kombinatorikus megközelítés az üzleti. De azt hiszem, fontos hangsúlyozni, hogy független bármilyen logika egyáltalán valószínűségi feltételezések. Például vegyük a feladatot kódoló üzeneteket írt egy ábécé, amely a levelek s, és köztudott, hogy a frekvencia

megjelenése egyes karaktereket az üzenet hosszát n kielégíti az egyenlőtlenséget

Könnyen kiszámítható, hogy nagy n kettes alapú logaritmusának az álláshelyek számát a feltétele, (3), van egy aszimptotikus becslés:

Ezért az ilyen üzenetek továbbítása elegendő használni a NH bináris számjegy.

Az univerzális kódolási eljárás, amely lehetővé teszi, hogy át minden elég hosszú üzenetet egy ábécé a betűk s segítségével nem sokkal több, mint nh bináris számjegy, nem kell túlságosan bonyolult, különösen nem köteles kezdődik meghatározása pr frekvenciák a teljes üzenetet. Ennek megértéséhez elegendő megjegyezni: összeomlik S üzenetet m S1, S2 szegmensek. Sm, megkapjuk az egyenlőtlenség

Azonban nem akarok belemenni a részleteket a speciális feladat. Számomra fontos, hogy azt mutatják, hogy a matematikai problémák alapján a tisztán kombinatorikai megközelítés mérésére az információk mennyisége nem korlátozódik trivialities.

Ez természetesen egy tisztán kombinatorikai megközelítése a „entrópia beszéd”, ha szem előtt tartjuk az értékelés a „rugalmasság” a beszéd - a beszéd elágazási index kiterjesztés lehetséges, hogy egy adott szótár és megadott szabályok megalkotásához mondatokat. A bináris logaritmusa N száma a magyar nyomtatott szöveg áll szó szerepel a „szótár a magyar nyelv S. I. Ozhegova és alárendelt egyetlen követelmény a” nyelvtani helyessége „n hosszúságú, kifejezett” karakterek száma „(beleértve a terek), és M. Ratner VN Svetlov voltak eddig

Ez lényegesen magasabb, mint a felső becslés az „entrópia irodalmi szövegek” által termelt különböző módszerek „találgatás folytatásai.” Ez az eltérés egészen természetes, hiszen az irodalmi szövegek vannak kitéve nemcsak a követelmény „nyelvtani helyességét.

Nehezebb, hogy értékelje a kombinatorikus entrópia szövegek, bizonyos anyagi korlátai. Ez lenne, például az érdeke, hogy értékelje az entrópia a magyar szövegek is tekinthető kellően pontos tartalmának lefordítását adott idegen nyelvű szöveget. Csak a jelenléte az ilyen „maradék entrópia” lehetővé teszi a vers fordítások, ahol a „költség-entrópia”, hogy kövesse a kiválasztott mérő és rím karakter lehet egy meglehetősen pontosan számolni. Belátható, hogy a klasszikus chetyrehstopnym jambus rím bizonyos korlátozásokat a természetes frekvenciája „műszakban”, és így tovább. N. Freedom feltételezéseket igényel kezelést verbális anyagot jellemzi „maradék entrópia” körülbelül 0,4 (a fentebb említett hagyományos módszerrel hossza mérésére a szöveg " karakterek száma, beleértve a pro- fehér „). Ha figyelembe vesszük, másrészt, hogy a stiláris korlátok műfaj talán snizha- értékelt „teljes” az entrópia a fenti 1,9 és legfeljebb 1,1-1,2, a helyzet egyre figyelemre méltó, mint abban az esetben a fordítás, így és abban az esetben, eredeti költészet.







Bocsáss meg haszonelvű felfogású olvasói ezt a példát. Az indoklás, megjegyzem, hogy a szélesebb megbecslése problémát az információk mennyisége amelynek köze a kreatív emberi tevékenység nagyon fontos.

Nézzük, hogy milyen mértékben tisztán kombinatorikai megközelítés lehetővé teszi számunkra, hogy becsülni „az információ mennyiségét” szereplő x változó tekintetében a kapcsolódó változó y. Közötti kapcsolat az x, illetve y fut keresztül a beállított X és Y., hogy nem minden pár x, y tartozó közvetlen terméke X.Y. Ez a „lehetséges”. A különböző lehetséges pár U aX bármelyikében meghatározott sokaságának Ya y, amelyre

3 - + - -

Ez természetes, hogy meghatározza a feltételes entrópia egyenlet

(Ahol n (Yx) - elemeinek száma a beállított Yx), és információkat viszonyítva Y-X általános képletű

Például, abban az esetben látható a táblázatban van

Magától értetődik, hogy a H (y | x) és I (x: y) funkciói x (miközben y tartalmazza a saját kijelölése „kötött változó”).

Könnyen be a koncepció egy tisztán kombinatorikai ábrázolása „a szükséges információ mennyisége határozza meg a tárgy x megadott pontossági követelmények jelzéseket.” (. Lásd e tekintetben a kiterjedt irodalommal „# 949; entrópia” halmazok metrikus terek.)

2 valószínűségi megközelítés

További lehetőségeinek fejlesztése az információs elmélet meghatározások alapján (5) és (6) árnyékában maradt annak a ténynek köszönhető, hogy így x és y változót karakter „véletlen változó”, egy közös, amelynek egy bizonyos valószínűségi eloszlás kinyerését teszi lehetővé egy sokkal gazdagabb rendszer fogalmak és kapcsolatok. Ezzel párhuzamosan a bevezetése §1 értékek van itt

Mint korábban, HW (y | x) és IW (x: y) függvények x. Van egyenlőtlenségek

halad át egyenlőséget egyenletessége a megfelelő viszonyítva (X és Yx). Értékek IW (x: y) és (x: y) nem áll kapcsolatban egy egyenlőtlenség jele. Mint §1,

De a különbség abban rejlik, hogy mi képezheti elvárások MHW (y | x) MIW (x: y), és az értéket

Ez jellemzi a „közelsége a kapcsolat” X és Y közötti szimmetrikus módon.

Azonban meg kell jegyezni, és a megjelenése a valószínűségi fogalmát paradoxon érték I (x: y) egy kombinatorikus megközelítés mindig nem negatív, mivel természetes, hogy egy naiv ábrázolása az „összeg információ”, az értéke az IW (x: y) lehet negatív. Igaz intézkedés „összeg információ” most válik egy átlagolt érték IW (x, y).

A valószínűségi megközelítés természetes elmélete átviteli kommunikációs csatornákon keresztül „tömeg” az információt, amely nagyszámú független, vagy csak kis mértékben kapcsolódó üzeneteket hogy bizonyos valószínűségi törvényszerűségek. Az ilyen kérdések gyakorlatilag ártalmatlanok, és gyökerezik alkalmazott kutatás keverési valószínűségek és a frekvenciák belül elegendően hosszú vremenn.ogo sorozat (kapó szigorú indoklás egy megfelelően gyors hipotézis „keverés”). Szinte lehet tekinteni, például a kérdést, „entrópia” patak üdvözlő táviratokat és a „sávszélesség” kommunikációs csatorna szükséges időben és torzításmentes átvitel, helyesen tette az ő értelmezésében a valószínűség és a normális cseréje empirikus frekvenciák valószínűségek. Ha továbbra is fennáll némi elégedetlenség, ez együtt jár egy bizonyos homályos elképzeléseink közötti kapcsolat matematikai elmélet a valószínűség és a valódi „véletlen jelenségek általában.

De mi valódi jelentése, például, hogy beszélni a „mennyiségű információt” szereplő „Háború és béke” szöveget? Lehetséges, hogy az ésszerű módon ez az új sor „lehetséges regények” is posztulálni e beállítva egy valószínűségi eloszlás? Vagy kell tekinteni az egyes jelenetek „Háború és béke” formáló véletlenszerű sorrendben gyorsan csillapítani a parttól néhány oldalnyi „sztochasztikus kapcsolatok?

Lényegében nem kevésbé sötét és egy divatos kifejezéssel „genetikai információ szükséges, mondjuk, hogy játsszon egy különleges fajta kakukk. Ismét az elfogadott koncepció valószínűsége két lehetőség van. Az első változatban a beállított „lehetséges formája” a semmiből, akik vállalják, valószínűségi eloszlás ezen sovokupnosti2 (2Obraschenie, hogy a különböző fajok, hogy létezik vagy létezett a világon, még tisztán kombinatorikai számlálás adna teljesen elfogadhatatlan kis felső korlátot (valami ilyesmi <100 бит!).).

Egy második megvalósítási mód szerint, a jellegzetes tulajdonságokat úgy tekintjük, mint egy sor lazán kapcsolódó valószínűségi változók. Mellett a második lehetőség, akkor hozhat érvek alapján a valódi mechanizmusát mutációt. De ezek a megfontolások illuzórikus, ha azt feltételezzük, hogy ennek eredményeként a természetes szelekció, a rendszer a egymás között megállapodtak jellegzetes jelei a faj.

3 Algoritmikus megközelítés

Lényegében a leginkább informatív képviselet információt a szám a „mi lenne, vagy (x) és a„semmit »(y). Nem véletlen, hogy a valószínűségi koncepciót általánosítható A folyamatos változók, amelyeknek az entrópia végtelen, de egy széles körű vége esetben.

Valós tárgyak a mi tanulmány nagyon (határozatlan időre?) Komplex, de a kapcsolat két valós tárgyakat kimerülnek egy egyszerű sematikus a leírást. Ha a földrajzi térkép ad jelentős információt a terület a Föld felszínét, de a mikroszerkezete papír és a festék papírra nyomtatott, nincs kapcsolatban a mikroszerkezetébe kép része a Föld felszínét.

Az új tábla tartalmazza megközelítőleg

információt az eredeti (n - a számjegyek száma a oszlop).

Összhangban a fenti leírás csak az, hogy a javasolt mennyiség definíciója szerint IA (x: y) megtart egy bizonyos fokú bizonytalanság. Különböző egyenértékű megvalósítási módok e meghatározás vezetne értékeket egyenértékű csak abban az értelemben IA1≈IA2, azaz

ahol CA1A2 állandó függ alapját képező két opció határozza meg az egyetemes A1 és A2 programozási módszerek.

Úgy véljük, „számozott terület tárgyak”, azaz megszámlálható halmaz X =, minden egyes eleme van állítva a levelezést „nem» n (x) egy véges sorozata nullák és egyesek, kezdve egy. Jelölje L (x) n hosszúságú (X) szekvenciát. Azt feltételezzük, hogy

1) közötti megfelelés X és D több bináris szekvenciák ismertetett fajtájú bijectively;

2) DX, a függvény n (x) D rekurzív [1], ahol az xD

ahol C - egy állandó;

3) együtt az x és y X tartalmaz egy rendezett párt (x, y), a száma ez a pár rekurzív függvény szám x és y, és

ahol Cx függ csak x.

Nem minden ilyen követelmények elengedhetetlenek, de megkönnyíti a bemutatót. Eredmény építési invariáns tekintetében átmenet az új számozás n „(x), amely ugyanolyan tulajdonságokkal és kifejezte általános rekurzív keresztül a régi, és a tekintetében az X rendszer tartalmazott egy kiterjedtebb rendszer X” (feltételezve, hogy n „szám a kiterjesztett rendszer elemeit az eredeti rendszer általános rekurzív kifejezve a kezdeti n szám). Mindezekkel átalakulások új „komplexitás”, és az információk mennyisége továbbra is megfelel az eredeti szempontjából ≈

„Relatív komplexitás” a tárgy egy adott x y feltételezzük minimális hossza l (p) fogadó a program p y a x. Megfogalmazni, feltétlenül függ a „programozási módszer. programozási módszer nem más, mint a függvénye # 966; (p, x) = y, amely kapcsolódik a program megfelelő p, és a tárgy x egy tárgy y.

Összhangban általánosan elfogadott a modern matematikai logika, meg kell vizsgálni a funkció # 966; részlegesen rekurzív. Bármely ilyen funkció hisszük

a függvény # 965 = # 966; (u) az értékek UX # 965; X az úgynevezett részleges rekurzív, ha generál egy részben rekurzív függvény átváltási árfolyamok

Megértéséhez meghatározása fontos megjegyezni, hogy a részleges rekurzív függvények általában véve nincsenek meghatározva mindenhol. Nincs rendszeres eljárás kideríteni a program használata p egy objektum x bármilyen eredmény, vagy sem. Ezért a függvény K # 966; (y | x) nem lehet hatékonyan akkor számíthatók (rekurzív) akkor is, ha tudjuk, hogy véges minden x és y.




Kapcsolódó cikkek