Kódolási információk

A szöveges információk kódolása.
Határozza meg a szöveges fájl mennyiségét.

A világ legtöbb PC-je feldolgozza a szöveges információkat.

A kódolás az, hogy minden karakterhez egyedi bináris kódot rendelünk. Egy személy megkülönbözteti a karaktereket vázlatuk és a számítógép kódja szerint.

Kezdetben csak a latin ábécét használták a számítógépben - 26 betű (szimbólum).
A 26 karakteres bináris kód (utolsó lecke) kódolásához 5 bitet kell hozzárendelnie minden egyes karakterhez (5 bites kódolás).

De a szövegben nincsenek kisbetűk, hanem nagybetűk (szimbólumok), valamint a decimális számok. Így a kódolt szimbólumok száma nagyobb lesz:

Ksymb = 26 + 26 + 10 = 62 [szimbólum]

A 62 karakterből álló bináris kód kódolásához 6 bit karakterenként (6 bites kódolás) szükséges.

Ezért az első angol nyelvű számítógépeken egy byte-machine szótag - hat bitet tartalmazott.

Ami a számítógépes szöveg is írásjelek, speciális karakterek, mint például a „=”, „(”, „”, a tér, és a hasonló karaktereket és nyomtató vezérlő kódokat, a jelzőfények és egyéb berendezések.

Az összes karakter számának kódolásához 7 bit kódolás szükséges (128 karakter).

Figyelembe véve a nemzeti nyelvek, például az orosz szimbólumainak kódolását, legalább 8 bites kódolás szükséges.

Így a BYTE koncepciója a BIT-k soraként jelent meg, ami a gépi szimbólum kódolásához szükséges minimum.

A 8 bites kódolással az ábécé teljesítménye (az ábécé karakterek száma) 256.

A szimbólumnak a kóddal való megfeleltetése a kódtáblázatban látható.

Gombok megnyomásával a billentyűzeten (beviteli eszköz vagy kódolási információ) generált bináris kód, amely szerint a kód táblázat a képernyőn megjelenik egy jel szimbólum.

Jelenleg öt különböző karakterkészletek orosz betűk (Windows, MS-DOS, KOI8, Mac, ISO), így a szöveg létre egy kódolási nem jelenik meg helyesen a másik. Különböző típusú számítógépekhez különböző kódolási táblákat használnak. A személyi számítógépek terjedésével, mint az IBM PC vált a nemzetközi szabvány táblázat kodirovkiASCII (American Standart Code for Information Interchange) - American Standard Code for Information Exchange, amelynek során:
- Az első 33 kód (0-tól 33-ig) nem szimbólumoknak felel meg, hanem műveleteknek (térbeli, vonalbetöltés stb.
- A 33-tól 127-ig terjedő kódok nemzetköziek, és megfelelnek a latin ábécé szimbólumainak, a számoknak, a számtani műveletek jeleinek és az írásjeleknek;
- A 128-255. Kódok nemzetiak, i. E. A különböző nemzeti kódolásokban a különböző szimbólumok azonos kóddal vannak ellátva.

A modern számítógépek 16 bites kódolást (unicode) használnak, amely 65536 karaktert képes kódolni.

A számítógép memóriájában minden szöveget a szöveg alkotó karakterek kódszekvencia képvisel.

A szöveg információs kötetének (Vtf) megtalálásához szorozzuk meg a karakterek számát (Ksymb) egy karakter (V1s) térfogatával:

Vtf = Ksymv * V1s

Határozza meg a szöveg információs mennyiségét
Bambarbiya! Kergudu!
8 bites kódolással
A szövegben lévő karakterek számát egyszerű újratervezés határozza meg, emlékezve arra, hogy a szóköz karakter szintén szimbólum.

megoldás:
1. A szövegfájl kötetét a következő képlet határozza meg:
Vtf = Ksymv * V1s
Vtf = 19 * 8 = 152 [Bit]
A biteket bájtra kell konvertálni:
152 [Bit] = 152. 8 = 19 [Byte]
Válasz: 19 bájt

Az automatikus eszköz a 16 bites Unicode kódban eredetileg írott orosz nyelven átadta az információs üzenetet a KOI-8 8 bites kódolására. Ugyanakkor az információs üzenet 480 bitesre csökkent. Mennyi ideig van az üzenet karakterekben?

megoldás:
1. Az 1. Szövegfájl kötetét a következő képlet határozza meg:
V1.1 = Ksymb * V1c.1
2. A 2 szövegfájl kötetét a következő képlet határozza meg:
Vtf.2 = Ksymb * V1c.2
3. Határozza meg a mennyiségi különbséget:
V1.1 - Vtf.2 = Ksymb * V1c.1 - Ksv * V1c.2
4. A Ksymet zárójelbe tesszük
KSIM * (V1c.1 - V1c.2) = 480
5. Így meghatározhatja a karakterek számát
Ksymb = 480. (V1c.1-V1c.2)
Ksymb = 480. (16 - 8) = 60
Válasz: 60 karakter

házi feladat

1 Ha feltételezzük, hogy minden egyes karakter egy bájtban van kódolva, határozzuk meg, hogy Jean-Jacques Rousseau következő nyilatkozatának információs mennyisége egyenlő:
Több ezer módon vezet hiba, az igazság - csak egy.

2 A Unicode kódolásában két bájt karakterenként oszlik meg. Határozza meg a kódolás huszonnégy karakteres üzenetének információmennyiségét.

3 Az automatikus eszköz a 16 bites Unicode kóddal írott orosz nyelven átadta az információs üzenetet a KOI-8 8 bites kódolására. Ugyanakkor az információs üzenet 800 bitesre csökkent. Mennyi ideig van az üzenet karakterekben?

4 A 16 bites kódolás után az alkalmazottakra vonatkozó dokumentumok 8 Mb-ot foglalnak el. Mindegyik 16 lapot tartalmaz (soronként 32 sor 64 karakterből áll). Hány alkalmazott van a szervezetben?

5 Az ábécé hatalma 256. Hány kilobájt memóriát kell 160 oldalnyi szöveget tárolni, amely mindegyik oldalon átlagosan 192 karaktert tartalmaz?

6 A szövegfájl hangereje 640 Kb. A fájl egy olyan könyvet tartalmaz, amely átlagosan 32 sor / oldal és 64 karakter soronként. Hány oldal a könyvben 8 bites kódolással?

7 Az üzenet mérete 7,5 KB. Ismeretes, hogy ez az üzenet 7680 karaktert tartalmaz. Mi az ábécé ereje?

Képzési feladat

1 Ha feltételezzük, hogy minden egyes karakter egy bájtban van kódolva, határozzuk meg, hogy Aleksey Tolstoy következő nyilatkozatának információs mennyisége mekkora:
Nem hiba, hogy nem tesz semmit, bár ez a fő hibája.

2 Ha feltételezzük, hogy minden karakter egy bájtban van kódolva, határozzuk meg, hogy mit jelent Rene Descartes következő nyilatkozatának információs kötet:
Ezért úgy gondolom, léteznek.

3 Ha feltételezzük, hogy minden egyes karakter 16 bittel van kódolva, becsülje meg a következő Pushkin kifejezés informatikai mennyiségét Unicode kódolásban:
A szokást felettünk adják: helyettesíti a boldogságot.

4 Figyelembe véve, hogy minden egyes karakter egy bájtban van kódolva, becsülje meg a következő mondat információs kötetét a Pushkin quatrainjéből:
Az énekes-David kis növekedés volt, de Goliath!

5 Tekintettel arra, hogy minden egyes karakter egy bájtban van kódolva, becsülje meg az alábbi mondat információ mennyiségét:
A legőszintébb szabályok nagybátyám, Ha nem viccet szippantott, tiszteletet tett, és nem gondolta jobban.

6 Az automatikus készülék 16 bites Unicode kódolású, eredetileg 8 bites kódolású orosz nyelven adta meg az információs üzenetet. Ugyanakkor az információs üzenet 2048 byte-kal nőtt. Mi volt az üzenet mennyisége az átalakítás előtt?

7 Figyelembe véve, hogy minden karakter 16 bittel van kódolva, becsülje meg az Unicode kódolás következő mondatának információ mennyiségét:
Hat literben, 6000 ml.

8 Figyelembe véve, hogy minden egyes karakter 16 bittel van kódolva, becsülje meg a következő mondat információ mennyiségét:
Boldog az, aki hisz, meleg neki a világon!

9 Tekintettel arra, hogy minden egyes karakter egy bájtban van kódolva, becsülje meg a következő mondat információ mennyiségét:
A Magányos Vitorla Fehér a Kék Ködben!

10 Az automatikus készülék 16 bites Unicode kóddal írott orosz nyelven átírta az információs üzenetet a KOI-8 8 bites kódolására. Ugyanakkor az információs üzenet 160 bitesre csökkent. Mennyi ideig van az üzenet karakterekben?

Automatikus eszköz 11 végzett átkódolás információs üzenet orosz hossza 8 szimbólumok, az eredetileg felvett 16 bites Unicode kódot, egy 8-bites kódoló KOI-8. Mennyibe kerül az üzenet információ mennyisége?

12 Az automata eszköz 16 bites Unicode kóddal írott orosz nyelven át kódolta a 8 bites KOI-8 kódolást. Ugyanakkor az információs üzenet 240 bittel csökkent. Mennyi ideig van az üzenet karakterekben?

Automata készülék 13 végzett átkódolás információs üzenet orosz 20 karakter eredetileg felvett 16 bites Unicode kódot, egy 8-bites kódoló KOI-8. Mennyibe kerül az üzenet információ mennyisége?

15 Az üzenet mérete 11 KB. Az üzenet 11264 karaktert tartalmaz. Mi az ábécé ereje?

Kapcsolódó cikkek