A kódolás az XML dokumentum

XML dokumentumok tartalmazzák karakterek különböző nemzetközi karakterkészletek.

Annak érdekében, hogy elkerüljék a hibákat, meg kell határoznia a használt karakterkódolás az XML dokumentumban, vagy mentse a fájlt egy univerzális UTF-8 kódolást.







karakterkódolás

Karakterkódolás meghatároz egy egyedi bináris kódot a különböző szimbólumok a dokumentumban használt.

A számítástechnikában a karakterkódolás is nevezik karakterkészlet, jelképes elrendezés, kódkészletre és kódlap.

Unicode - egy ipari szabvány karakterkódolását egy szöveges dokumentum. Ez határozza meg (szinte) minden lehetséges nemzetközi karakterek nevek és számok.

Unicode két fajta: UTF-8 és UTF-16.

Unicode UTF-átalakítási formátum (ang. Unicode Transformation Format).

UTF-8 használ egy byte (8 bit), hogy képviselje az elfogadott karakterek és két (vagy három) az összes többi bájtos karakterek.







UTF-16 használ két bájt (16 bit) a legtöbb karakter és három bájt a többit.

UTF-8 - Web Normál

UTF-8 - karakterkódolási szabvány az interneten.

A kódolás az XML dokumentum

Az első sor egy XML dokumentumban úgynevezett prológus:

Prologue nem kötelező, és általában tartalmazza az XML verziószámot.

Ezen kívül információt tartalmazhatnak a kódolás az XML dokumentum. Következő prológus határozza UTF-8 kódolást:

XML szabványosítása megállapítja, hogy az összes XML alkalmazások kell értenie, UTF-8 és UTF-16.

UTF-8 az alapértelmezett kódolása XML dokumentumok nélkül kódoló információkat.

Ezen kívül a legtöbb XML alkalmazások, rendszerek, dolgozni kódolás, mint az ISO-8859-1, Windows 1252, és ASCII.

XML hiba

Nagyon gyakran az XML dokumentumokat hoznak létre ugyanazon a számítógépen, a kiszolgáló kikerül a többi, és a böngészőben megjelenik egy harmadik számítógépen.

Ha a kódolás helyesen értelmezi mindhárom számítógépek, a böngésző megjelenít egy értelmetlen sor karaktert, vagy akár egy hibaüzenetet.

A legjobb választás ebben az esetben az, hogy az UTF-8 kódolást. UTF-8 lehetővé teszi, hogy megjelenítéséhez gyakorlatilag az összes nemzetközi karakterek, és ezen túlmenően úgy vélik, az alapértelmezett kódolást, ha nem adja meg a különböző kódolási.

következtetés

Amikor írsz egy XML dokumentum:




Kapcsolódó cikkek