Hogyan határozható meg gyorsan egy szövegszöveg kódolása?

Probléma volt: milyen gyorsan határozza meg az UTF-8-hoz képest egy szövegszöveg kódolását. A UNICODE kódolásán egyre szűkebben kell dolgoznia.

Az alábbiakban meg kell vizsgálni, hogy az UNICODE (UTF-8) kódolás WINDOWS kódolású (win-1251)

A funkció meglehetősen pontos választ nyújt, bár nem a kód alapú szimbólum leképezésen alapul.

Röviden - a function detect_my_utf () függvény leírása.
  • konvertálni (karakterlánc a speciális formátumba)
  • kiszámítja a bejövő vonal hosszát
  • adja meg a sztring minden betűjét a fővárosban
  • eltávolítjuk a konkrét .0 és .1 kódokat
  • számítsa ki az új vonal hosszát
  • megkapjuk a stringek hányadát az újhoz

Ha ez a kapcsolat 1 vagy közel van hozzá, akkor gyanú merül fel, hogy a bejövő karakterláncot nem kódolták a UNICODE-ban. Ha ez az arány 1,2 és 2,2 között van, akkor biztonságosan újra kódolhatjuk a sort a WINDOWS encoding win-1251-ben.

A funkció kimenetén 0 vagy 1, illetve UNICODE vagy UNICODE.

Példák a függvényre:

4. példa Ez az algoritmus jól illeszkedik a különböző bejövő vonalakhoz a statisztikai szolgáltatás részeként a keresőmotorokról való navigáláshoz.

A PHP programozási nyelv a szkriptek használatán alapul. Ezt a nyelvet széles körben használják különféle front-end és back-end webes alkalmazások létrehozására. Alapvetően támogatja a legtöbb vendéglátó, aki a dinamikus interaktív webhelyek létrehozására szánt programnyelvek egyik vezetője.