Kódolási rendszer

iwhu.waykun.com - Hogyan lehet fogyni és karcsú maradni

Névterek

Oldalműveletek

Kódolási rendszerek a besorolás iránti igény pedig a jelenségek rögzítésének, eltakarásának, rendezésének, azonosításának, csoportosításának és osztályozásának, valamint azok nyilvántartásba vételének és továbbításának megkönnyítéséből fakad. Példák: Morzekódok, kulcsírások, könyvtárosztályozási kódok, termékkódok stb.

Összegzés

1 A kódolási rendszerek fejlődése
2 Többbájtos rendszer
3 Az ilyen típusú kódolás verziói
4 A kódexek célkitűzései
5 A kódrendszerek jellemzői
6 A kódolás típusai
- 6.1 Jelentős
- 6.2 Nem jelentős
7 Források

A kódolási rendszerek fejlődése

Az informatika elterjedése a nem latin gyökérkultúrákban gyorsan kiderítette, hogy 256 karakter nem volt elegendő az összes nyelv grafikonjának a feltüntetéséhez. Például cirill; a héber; az arab; a görög és a japánok, hogy csak néhányat említsünk. Nyilvánvalóvá vált egy több mint 256 lehetőséggel rendelkező rendszer iránti igény, ami olyan kódolási rendszerek létrehozásához vezetett, amelyekben minden karakter egynél több oktettet (legalább bizonyos karaktereket) foglalt el, ezért ezeket a rendszereket általában széles karakterekként ismerik. Az elfogadott megoldás két nagy csoportot tartalmaz: a többbájtos rendszert (2. §) és a széles karakterrendszert (3. §), amelyeknek különféle változatai vannak. Az előbbit általában a külső ábrázoláshoz (tároláshoz) és a kommunikációhoz használják, míg az utóbbit a belső ábrázoláshoz előnyben részesítik.

Többbájtos rendszer

Ha olyan kérdésről van szó, hogy a külső tárolókban vagy az átviteli rendszerekben 256 karakternél hosszabb karakterkészleteket kell ábrázolni, amelyekben fontos a tér- és/vagy a sávszélesség-takarékosság, akkor a megoldást a többbájtos kódoló rendszerek használata jelentette. Rövidítve MBCS-ként ("Multibyte Character Set").
Ahogy a neve is jelzi, egynél több oktettet használnak, de a különbözõ karakterek szélessége a pillanat szükségletének megfelelõen változó. A többbájtos karakterek egy és két bájt széles karakterek összevonása, amelyek a 8 bites ASCII szuperhalmazának tekinthetők. Természetesen egy ilyen típusú egyezmény olyan szabálysorozatot igényel, amely lehetővé teszi az egyes karakterek azonosítását bájtsorozat elemzésével ("elemzése").

Az ilyen típusú kódolás verziói

JIS (japán ipari szabvány). Főleg kommunikációban, például e-mailben használják, mert minden karakterhez csak 7 bitet használ. A menekülési szekvenciák segítségével karakterenként egy és két bájtos mód között válthat, és a különböző karakterkészletek között válthat.

Shift-JIS A Microsoft által bevezetett és az MS-DOS rendszerben használt rendszer a legkevesebb karaktert támogató rendszer. Minden bájtot elemezni kell, hogy lássuk, karakter-e vagy egy duett első-e.

EUC (Extended Unix Code). Ezt a rendszert belső kódolási módszerként használják a legtöbb Unix platformon. Két bájtnál hosszabb karaktereket fogad el, így sokkal kibővíthetőbb, mint a Shift-JIS, és nem korlátozódik a japán nyelv kódolására. Nagyon alkalmas több karakterkészlet kezelésére.

UTF-8 (Unicode transzformációs formátum). Ebben a rendszerben minden karaktert 1–4 bájtos szekvencia képvisel, bár a valóságban a karakter képviseletére szánt bitek száma legfeljebb 21-re korlátozódik (a többi metaadat - információ az információkról). Ennek a metaadatnak az a célja, hogy a szekvencia bármilyen helyzetből értelmezhető legyen.

A kódexek célkitűzései

A feldolgozás megkönnyítése.
Engedje meg az egyértelmű azonosítást.
Besorolás engedélyezése.
Engedélyezze az információ visszakeresését vagy helyét.
Lehetővé teszi a kapcsolatok létrehozását a különböző kódolt elemek között.
Megkönnyíti a kódolt elemek bizonyos tulajdonságainak jelölését.

A kódrendszerek jellemzői

Logikusan hozzá kell igazítani ahhoz az információs rendszerhez, amelynek része.
Az adatok leírásához szükséges pontossággal kell rendelkeznie.
A lehető legkisebb legyen.
Engedélyeznie kell a terjeszkedést.
Könnyen használhatónak kell lennie.
Meg kell felelniük a berendezés követelményeinek

Kódolási típusok

Amikor a karakterkódolásról beszélünk a számítástechnikában, hivatkozunk arra a módszerre, amely lehetővé teszi egy karakter természetes nyelvből (ábécé vagy szótag) való átalakítását egy másik ábrázolási rendszer szimbólumává, például számgá, elektromos impulzusok sorozatává egy elektronikus rendszer, szabványokat vagy kódolási szabályokat alkalmazó oktettek. Ez a szöveg számítógépes tárolásának megkönnyítése vagy a szöveg telekommunikációs hálózatokon keresztüli továbbításának megkönnyítése érdekében nagyon egyszerű példa lehet a Morse kód

Két alapvető típusú kódrendszer létezik: jelentős kódok és nem jelentős kódok.

Jelentős

Ahogy a neve is jelzi, azok jelentést jelentenek, vagyis kisebb-nagyobb mértékben tükrözik annak a tárgynak, tárgynak vagy egyénnek a jellemzőit, amelyhez rendelték.

Nem jelentős

Néha szekvenciálisnak vagy egymást követőnek hívják) semmiképpen sem írják le az objektumot, amelyre alkalmazzák őket, hanem egyszerű címkék, amelyek révén az objektum megkülönböztethető másaktól.

A kódolási módszerek sokfélesége létezik, amelyeket az általuk használt szimbólumok szerint osztályoznak:

Általános értelemben az alfabetikus és alfanumerikus kódok hatékonyak, ha egyszerű kódolásokról van szó, sok osztályozás nélkül és kevés játékkal. Hátrányuk, hogy a korlátozott betűszám nem teszi lehetővé az amplitúdó sok besorolását, bár ábécés jellel 26 lehetőséget lehet besorolni, ami csökkentheti a kód méretét. Lehetővé teszik memóriás erőforrások használatát is, amelyekre akkor lehet szükség, ha a kód gyors és egyszerű értelmezésére van szükség.

Népszerű

Most olvasnak