KompüterInformasiya texnologiyaları

Encoding "Unicode" xarakter kodlaşdırma standart

cəhdi hər Internet istifadəçi bir qurmaq və ya onun funksiyası ən azı bir dəfə yazılı ekranda gördüm latın hərfləri ilə söz "Unicode". Nədir bu yazıyı ilə öyrənmək olacaq.

müəyyən

Encoding "Unicode" - character encoding standart. Bu Unicode Inc. qeyri-kommersiya təşkilatı tərəfindən təklif edilmişdir 1991-ci ildə. standart bir sənəd simvol müxtəlif növ ən böyük mümkün sayı bir araya gətirmək üçün nəzərdə tutulmuşdur. onun əsasında qurulan Page, (Koreya rus) müxtəlif dillərdə və riyazi işarələr məktublar və simvol ola bilər. Bu halda, character set simvol hər hansı bir problem olmadan göstərilir.

yaradılması üçün səbəbləri

Bir zamanlar, uzun bir sistem meydana əvvəl "Unicode" encoding sənədin müəllifi üstünlükləri əsasında seçilir. Bu səbəblə tez-tez bir sənəd oxumaq üçün, müxtəlif cədvəllər istifadə etmək lazım idi. Bəzən çox orta istifadəçi həyatı çətinləşdirir bir neçə dəfə etmək lazımdır. Artıq qeyd edildiyi kimi, 1991-ci ildə bu problemin həlli xarakter kodlama yeni bir növü təklif Unicode Inc qeyri-kommersiya təşkilatı dəvət olunub. Bu köhnəlmiş və standartların bir sıra birləşdirmək üçün nəzərdə tutulmuşdur. "Unicode" - zaman ağlasığmaz nail ozvolila bir encoding: simvol bir çox dəstəkləyən alət yaratmaq. nəticə çox gözləntiləri keçib - eyni zamanda ingilis və rus mətn, latın, və riyazi ifadələr də ehtiva edən sənədlər var idi.

Amma ehtiyac ilə əvvəl vahid kodlaşdırma yaradılması görə artıq o vaxt mövcud standartlara böyük müxtəlif yaranmış bir sıra problemlər həll etsin. Onların ən ümumi:

  • Elvish yazı, və ya "gibberish";
  • character set məhdudiyyətlər;
  • problem codings çevirmək;
  • font təkrarlanması.

Kiçik tarixi ekskurs

yard 80 düşünün. Kompüter hardware belə ümumi deyil və bu gün fərqli bir forma var. Hər OS unikal və hər patriot xüsusi ehtiyacları emal edir. informasiya mübadiləsi üçün lazım olan əlavə rework hər şey çevrilir. başqa bir əməliyyat sistemi tərəfindən yaradılmış bir sənəd oxumaq üçün çalışırıq, tez-tez simvol bir qəribə dəsti göstərir və oyun kodlama ilə başlayır. O, həmişə tez bunu etmir və bəzən lazımi sənəd bilmir hətta sonra altı ay açmaq üçün. tez-tez özləri üçün bir dönüşüm masa yaratmaq, məlumat mübadiləsi insanlar. geri və irəli "Sizin mənim olan" iki istiqamətdə onları yaratmaq lazımdır, onları maraqlı bir detal ortaya qoyur və sonra iş. lakin əksinə, nəticə - mənbə sağ sütunda üçün, banal inversiya hesablama maşın bilməz olun və sol. Siz ehtiyac sənəd hər hansı bir xüsusi simvol istifadə etmək görürsünüzsə, onlar ilk əlavə etmək idi, və sonra başqa və o, bir olmaq deyil bu simvol üçün nə etmək lazımdır nə ortaq izah "gibberish". Və hər encoding inkişaf və ya OS cüt bir çox yaradılmasına gətirib öz fonts həyata idi ki unutmayaq.

səhifə fonts, bir kiçik qeyd eyni Times New Roman 10 ədəd görəcəksiniz ki, daha düşünün: UTF-8, UTF-16, ANSI, UCS-2. İndi universal standartların inkişaf vacib olduğunu başa düşmək?

"Yaradıcılarından qurucu ataları"

Lee Collins və Apple Mark Davis ilə birlikdə Xerox olan Dzho Bekker, bir universal character set praktik yaradılması sahəsində tədqiqat başladı Unicode yaradılması mənşəyi 1987-ci ildə olacaq. Avqust 1988-ci Dzho Bekker 16-bit çoxdilli beynəlxalq coding sisteminin yaradılması üçün layihə təklifi dərc edib.

Bir neçə ay sonra Unicode işçi qrupu ümumi kodlaşdırma standartı ilkin formalaşması iş başa imkan RLG olan Ken Whistler və Mike Kernegana, Sun Microsystems və bir neçə digər mütəxəssislərin Glenn Rayt daxil genişlənmişdir.

ümumi təsviri

Unicode simvol konsepsiyası əsasında. Bu müəyyən bir grapheme (öz "portretləri") vasitəsilə yazılı bir xüsusi formasında mövcuddur və həyata mücərrəd fenomen aiddir altında. Hər bir xarakter xüsusi vahid standart məxsus "Unicode" unikal kod verilir. Məsələn grapheme B ingilis və rus əlifbalar da, ancaq Unicode 2 müxtəlif simvol uyğundur. Onlar dönüşüm tabe kiçik, əsas bazası təsvir Hər hansı t. E., xassələri bir sıra və tam adı.

Unicode üstünlükləri

"Unicode" encoding digər müasirləri olan "şifreleme" simvol əlamətləri böyük bir fond var. onun sələfləri 8 bit idi ki, 28 simvol tərəfindən dəstəklənir, lakin yeni dizayn ki, irəliyə doğru nəhəng addım idi, artıq 216 simvol idi. Bu icazə kodlar demək olar ki, bütün mövcud və ümumi əlifbalar.

"Unicode" Advent ilə artıq bir dönüşüm masa istifadə etmək lazımdır: bu yalnız onlar üçün ehtiyac inkar bir standart kimi. bir standart cüt şriftlər yaratmaq üçün ehtiyac həyata onlara qeyri-mümkün, eləcə də qayda etdi - Eynilə, onlar oblivion daxil batmış, və "gibberish".

Unicode inkişafı

Əlbəttə, tərəqqi yerində deyil, yana ilk təqdimat 25 il keçdi. Lakin charset "unicode" inadkarcasına dünyada öz mövqeyini saxlayır. Bir çox hallarda bu həyata keçirilməsi üçün asan oldu və yayılmışdır ki, sayəsində mümkün olmuşdur (pullu) mülkiyyət və açıq mənbə proqram developers tanınmış olunur.

Biz bir əsr bundan əvvəl dörddə eyni kodu "Unicode" görmək ki, bu gün iman olmaz. Hal-hazırda, bu versiya 5.h.h ilə əvəz edilib və kodlu rəmzləri sayı hələ Unicode-16 üçün dəstək təmin etmək üçün işarələri imtina böyük fərqlə istifadə imkanı haqqında 231. artıb (encoding, onların məhdud sayda 216 maksimum məbləği). Qurulduğu gündən bu yana və versiyası 2.0.0 qədər "Unicode Standard" demək olar ki, 2 dəfə daxil simvolların sayını artırdı. imkanları və önümüzdəki illərdə davamlı artım. versiyası 4.0.0 üçün artıq standart özü artırılmasına ehtiyac olduğunu, həyata keçirilmişdir. Nəticədə, "Unicode" biz bu gün bildiyiniz hansı formu tapdı.

Unicode başqa nədir?

geniş əlavə, daim simvol sayı yeniləndi, "Unicode" -Encoding mətn məlumat bir faydalı xislət edir. Bu qondarma normallaşma var. Əksinə xarakteri ilə bütün sənəd xarakteri vasitəsilə fırladın və qiyabi masa nişanlar əvəz deyil, mövcud normallaşma alqoritmləri birini istifadə edin. Bu nədir?

Bunun əvəzinə bir xüsusi alqoritm istifadə edərək, müxtəlif əlifbalar oxşar ola bilər eyni xarakter müntəzəm çek kompüter resurslarının israf. Bu oxşar simvollar ayrı sütun axtarış masa və bütün məlumatları yoxlayın yenidən deyil üzərində onlara artıq tətbiq etməyə imkan verir.

Belə alqoritmlər inkişaf etmiş və dörd həyata keçirilir. Hər bir dönüşüm belə ki, onların hər hansı bir mümkün olan ən səmərəli deyil zəng etmək üçün,-birindən fərqli ciddi müəyyən prinsipi ilə yer tutur. xüsusi ehtiyacları üçün nəzərdə tutulmuş hər əlaqədar və uğurla istifadə edilmişdir.

Yaymaq standart

onun tarixi encoding "Unicode" 25 il ərzində mən yəqin ki, dünyanın ən geniş yayılmış aldıq. Bu standartın altında proqramları və web-pages kimi düzəliş edilir. tətbiqi eni Unicode indi İnternet resurslarından daha çox 60% istifadə göstərə bilər.

"Unicode" standart meydana zaman, bilirsiniz. Bu nədir, siz də bilirsiniz və ekspertlər Unicode Inc bir qrup tərəfindən edilən ixtira tam əhəmiyyətini təqdir edə 25-dən çox il bundan əvvəl.

Similar articles

 

 

 

 

Trending Now

 

 

 

 

Newest

Copyright © 2018 az.birmiss.com. Theme powered by WordPress.