ယူနီကုဒ်: တည်းဖြတ်မှု မူကွဲများ

No edit summary
စာကြောင်း ၁၇ -
ယူနီကုဒ်သည် သဘောအားဖြင့် [[စာလုံးပုံ]] (glyph) များကို ထက် အခြေခံ [[စာလုံး]] (character) များ — [[grapheme]]s and grapheme-like units — ကို သိမ်းဆည်းထားသည်။ တရုတ်စာတွင် အခြေခံ [[စာလုံး]] နှင် [[စာလုံးပုံ]] တို့ကိုခွဲခြားရန် ခက်ခဲသည်။
 
စာများကိုစာစီ၊ တွက်ချက်ခြင်းစာရိုက်ခြင်း (text processing) တွင် ယူနီကုဒ်သည် စာလုံးတိုင်းအတွက် အတုမရှိသော [[စာခွက်]] (code point) — စာလုံးပုံ အစား နံပါတ်တစ်ခု — ရှိရေး တာဝန်ယူသည်။ တစ်နည်းအားဖြင့် ယူနီကုဒ်သည် စာလုံးများကို မူရင်းသဘာဝ (an abstract way) ကိုကိုယ်စားပြုပြီး ပုံဖော်ရန် အတွက်ကိုမူ (အရွယ်၊ ပုံ၊ [[ဖောင့်]] (သို့) သဏ္ဍာန်) [[software]] (web browser, word processor) ၏တာဝန်အဖြစ် ချန်ထားခဲ့သည်။ ထိုမျှရှင်းလင်းသော ကြိုးစားမှုပင် ရှုပ်ထွေးရသော အကြောင်းမှာ ယူနီကုဒ် ဒီဇိုင်းပြုသူများ ယူနီကုဒ် ကျယ်ပြန့်စွာ အသုံးပြုရေး ကြိုးပမ်းမှုတွင် သဘောတူညီမှု မရနိုင်ခြင်းတို့ကြောင့်ဖြစ်သည်။
 
ယူနီကုဒ်၏ ပဋ္ဌမ ၂၅၆ လုံးမှာ [[ISO 8859-1]] နှင့် တူသောကြောင့် ရှိပြီး အနောက်နိုင်ငံမှ စာများအတွက် အခက်အခဲ မရှိပေ။ များစွာသော အတူတူ စာလုံးများကို မတူသော စာခွက်များတွင် သက်မှတ်ခြင်းမှာသတ်မှတ်ခြင်းမှာ ရှိပြီး [[စာလုံး သိမ်းဆည်းပုံ]] နှင့် အဆင်ပြေစေရန် ဖြစ်သည်။ ထို့ကြောင့် ရှိပြီးစာ များမှ ယူနီကုဒ်ကို ပြောင်းရာတွင် မှားယံင်းမှုမှားယွင်းမှု မရှိနိုင်ပေ။
 
== သမိုင်း ==
စာကြောင်း ၂၉ -
</blockquote>
 
ဟုဖေါ်ပြခဲ့သည်။ မူလ ၁၆ ဘစ် (bit) အခြေပြု စာလုံး မိုဒယ်သည် ယခု သုံးစွဲနေသော စာရေးစနစ် များကိုသာ စဉ်းစားခဲ့သည်။ သို့သောသို့သော် ယခုသုံးနေသော စာလုံးများမှာ
 
<blockquote>
စာကြောင်း ၃၅ -
</blockquote>
 
ဟု သုံးသပ်ခဲ့သည်။ ဆိုလိုသည်မှာ ရှေးစာနှင့် အသုံးများသော စာလုံးများပါ ယူနီကုဒ်ယူနီကုဒ်တွင် တွင် ပါဝင်ရန်လိုအပ်ခဲ့သည်။ပါဝင်ရန်လိုအပ်သည်။
 
== စာဘာသာ ပါဝင်မှု ==
 
[[File:Unicode sample.png|thumb|right|200px| များစွာသော ခေတ်ပေါ် [[application]]s များသည် ယူနီကုဒ် ကိုယူနီကုဒ်ကို ယခုကဲ့သို့ ကောင်းစွာ ဖော်ပြနိုင်သည်]]
ယူနီကုဒ်သည် ယခုခေတ် ကမ္ဘာပေါ်ရှိ စာရေးမှုစနစ် အားလုံး၏ [[စာဘာသာ]] (script) အားလုံး ပါဝင်သည်။ <ref>[http://www.unicode.org/charts/ Code Charts - Scripts<!-- Bot generated title -->]</ref>
 
စာကြောင်း ၄၆ -
ယူနီကုဒ် ၅.၁ တွင် ရည်ရွယ်ထားသော စာဘာသာများမှာ Avestan, Egyptian Hieroglyphics, Tai Tham, Tai Viet, Imperial Aramaic, Inscriptional Pahlavi, Inscriptional Parthian, Javanese, Kaithi, Lisu, Meetei Mayek, Nü Shu, Old South Arabian, Old Turkic, Samaritan နှင် Tangut ဖြစ်ကြသည်။ အခြား စာဘာသာများမှာ Yi, ရှေး Uyghur and Oracle Bone Script တို့ ဖြစ်ကြသည်။
 
အသုံးနည်းသောကြောင့် ယူနီကုဒ် တွင်ပါဝင်ရန်ယူနီကုဒ်တွင်ပါဝင်ရန် မကိုက်ညီသော ခေတ်ပေါ် စာဘာသာများ ကိုစာဘာသာများကို ConScript Unicode Registry တွင် Private Use Area များနှင်အတူ လျာထားသည်။
 
== စံပြုခြင်း ==