සිංහල යුනිකෝඩ් වනාහි

 

Representation of Sinhala in Unicode

යුනිකොඩ් ක්‍රමයෙහි සිංහල දැක්වෙන අයුරු

ගිහාන් ඩයස්
තොරතුරු හා සන්නිවේදන තාක්‍ෂණ නියෝජිතායතනය

හැදින්වීම

   
මෙම ලේඛණය යුනිකෝඩ් ක්‍රමය ප්‍රකාර සිංහල අකුරු හා වචන දැක්වෙන ආකාරය විස්තර කරයි. නමුත් මෙය අකුරු හෝ වචන යතුරු පුවරුව මගින් පරිගණකයට ඇතුලත් කරන අයුරු විස්තර නොකරයි. ඒ පිළිබඳ වැඩි විස්තර සඳහා විමර්ශන ලිපි බලන්න.

සිංහල අකාරාදිය

   
වර්තමාන සිංහල අකාරාදිය පහත දැක්වෙන පරිදි මූලික අකුරු 59කින් සමන්විතය. එයට ස්වර 16ක්, ව්‍යංජනාක්‍ෂර 41ක් හා අර්ධ ව්‍යාංජනාක්‍ෂර 2ක් අඩංගුය.

ස්වර
අ ආ ඇ ඈ ඉ ඊ උ ඌ ඍ ඎ එ ඒ ඓ ඔ ඕ ඖ

ව්‍යාංජනාක්‍ෂර
ක ඛ ග ඝ ඞ ඟ
ච ඡ ජ ඣ ඤ ඥ ඦ
ට ඨ ඩ ඪ ණ ඬ
ත ථ ද ධ න ඳ
ප ඵ බ භ ම ඹ
ය ර ල ව ශ ෂ
ස හ ළ ෆ

අර්ධ ව්‍යාංජනාක්‍ෂර
ඃ ං

  
සිංහලෙන් අකුරක් ව්‍යාංජනාක්‍ෂරයකින් හා ස්වරයකින් සමන්විත වේ. ව්‍යාංජනාක්‍ෂරය එයට අදාල සංකේතයෙන් දැක්වේ. ස්වර එකක් හෝ ඊට වැඩි ගණනක් ව්‍යාංජනාක්‍ෂරයක් සමග එන පිලි මගින් දැක්වේ. පිල්ලේ ස්වභාවය එය යොදන ව්‍යාංජනාක්‍ෂරයේ ස්වභාවය අනුව වෙනස් වේ. ව්‍යාංජනාක්‍ෂරයට හල් ලකුණක් එකතු කිරීම මගින් ස්වරයක් නොමැති ව්‍යාංජනාක්‍ෂර (මේවා ශුද්ධ ව්‍යාංජනාක්‍ෂර ලෙස හැඳින්වේ) දැක්වේ. ස්වර පමණක් අවශ්‍ය විට ඒ සමග ව්‍යාංජනාක්‍ෂර නොමැතිව හුදු ස්වරය පමණක් දක්වනු ලැබේ.

   
ශුද්ධ ව්‍යාංජනාක්‍ෂරයක් තවත් ව්‍යාංජනාක්‍ෂරයක් සමග එක් වී සංයුක්ත අකුරු සැදේ. උදා - ක්‍ෂ. සංයුක්ත අකුරකට ස්වරයක් ද තිබිය හැක. එසේම ශුද්ධ ව්‍යාංජනාක්‍ෂරයකට පසුව එන ‘ය’ හා ‘ර’ යන ව්‍යාංජනාක්‍ෂර යන්සය (්‍ය) හා
රකාරාංසය (ප්‍ර, ග්‍ර, ක්‍ර වැනි) මගින් පිළිවෙළින් දැක්වේ. ශුද්ධ ව්‍යාංජනාක්‍ෂරයක් වන (ර්) අකුර තවත් ජනාක්‍ෂරයකට කළින් යෙදීමේදී රේපය ( ‍ ) මගින් දැක්වේ.

   
වචනයක් ස්වරයකින් ආරම්භ වන විටදී අදාල ශුද්ධ ස්වරය යෙදේ. ශුද්ධ
ව්‍යාංජනාක්‍ෂරයක් (උදා - අ, ඓ) යෙදෙන අවස්ථාවකදී හැර ඉහත දැක්වූ සියලු අවස්ථාවලදී අක්‍ෂරවලට පසුව අර්ධ ව්‍යාංජනාක්‍ෂරයක් යෙදිය හැක.

යුනිකෝඩ් අක්‍ෂර

    
සිංහල යුනිකෝඩ් කේතනය වාග් විද්‍යාවේ මූලධර්ම මත ගොඩ නැගී ඇත. එසේම යුනිකෝඩ් කේතය සිංහල අකුරු හා පිලි දැක්වෙන සංකේත මත ගොඩ නැගී නොමැති බව සිහිපත් කළ යුතුය. ඉහතින් විස්තර කර සියලුම මූලික අකුරු බිටු 16 ක් (16 bit) ඇති යුනිකෝඩ් අක්‍ෂරයකින් දැක්වේ. එය හෙක්ස ඩෙසිමල් නැමැති පරිගණක කේතන ක්‍රමය මගින් දැක්වෙන 0D80 – 0DFFපරාසයේ දැක්වේ. ඉහත දැක්වූ ස්වර 16ට අදාල එයට අමතරව (එකක් හෝ එකකට වැඩි) සියලුම පිලි සයෝගයන්ටද (මේවා ස්වර ලකුණු ලෙස හැඳින්වේ) සහ හල් ලකුණට ද ඉහත පරාසයේ වූ යුනිකෝඩ් අක්‍ෂරයක් වෙන් කර ඇත. අක්‍ෂර හා ස්වර ලකුණු සඳහා වෙන් කරන ලද යුනිකෝඩ් අක්‍ෂර පහත වගුවේ දැක්වේ.

 

Code
කේතය
Letter
අක්‍ෂරය
Short Name
කෙටි නම
Name
නම
Various signs
විවිධ අක්‍ෂර
0D82
ang

Anusvaraya

0D83
ah

visargaya

Independent vowels
ස්වාධීන ස්වර
0D85
A

ayanna

0D86
AA

aayanna

0D87
AE

Aeyanna

0D88
AEE

aeeyanna

0D89
I

Iyanna

0D8A
II

iiyanna

0D8B
U

uyanna

0D8C
UU

uuyanna

0D8D
vR

iruyanna

0D8E
vRR

Iruuyanna

0D91
E

eyanna

0D92
EE

eeyanna

0D93
AI

Aiyanna

0D94
O

oyanna

0D95
OO

ooyanna

0D96
AU

Auyanna

Consonants
ව්‍යාංජනාක්‍ෂර
0D9A
ka

alpapraana kayanna

0D9B
kha

mahaapraana kayanna

0D9C
ga

alpapapraana gayanna

0D9D
gha

mahaapraana gayanna

0D9E
nga

kantaja naasikyaya

0D9F
ngga

sanyaka gayanna

0DA0
ca

alpapraana cayanna

0DA1
cha

mahaapraana cayanna

0DA2
ja

alpapraana jayanna

0DA3
jha

mahaapraana jayanna

0DA4
nya

taaluja naasikyaya

0DA5
jnya

taaluja sanyooga naaksikyaya

0DA6
nyja

sanyaka jayanna

0DA7
tta

alpapraana ttayanna

0DA8
ttha

mahaapraana ttayanna

0D9A
dda

alpapraana ddayanna

0DAA
ddha

mahaapraana ddayanna

0DAB
nna

muurdhaja nayanna

0DAC
nndda

sanyaka ddyanna

0DAD
ta

alpapraana tayanna

0DAE
tha

mahaapraana tayanna

0DAF
da

alpapraana dayanna

0DB0
dha

mahaapraana dayanna

0DB1
na

dantaja nayanna

0DB3
nda

sanyaka dayanna

0DB4
pa

alpapraana payanna

0DB5
pha

mahaapraana payanna

0DB6
ba

alpapraana bayanna

0DB7
bha

mahaapraana bayanna

0DB8
ma

mayanna

0DB9
mba

amba bayanna

0DBA
ya

Yayanna

0DBB
ra

Sinhaya letter rayanna

0DBD
la

dantaja layanna

0DC0
va

vayanna

0DC1
sha

taaluja sayanna

0DC2
ssa

muurdhaja sayanna

0DC3
sa

dantaja sayanna

0DC4
ha

hayanna

0DC5
lla

muurdhaja layanna

0DC6
fa

Fayanna

Sign
ලක්‍ෂණ
0DCA
al

al-lakuna

Dependent vowel signs
රඳා පවතින ස්වර ලක්‍ෂණ
0DCF
aa

aela-pilla

0DD0
ae

ketti aeda-pilla

0DD1
aee

diga aeda-pilla

0DD2
i

ketti is-pilla

0DD3
ii

diga is-pilla

0DD4
u

ketti paa-pilla

0DD6
uu

diga paa-pilla

0DD8
vr

gaetta-pilla

0DD9
e

kombuva

0DDA
‍ේ
ee

diga kombuva

0DDB
ෛං
ai

kombu deka

Two-part dependent vowel signs
රඳා පවතින ද්වී ස්වර ලක්‍ෂණ
0DDC
‍ො
o

kombuva haa aela-pilla

0DDD
ෝ
oo

kombuva haa diga aela-pilla

0DDE
ෞ
au

kombuva haa gayanukitta

Dependent vowel sign
රඳා පවතින ස්වර ලක්‍ෂණ
0DDF
vl

gayanukitta

Additional dep. vowel signs
අමතර රඳා පවතින ස්වර ලක්‍ෂණ
0DF2
vrr

diga gaetta-pilla

Punctuations
විරාම ලකුණු
0DF4
kundaliya

kunddaliya


සටහන:
සියලුම ස්වර ලක්‍ෂණ (සංකේත 2කින් සෑදුනු ස්වර ලක්‍ෂණ ද ඇතුලුව) තනි කේතයකින් දැක්වේ.

අක්‍ෂර කේතනය
ක, කා, ක්‍රි, ක්‍රිං ආදී සෑම සිංහල අකුරක්ම තනි හෝ කීපයකින් යුතු යුනිකෝඩ් අක්‍ෂරවලින් විදහා දැක්වේ.

ස්වර
සෑම ස්වරයක්ම 0D85-0D96 පරාසයේ ඇති එක් අක්‍ෂරයකින් දැක්වේ.
උදා - අ = 0D85, ඍ = 0D8D

සටහන: ආ වැනි ස්වර 0D85 0DCF වැනි සංයුක්ත අක්‍ෂරයක් ලෙස නොදැක්විය යුතුය. එයට හේතුව එයටම වෙන් වූ  යුනිකෝඩ් අක්‍ෂරයක් පවතින හෙයිනි.

ව්‍යාංජනාක්‍ෂර
සෑම ව්‍යාංජනාක්‍ෂරයකින්ම 0D9A – 0DC9 පරාසය තුල නියෝජනය වේ.
උදා- e.g. ක= 0D9A, ඤ= 0DA4

ශුද්ධ ව්‍යාංජනාක්‍ෂරය

ස්වරයක් නොමැතිව දැක්වෙන ශුද්ධ ව්‍යාංජනාක්‍ෂර යුනිකෝඩ් අක්‍ෂර 2කින් හෙවත් ව්‍යාංජනාක්‍ෂරය සහ හල් කිරීමෙන් දැක්වේ.

උදා:ක්= 0D9A 0DCA, ට්= 0DA7 0DCA

සටහන: හල් ලකුණ යෙදෙන ක්‍රම 2ක් ඇතත් එම හල් ලකුණු 2 ම එකම කේත අක්‍ෂරයෙන් දැක්වේ. ව්‍යාංජනාක්‍ෂරයේ ස්වභාවය අනුව පරිගණකය නියමිත හල් ලකුණු තෝරා ගනී.


Consonants with vowel signs
ස්වර සමග යෙදෙන ව්‍යාංජනාක්‍ෂර

උදා:කK = 0D9A 0DCF, ෙකW = 0D9A 0DDE, ෛක = 0D9A 0DDB
ස්වරයක් සමග යෙදෙන ව්‍යාංජනාක්‍ෂර යුනිකෝඩ් කේත අක්‍ෂර 2ක සයෝගයකින් දැක්වේ.
උදා:. කා = 0D9A 0DCF, කෞ = 0D9A 0DDE, කෛ = 0D9A 0DDB

පහත දැක්වෙන සම්මුති ගත නොවන අකුරු එම අකුරු ඉදිරියෙන් දැක්වේ.

ර = 0DBB 0DD0, ර = 0DBB 0DD1
ර = 0DBB 0DD4, ර = 0DDB 0DD6
ළ = 0DC5 0DD4, ළ = 0DC5 0DD6
රැ = 0DBB 0DD0 රෑ = 0DBB 0DD1
රු= 0DBB 0DD4 රූ = 0DDB 0DD6
ළු = 0DC5 0DD4 ළූ = 0DC5 0DD6

සටහන්:
 
1. ඉහත දැක්වෙන කේත පරිගණකයේ අභ්‍යන්තර අක්‍ෂර නියෝජනය සඳහා වන අතර එම අකුරු දැක්වීම සඳහා අදාල යතුරු පුවරු අනුපිළිවෙළවල් නොවේ.

2. සියලුම ස්වර ලකුණු සඳහා වන කේත (කොම්බුවද ඇතුලුව), ව්‍යාංජනාක්‍ෂරයට අදාල කේතයට පසු පසින් යෙදේ.

3. කෝ වැනි අක්‍ෂර නියෝජනය සඳහා ව්‍යාංජනාරක්‍ෂරය පසු පසින් ස්වර ලකුණු කිහිපයක් යෙදීමට යුනිකෝඩ් පහසුකම් සලසයි. ( ‍ෙං + ා + ් ) නමුත් එම ක්‍රමය සිංහල භාෂාව විසින් ධෛර්යමත් නොකරයි. එනිසා ව්‍යාංජනාක්‍ෂරය පසු පසින් එක් සංයුක්ත ස්වර ලකුණක් (උදා -ක + ෙං) . යෙදීම නිර්දේශ කෙරේ.

4. ව්‍යාංජනාක්‍ෂරය අනුව එයට යෙදෙන පා පිල්ල ප්‍රකාර 2කින් දැක්විය හැකි නමුත් පා පිලි ආකාර 2ම එකම යුනිකෝඩ් කේත අක්‍ෂරයකින් දැක්වේ. උදා නූ = 0DB1 0DD4, කු = 0D9A 0DD4, නූ = 0DB1 0DD6, කූ = 0D9A 0DD6

අර්ධ ව්‍යාංජනාක්‍ෂර ලකුණු

අනුස්වාරය හෝ විසර්ගය දැක්වෙන සංකේත ස්වරයක්, ව්‍යාංජනාක්‍ෂයක් හෝ ස්වර ලකුණක් පසු පසින් යෙදිය හැක.
උදා -     අං = 0D85 0D82 (අ + ං;), අඃ= 0D85 0D83 (අ + ඃ)
කං = 0D9A 0D82 (ක + ං;), කෝං = 0D9A 0DDD 0D82 (ක +‎ෝ+ ං;),
කූං = 0D9A 0DD4 0D83 (ක + ූඃ)

සටහන: අර්ධ ව්‍යාංජනාක්‍ෂර යෙදෙන සෑම විටකදීම සංයුක්ත අක්‍ෂර අනුපිළිවෙළක අගටම යෙදේ.

රකාරාංශය සහ යංශය

    
මේවා සම්බන්ධිත අකුරු (conjunct letters) වේ. රකාරාංශය (,) මගින් ව්‍යාංජනාක්‍ෂරයකට පසුව යෙදෙන ‘ර’ අකුර දැක්වේ. එය ස්වර ලකුණකට පසුවද යෙදිය හැක. රකාරාංශය එයට කලින් ඇති අකුරට නිරපේක්‍ෂ පළලැති සම්බන්‍ධකය හෙවත් zero-width joiner මගින් සම්බන්ධ වේ.


ව්‍යාංජනාක්‍ෂරයකට පසුව යෙදෙන රකාරාංශය 0DCA 200D 0DBB (ව්‍යාංජනාක්‍ෂරය + ්J+ zwj + ර)

උදා -     ක්‍ර = 0D9A 0DCA 200D 0DBB (ක + ් + zwj + ර),
ක්‍රෙ = 0D9A 0DCA 200D 0DBB 0DD9 (ක + ේ+ zwj + ර + ‍ෙ‍ං)

මේ ආකාරයට යන්ශය (්‍ය) මගින් ශුද්ධ ව්‍යාංජනාක්‍ෂරයකට පසුව යෙදෙන ‘ය’ අකුර දැක්වේ.

උදා -    ක්‍ය = 0D9A 0DCA 200D 0DBA (ක + J + zwj + ය)
ක්‍යෝ = 0D9A 0DCA 200D 0DBA 0DDD ( ක + J + zwj + ය + ෙංV)

සටහන:   
1. සිංහල යතුරු පුවරුවේ ‘්‍ර’ සහ ‘්‍ය’ දැක්වෙන නිසා ඒවා පෙන්වීමට ඉහත කේත අනුපිළිවෙළ පරිගණකයකට ඇතුලත් කිරීම අනවශ්‍යය.
2. සිංහල භාෂාවේ රකාරාංශය හා යන්සය අඩංගු වේ. නමුත් රකාරාංශය හා යන්සය නොමැතිව යමෙකුට සිංහල භාවිතා කිරීමට අවශ්‍ය නම් zwj කේතය නොමැතිව භාවිතා කළ යුතු වේ.

රේපය

    
ව්‍යාංජනාක්‍ෂරයකට ප්‍රථමව යෙදෙන ‘ර්’ අකුර දැක්වීමට රේපය යෙදේ. එය 0DBB 0DCA 200D යන කේත අනුපිළිවෙලින් දැක්වේ.

උදා -     ර්‍ක = 0D9A 0DBB 0DCA 200D 0DB8 (ක + ර + J + zwj + ම)

සටහන: රේපය යතුරු පුවරුවේ දැක්වෙන හෙයින් රේපය දැක්වීම සඳහා ඉහත කේත ඇතුලත් කිරීම අනවශ්‍යය.

අනෙකුත් සම්බන්ධිත (conjunct) ව්‍යාංජනාක්‍ෂර

සම්බන්ධිත ව්‍යාංජනාක්‍ෂර පහත දැක්වෙන කේතවලින් දැක්වේ.

(ව්‍යාංජනාක්‍ෂරය + ්+ zwj + ව්‍යාංජනාක්‍ෂරය)
(ව්‍යාංජනාක්‍ෂරය + J + zwj + cons) 

උදා-    නK = 0DB1 0DCA 200D 0DAF 0DCA 200D 0DBB 0DCF
(න + J + zwj + ද + J + zwj + ර + ංK)

ස්පර්ශ අකුරු

    
ශාස්ත්‍රීය හා බෞද්ධ ලේඛණවල යොදන ආකාරයට ශුද්ධ ව්‍යාංජනාක්‍ෂරයක් හල් කිරීමට අවශ්‍ය වීම ව්‍යාංජනාක්‍ෂරය එයට පසුව එන අකුරට ස්පර්ශ කොට ලිවීමෙන් හල් ලකුණ ලොප් කල හැක. මෙය (ව්‍ය 200D ODCA ව්‍ය) ලෙස කේතනය කෙරේ.


උදා - සස = 0DC3 200D 0DCA 0DC3 (ස + zwj + J + ස) 

තනිව එන ලකුණු

    
ව්‍යාංජනාක්‍ෂරයක්  නොමැතිව ස්වර ලකුණු දැක්වීමේදී ස්වර ලකුණට කලින් INV අක්‍ෂරය යෙදීමෙන් එය දක්වනු ලැබේ. උදා - ංK = INV 0DCF (INV + ංK), ෙං= INV 0DD9 (INV + ෙං).

    
INV අක්‍ෂරයට පෙර-බැඳි හා පසු-බැඳි ස්වර ලකුණක් (‍‍ෙ .,)සමග යෙදෙන විට එය අකුරු අතර කිසිදු ඉඩක් නොගනී. එසේ උඩු-බැඳ හා යටි-බැඳ ි, ු ස්වර ලකුණු සමග එය යෙදෙන විටද අමතර ඉඩක් නොගනී.

    
තනිව පෙනෙන යන්සය INV 0DCA 200D 0DBA (INV + J + zwj + ය). යන කේතයෙන් නියෝජනය වේ.

    
එසේම රේපය තනිව ‍පෙනෙන අයුරු 0DBB 0DCA 200D INV (ර + J + zwj + INV) නැමැති කේතයෙන් දැක්වේ.

    
“නොබිඳුනු-ඉඩ” අක්‍ෂරය (non-bread space character - මෙහි කේතය 00A0 වේ.) INV අක්‍ෂරය සඳහා යෙදේ.

උදාහරණ

1. ගම 0D9C 0DB8 (ග + ම)
2. ඌරK 0D8C 0DBB 0DCF (ඌ + ර + K )
3. ෙකVප 0D9A 0DDD 0DB4 (ක + ෙංV + ප)
4. ල;කK 0DBD 0D82 0D9A 0DCF (ල + ; + ක + K )
5. පකෂ 0DB4 0D9A 0DCA 200D 0DC2 (ප + ක + J + zwj + ෂ)
6. මත 0DB8 0DD2 0DAD 0DCA 200D 0DBB (ම + N + ත + J + zwj + ර)
7. ෙකmන 0D9A 0DCA 200D 0DBB 0DDA 0DB1 0DCA(ක + J + zwj + ර + ෙJ + න+ J )
8. අන 0D85 0DB1 0DCA 200D 0DAF 0DCA 200D 0DBB (අ + න + J + zwj + ද + J + zwj + ර)
9. සතE 0DC3 0DAD 0DCA 200D 0DBA (ස + ත + J + zwj + ය) 
10. වෙදEVදය 0DC0 0DD2 0DAF 0DCA 200D 0DBA 0DDD 0DAF 0DBA (ව + ං+ N ද + +J zwj + ය + ෙංV + ද + ය)
11. වර 0DC0 0DBB 0DCA 200D 0D9C (ව + ර + J + zwj + ග)

විමර්ශන ලිපි

1. The Unicode Web Site; www.unicode.org
2. The ICTA Language website; www.fonts.lk
3. Sri Lanka Standards Institute; “Sri Lanka Standard 1134 – Sinhala Character Code

for Information Interchange”, Revision 2, 2004.

Revision
1.0 – 2004-10-22

web page hit counter