close
Sayahna Sayahna
Search

Difference between revisions of "Samagra lipi"


(ലിപി പരിഷ്കാരം)
Line 65: Line 65:
 
ഇടതുരേഫം (കുത്തക്ഷരം) ഇല്ലാതായി.
 
ഇടതുരേഫം (കുത്തക്ഷരം) ഇല്ലാതായി.
 
<poem>
 
<poem>
: {{samagra|} }} {{LR}} ർത്ത
+
: <span style="font-family:samagra7;color:red;">}</span> {{LR}} ർത്ത
 
</poem>
 
</poem>
 
ഭാഷയിലെ ചില സ്വരങ്ങൾപോലും അപ്രത്യക്ഷമായി.
 
ഭാഷയിലെ ചില സ്വരങ്ങൾപോലും അപ്രത്യക്ഷമായി.
Line 75: Line 75:
 
: ണ്‌‌ട {{LR}} ണ്ട,&#x2000; ദ്‌‌ദ {{LR}} ദ്ദ  
 
: ണ്‌‌ട {{LR}} ണ്ട,&#x2000; ദ്‌‌ദ {{LR}} ദ്ദ  
 
</poem>
 
</poem>
എങ്കിലും ഡിറ്റിപി-ലിപി അടിസ്ഥാനപരമായി പരിഷ്കരിച്ച ലിപി തന്നെയായിരുന്നു.  
+
എങ്കിലും ഡിറ്റിപി-ലിപി അടിസ്ഥാനപരമായി പരിഷ്കരിച്ച ലിപി തന്നെയായിരുന്നു.
  
 
==പുതിയലിപിയും പഴയലിപിയും==
 
==പുതിയലിപിയും പഴയലിപിയും==

Revision as of 04:13, 4 January 2020

— കെ. എച്. ഹുസൈൻ

‌‌‌‌

കെ. എച്. ഹുസൈൻ
KHHussain.png
ജനനം (1952-12-00)ഡിസംബർ , 1952
കൊടുങ്ങല്ലൂർ
തൊഴില്‍ ഭാഷാസാങ്കേതികജ്ഞൻ, ലിപിരചയിതാവ്
ഭാഷ മലയാളം
രാജ്യം ഇന്ത്യ
സംസ്ഥാനം കേരളം
പൗരത്വം ഭാരതീയന്‍
വിദ്യാഭ്യാസം എം.ലിബ്.എസ്സി.
യൂണി/കോളേജ് യു.സി.കോളേജ്, ആലുവ; കേരള സർവകലാശാല
വിഷയം ഗണിതം, ലൈബ്രറി സയൻസ്
സാഹിത്യപ്രസ്ഥാനം മലയാളം തനതുലിപി, രചന അക്ഷരവേദി
പ്രധാനകൃതികള്‍ യൂണിക്കോഡ് കാലം;
മലയാളലിപിയുടെ സമഗ്രത;
ജീവിതപങ്കാളി രാജമ്മ
മക്കള്‍ മീര

rachana.org.in

1999-ലാണു് രചന അക്ഷരവേദിക്കുവേണ്ടി ആർ. ചിത്രജകുമാർ മലയാളലിപിസഞ്ചയം അവതരിപ്പിക്കുന്നതു്. 1970-ലെ ലിപിപരിഷ്കരണവും 1980-കളുടെ അവസാനത്തോടെ കടന്നു വന്ന ഡിറ്റിപിയും മലയാളം കമ്പ്യൂട്ടിംഗിലുണ്ടാക്കിയ അവ്യവസ്ഥകൾക്കു് പരിഹാരമായിട്ടായിരുന്നു രചന അക്ഷരവേദി രൂപീകരിച്ചതു്.[1] “നമ്മുടെ ഭാഷയ്ക്കു് നമ്മുടെ ലിപി” എന്നായിരുന്നു രചനയുടെ മുദ്രാവാക്യം.

സുനിശ്ചിതമായ രണ്ടു് ആശയങ്ങളായിരുന്നു രചന അവതരിപ്പിച്ച ലിപി സഞ്ചയത്തിനുണ്ടായിരുന്നതു്.

ഒന്നു്
അതു തനതു ലിപിയിലായിരുന്നു.
രണ്ട്
അത് സമഗ്രലിപിസഞ്ചയം ആയിരുന്നു.

തനതു ലിപി

എന്താണു് തനതു ലിപി എന്നതു് സംശയപൂർവ്വവും പരിഹാസപൂർവ്വവും രചനക്കുനേരെ ചോദ്യങ്ങളുന്നയിക്കാൻ ഇടവരുത്തി. അക്ഷരവേദിയുടെ വിശദീകരണം ഇങ്ങനെയായിരുന്നു. “1824-ൽ ബെഞ്ചമിൻ ബെയ്‌‌ലി മുദ്രണത്തിനായി രൂപകല്പന ചെയ്ത അക്ഷരങ്ങളാണു് തനതു ലിപി. പിന്നീടു് 1970-ലെ പരിഷ്ക്കരണം വരെ ഒന്നര നൂറ്റാണ്ട് വളരെ കുറച്ച് കൂട്ടിച്ചേർക്കലും ഉപേക്ഷിക്കലുമായി തനതുലിപി അച്ചടിയിലും എഴുത്തിലും നിലനിന്നു. അച്ചടി വർദ്ധിക്കുകയും പുസ്തകങ്ങൾക്ക് പ്രചാരമേറുകയും ചെയ്തതോടെയാണ് ജനസാമാന്യം മാതൃഭാഷയുടെ അക്ഷരങ്ങൾ കാണാനിടയാകുന്നതും എഴുത്തും വായനയും വ്യാപകമാകുന്നതും. തനതുലിപി രചനയുടെ വിമർശകർ പരിഹസിക്കുന്നതുപോലെ അത് പുരാതന വട്ടെഴുത്തു്-കോലെഴുത്തുകളല്ല”.[2]

ലിപി പരിഷ്കാരം

1971-ലാണ് തനതുലിപി ടൈപ്റൈറ്ററിനുവേണ്ടി പരിഷ്കരിക്കപ്പെടുന്നതു്[3] വ്യജ്ഞനസ്വരങ്ങളും കൂട്ടക്ഷരങ്ങളുമായി 900-ത്തോളം ഉണ്ടായിരുന്ന അക്ഷരങ്ങൾ യാന്ത്രികമായ (mechanical) ഒരു യന്ത്രത്തിനുവേണ്ടി 90 ആക്കി വെട്ടിച്ചുരുക്കി. വ്യജ്ഞനങ്ങളോടു് ചേർന്നുവരുന്ന സ്വരങ്ങൾ വേർപെടുത്തി:

കു ‌ക0,‌  കൂ 1‌‌‌‌,  കൃ ക‌2.

കൂട്ടക്ഷരങ്ങളെല്ലാം ചന്ദ്രക്കലയിട്ടു് വേർതിരിച്ചു.

സ്ന സ്‌‌ന,  ത്സ്ന ത്‌‌സ്‌‌ന,  ണ്ട ണ്‌‌ട.

വലതു രേഫം ഇടത്തെ ചിഹ്നമായി മാറി

ക്ര 4ക.

ഇടതുരേഫം (കുത്തക്ഷരം) ഇല്ലാതായി.

} ർത്ത

ഭാഷയിലെ ചില സ്വരങ്ങൾപോലും അപ്രത്യക്ഷമായി.

:, ;, <

90-കളിൽ ഡിറ്റിപി വ്യാപകമായപ്പോൾ മറ്റൊരുലിപി മലയാളത്തിൽ രൂപംകൊണ്ടു — ‘ഡിറ്റിപി-ലിപി’. 1971-ലെ പരിഷ്കാരത്തിൽ ഇല്ലാതായ കുറച്ചു കൂട്ടക്ഷരങ്ങൾ ഡിറ്റിപി-ലിപിയിൽ തിരിച്ചു വന്നു.

ണ്‌‌ട ണ്ട,  ദ്‌‌ദ ദ്ദ

എങ്കിലും ഡിറ്റിപി-ലിപി അടിസ്ഥാനപരമായി പരിഷ്കരിച്ച ലിപി തന്നെയായിരുന്നു.

പുതിയലിപിയും പഴയലിപിയും

പരിഷ്കരിച്ച ലിപി ‘പുതിയലിപി’ എന്ന പേരിൽ പ്രചരിക്കപ്പെട്ടു. ആദ്യം പാഠപുസ്തകങ്ങളിലും ലെറ്റർപ്രസ്സുകളുടെ തിരോധാനത്തോടെ ഡിറ്റിപിയിലും അത് വ്യാപകമായി. ‘പുതിയലിപി’ എന്ന പദം തെറ്റായ ഒരു മൂല്യം (false value system) ഉണ്ടാകാനിടയാക്കി. ഒന്നരനൂറ്റാണ്ടോളം പഠിച്ചും ഉപയോഗിച്ചും വ്യവസ്ഥപ്പെട്ട മലയാളലിപി പൊടുന്നനെ ‘പഴയലിപി’യായിത്തീർന്നു! പഴയതെന്നാൽ പഴഞ്ചനും പ്രാകൃതവും അപരിഷ്കൃതവുമാണല്ലൊ; അത് ഭാഷയുടെ മുന്നോട്ടുള്ള കുതിപ്പിന് തടസ്സങ്ങളുണ്ടാക്കും. ഇങ്ങനെ ചരിത്രത്തിനും ലിപിവ്യവസ്ഥയ്ക്കും നിരക്കാത്ത ധാരണകൾ ഉല്പാദിപ്പിക്കുന്നതുകൊണ്ടാണ് രചന അക്ഷരവേദി അതിന്റെ അക്കാദമിക ചർച്ചകളിൽ ‘പഴയലിപി’ എന്ന പ്രയോഗം ബോധപൂർവ്വം ഒഴിവാക്കിയത്. ‘തനതുലിപി’ എന്ന പ്രയോഗത്തിന് ഇതും ഒരു കാരണമാണ്. വിദ്യാർത്ഥികളോടും പൊതുജനങ്ങളോടും സംവദിക്കുമ്പോൾ ‘തനതുലിപി’യ്ക്കു പകരം ‘പഴയലിപി’ എന്നും ഉപയോഗിച്ചുപോന്നു.

മലയാളത്തനിമ (1998)

1998-ൽ കേരള ഭാഷാ ഇൻസ്റ്റിറ്റ്യൂട്ടിന്റെ നേതൃത്വത്തിൽ (ഡയറക്ടർ ഡോ. തമ്പാനും പ്രോജക്ട് ലീഡർ ഡോ. പ്രബോധചന്ദ്രൻ നായരും) ‘മലയാളത്തനിമ’[4] എന്ന പേരിൽ ഡിറ്റിപി-ലിപിയെ പരിഷ്കരിക്കാനായി ഒരു ശ്രമം നടത്തി. ഭാഷയിൽ‌‌ ‘2-കാര’വും രേഫവും വേണ്ട, []-യുപയോഗിച്ചു് പിരിച്ചെഴുതിയാൽ മതി എന്നതായിരുന്നു ഈ പരിഷ്കരണത്തിന്റെ പ്രധാന നിർദ്ദേശം — [ശ്രീകൃഷ്ണൻ ശ്‌‌റീക്‌‌റ്‌‌ഷ്‌‌ണൻ]. ഈയൊരു പരിഷ്കരണത്തി്നു് എതിരായിട്ടായിരുന്നു രചന അക്ഷരവേദി രൂപീകരിച്ചതും തനതു ലിപിയാണു് മലയാളം കമ്പ്യൂട്ടിംഗിന് ഏറ്റവും അനുയോജ്യം എന്നു് സമർത്ഥിച്ചതും.

സമഗ്രലിപിസഞ്ചയം

രചന അവതരിപ്പിച്ച തനതുലിപി സഞ്ചയത്തെ ചിത്രജകുമാർ ‘സമഗ്രലിപി സഞ്ചയം’ എന്നു വിളിച്ചു. ഇതുകൊണ്ടു് ഉദ്ദേശിച്ച ശരിയായ വീക്ഷണം യൂണിക്കോഡ് മലയാളത്തിന്റെ പതിനഞ്ചു വർഷത്തെ വ്യാപനത്തിനു ശേഷവും ഇനിയും വേണ്ടവിധം മനസ്സിലാക്കിയിട്ടില്ല. സമഗ്രം എന്നതുകൊണ്ടു് രചന വ്യക്തവും കൃത്യവുമായി ഉദ്ദേശിച്ചതു് രണ്ടു കാര്യങ്ങളാണു്.

ഒന്നു്
മലയാളത്തിലുള്ള സാദ്ധ്യമായ എല്ലാ കൂട്ടക്ഷരങ്ങളും തനതുലിപി സഞ്ചയത്തിലുണ്ടു്.
രണ്ടു്
ഒപ്പം, ഭാഷയിൽ സാദ്ധ്യമല്ലാത്ത ഒരു കൂട്ടക്ഷരവും രചനയിൽ ഇല്ല.

ആസ്കി കാലഘട്ടത്തിലുണ്ടായ രചന ഫോണ്ടുകൾ ഈ സമഗ്രത കൃത്യമായി പിന്തുടർന്നു. യൂണികോഡ് രചനയിൽ ഈ സമഗ്രത നഷ്ടപ്പെടാനിടയായി. ഇതു് കൂടുതൽ വിശദീകരണം അർഹിക്കുന്നുണ്ടു്.

ഭാരതീയലിപികളുടെ പൊതുസ്വഭാവങ്ങൾ

ബ്രാഹ്മിലിപിയിലധിഷ്ഠിതമായ ഭാരതീയഭാഷകളുടെ ലിപികളിൽ[5] ചില പൊതുസ്വഭാവങ്ങൾ കണ്ടെത്താം.

  • അടിസ്ഥാന അക്ഷരങ്ങൾ സ്വരം, സ്വരചിഹ്നം, വ്യഞ്ജനം എന്നീ മൂന്നു ഗ്രൂപ്പുകളായി തിരിച്ചിരിക്കുന്നു.
  • വ്യഞ്ജനങ്ങൾ തമ്മിലും, വ്യഞ്ജനങ്ങളും സ്വരങ്ങളും തമ്മിലും കൂടിച്ചേരാം. സ്വരങ്ങൾ തമ്മിൽ കൂടിച്ചേരില്ല.
  • യ, ര, വ എന്നിവ സ്വരചിഹ്നങ്ങൾക്കു സമാനമായി വ്യജ്ഞനങ്ങളോട് കൂടിച്ചേരുന്നു. (മലയാളത്തിൽ ഇതു് യ-കാരം (5), റ-കാരം (രേഫം 4), വ-കാരം (8) എന്നിങ്ങനെ വിളിക്കപ്പെടുന്നു. യ-കാരം സ്വരചിഹ്നങ്ങളുമായി കൂടിച്ചേരാം:
50 6,  51 7
രേഫത്തിനു് ഇന്ത്യൻ ഭാഷകളിൽ ഇടതു രേഫം, വലതുരേഫം എന്നിങ്ങനെ രണ്ടു് ഭേദങ്ങളുണ്ടു്. നമുക്കു് ഏറെ പരിചിതം വലതുരേഫമാണു് — [ക്‌‌ര ക്ര]. ഇതിനെയാണു് ലിപി പരിഷ്കരണത്തിൽ വലതു ചിഹ്നമാക്കി മാറ്റിയതു് — [ക്‌‌ര 4]. (ഇതു പിന്നീടു് യൂണികോഡ് ഫോണ്ടിന്റെ ഫീച്ചറിംഗിൽ സന്ദേഹങ്ങളും ബുദ്ധിമുട്ടുകളും ഉണ്ടാക്കിയിട്ടുണ്ടു്.[6])
ദേവനാഗരിയിൽ ഇടതു രേഫം സാധാരണമാണു്. എന്നാൽ മലയാളത്തിൽ ഇന്നതു് അപ്രത്യക്ഷമായിരിക്കുന്നു. കുത്തു്‌ രേഫം എന്നരൂപത്തിലാണു്‌ അതു മലയാളത്തിൽ എഴുത്തിലും അച്ചടിയിലും നിലനിന്നിരുന്നതു്
{@വു്, ഭാ} , ആ|? എന്നിങ്ങനെ.
അതിന്റെ ഘടന [ര്‌‌ത്ത { ] എന്നായിരുന്നു. ഇന്നിപ്പോൾ യൂണികോഡ് പേജിൽ കുത്തുരേഫം ഒരു അടിസ്ഥാന അക്ഷരമായി സ്ഥാനപ്പെടുത്തിയിരിക്കുന്നു. (അറ്റോമിക് ചില്ലുകളുടെ അതേ അബദ്ധം വീണ്ടും ആവർത്തിക്കുകയാണു്.[7])
  • സംയുക്താക്ഷരങ്ങൾ കൂടിച്ചേരുന്നതിനു് നിയതമായ ചില പാറ്റേണുകളുണ്ടു്.
    • തിരശ്ചീനമായി (horizontal) വ്യഞ്ജനങ്ങൾ കൂടിച്ചേരാം: ത + സ ത്സ.
    • ലംബമായി (vertical) വ്യഞ്ജനങ്ങൾ കൂടിച്ചേരാം: സ + ത സ്ത.
ഈ രണ്ടു് പാറ്റേണുകൾ ഏതേതക്ഷരങ്ങൾക്കു്‌ സ്വീകരിക്കാം എന്നതു് കയ്യെഴുത്തുകാലത്തുണ്ടായ പ്രായോഗികതകളേയും എളുപ്പങ്ങളേയും സൗന്ദര്യാവിഷ്കാരങ്ങളേയും ആശ്രയിച്ചിരിക്കുന്നു. എഴുത്തിനും വായനയ്ക്കും സുഗമമായ, കാഴ്ചമാത്രയിൽ ഘടകങ്ങളേതെന്ന് സംശയമന്യെ നിർണ്ണയിക്കാൻ കഴിയുന്ന തരത്തിലാണ് തിരശ്ചീന-ലംബ പാറ്റേണുകളിൽ സംയുക്താക്ഷരങ്ങൾ പരിണമിച്ചുണ്ടായതു്. അതു് കാലാന്തരത്തിൽ ‘എഴുതപ്പെടാത്ത’ നിയമമായി മാറുകയും ചെയ്തു. ഈ രണ്ടു പാറ്റേണുകളിൽ നിബന്ധിച്ചിരിക്കുന്ന സംയുക്താക്ഷരങ്ങളെ നമ്മുടെ ഭാവനയേയും അപ്പപ്പോളുദിക്കുന്ന ക്ഷണികയുക്തികളെയും അവലംബിച്ചു് പരസ്പരം മാറ്റിയാൽ എഴുത്തിനും വായനയ്ക്കും, ആത്യന്തികമായി വരമൊഴിയിലൂടെ സാധിച്ചെടുക്കേണ്ട വിനിമയങ്ങൾക്കും, പാഠങ്ങളുടെ ഭാവി സംരക്ഷണത്തിനും സാരമായ ഭംഗം സംഭവിക്കും. അതുകൊണ്ടു് [ത്സ]-യെ [q] എന്നാക്കി മാറ്റാൻ നമുക്കു് യാതൊരു അധികാരങ്ങളുമില്ല. [സ്ത]-യെ [À] എന്നാക്കിമാറ്റാനും നമുക്കു് കഴിയില്ല.
ഇത്തരത്തിൽ തെറ്റാതെ പാലിക്കേണ്ട രൂപനിയമങ്ങൾ എല്ലാ ഭാഷകളിലുമുണ്ടു്. കൂട്ടക്ഷരങ്ങളുടെ കാര്യത്തിൽ റോമൻ സ്ക്രിപ്റ്റിനെ അപേക്ഷിച്ചു് ഇന്ത്യൻ ഭാഷകളിൽ ഇതു് നിരവധിയാണു്. എന്നാൽ നൂറുക്കണക്കിനു വരുന്ന കൂട്ടക്ഷരങ്ങൾ അതതു ഭാഷാസമൂഹത്തിനു് പഠിക്കാനും പ്രയോഗിക്കാനും പ്രയാസങ്ങളില്ലാതെ വരുന്നതു് അവ യുക്തമായ പാറ്റേണുകളിൽ സ്വാഭാവിക രൂപചേർച്ചയായി പരിണാമപ്പെട്ടതുകൊണ്ടാണ്, അച്ചടിയിലൂടെ ഉറച്ചുപോയതു കൊണ്ടാണ്. അതുകൊണ്ടു് പഠിതാവും പ്രയോക്താവും എല്ലാ കൂട്ടക്ഷരങ്ങളും എഴുതിപ്പഠിക്കേണ്ട ആവശ്യം വരുന്നില്ല. കുറച്ചു് കൂട്ടക്ഷരങ്ങൾ പഠിച്ചു കഴിയുന്നതോടെ പാറ്റേൺ മനസ്സിലും കണ്ണിലും വിരലിലും ഉറക്കുകയും, അതുവരെ കാണാത്തവ ആദ്യമായി കാണുന്നമാത്രയിൽ ഗ്രാഹ്യമായിത്തീരുകയും ചെയ്യുന്നു. അതുകൊണ്ടുതന്നെ [സ്ന]-യും [ന്ധ]-യും ‘കൃത്യതയുള്ള’, ‘ശരിയായ’ അക്ഷരസംയുക്തങ്ങളാണു്. എന്നാൽ [¼]-യും [½]-യും ഒട്ടും അല്ലതന്നെ.
ഏതൊക്കെ അക്ഷരങ്ങൾ കൂടിച്ചേരണം, കൂടിച്ചേരാൻ പാടില്ല എന്നത് കാഴ്ചയേയും ലാവണ്യബോധങ്ങളേയും മാത്രമല്ല അക്ഷരവർഗ്ഗങ്ങളേയും ധർമ്മങ്ങളേയും ആശ്രയിച്ചിരിക്കുന്നു. ഖരം, മൃദു എന്നിവയ്ക്കു് ഇരട്ടിപ്പ് വരാം.
[]-യുടെ ഇരട്ടിപ്പു് [ക്ക], []-യുടെ ഇരട്ടിപ്പ് [ഗ്ഗ]
എന്നാൽ []-യ്കു് ഇരട്ടിപ്പു്‌ സാദ്ധ്യമല്ല അതു് [Y] [Z] [^{]} എന്നീ രൂപങ്ങളിലേക്കു്‌ ഒരിക്കലും എത്തിപ്പെടുന്നില്ല. കാരണം [] അതിഖരമാണു്. അതു് വീണ്ടും ഇരട്ടിക്കാനുള്ള ഒരു സാദ്ധ്യതയും ഇല്ല. (1998-ൽ കേരള ഭാഷാ ഇൻസ്റ്റിറ്റ്യൂട്ടു്‌ ഡയറക്ടർ ഡോ. തമ്പാനും മലയാളത്തനിമ പ്രോജക്റ്റു് ലീഡർ ഡോ. പ്രബോധചന്ദ്രൻ നായരും അതിഖരം ഇരട്ടിപ്പിക്കാനുള്ള ഒരു ശ്രമം നടത്തി അപഹാസ്യരാവുകയുണ്ടായി. വിസർഗ്ഗം ഭാഷയിൽ നിന്നു് എടുത്തുകളഞ്ഞു് ദുഃഖം എന്നതു് ദുഖ്‌‌ഖം എന്നെഴുതാൻ അവർ നിയമങ്ങളുണ്ടാക്കി!)
ഇത്തരം തിരശ്ചീന-ലംബ പാറ്റേണുകൾ ഇന്ത്യയിലെ എല്ലാഭാഷകളിലും പ്രയോഗത്തിലിരിക്കുന്നു. ഏതു കൂട്ടക്ഷരങ്ങൾ ഏതുപാറ്റേണിൽ ഉൾപ്പെടണമെന്നു് തീരുമാനിക്കുന്നതു് അതതു ഭാഷാസമൂഹങ്ങളാണു്. ഉപയോഗ്യതയും എളുപ്പവും അസന്നിഗ്ദ്ധതകളും ലാവണ്യബോധങ്ങളുമാണു് അതിന്റെ അടിസ്ഥാനം. മലയാളത്തിൽ [കക] തിരശ്ചീനമായി കൂടിച്ചേരുന്നു. [കസ] കൂടിച്ചേരുന്നതു് ലംബമായിട്ടാണ്. ദേവനാഗരിയിൽ ഇവയെല്ലാം തിരശ്ചീനമായിട്ടാണു് കൂടിച്ചേരുന്നതു്.
ñò , òôí, ôò
  • ചില സ്വരചിഹ്നങ്ങൾ വ്യഞ്ജനങ്ങളിൽനിന്നു് വേറിട്ടു നിൽക്കുന്നു. എന്നാൽ ചിലതു് വ്യഞ്ജനങ്ങളോടു് വേർപിരിയാത്തവണ്ണം ഒട്ടി നിൽക്കുന്നു. [ 0123]-കാരങ്ങളാണു് ഇന്ത്യൻ ഭാഷകളിൽ വ്യജ്ഞനങ്ങളോടു് വേർപിരിയാത്തവണ്ണം ചേർന്നുനില്ക്കുന്നതു് — òî òï òð , തു തൂ തൃ എന്നിങ്ങനെ. അക്ഷരങ്ങളുടെ എണ്ണം കഴിയുന്നത്ര ചുരുക്കി രൂപംകൊണ്ട തമിഴിൽപോലും ‘ഉകാരങ്ങ’ളെ വ്യഞ്ജനങ്ങളിൽ നിന്നു് വേർപെടുത്തിയിട്ടില്ല — [úû] (കു, കൂ). എന്നാൽ നാം 1970-ൽ ഇതു നിർവ്വഹിച്ചു — [0, ക1, ക2]
തമിഴിൽ ‘ഇകാര’വും വ്യജ്ഞനത്തോടു് ചേർന്നു നിൽക്കുന്നു എന്നതു് ശ്രദ്ധേയമാണു് — [öü] (കിടി). മലയാളത്തിൽ ഇകാരം വേർപെട്ടു നില്ക്കുന്നു.
അക്ഷരരൂപീകരണത്തെക്കുറിച്ച് ഇതിൽ നിന്നും നാം എത്തിച്ചേരുന്ന സാമാന്യനിയമം ഇതൊക്കെയാണു്.
  • അതതു് ഭാഷാസമൂഹങ്ങളാണു് ഏതൊക്കെ അക്ഷരങ്ങൾ കൂടിച്ചേരണം, വേർപെട്ടു നിൽക്കണം എന്നു തീരുമാനിക്കുന്നതു്. എന്നാൽ ഭാരതീയ ഭാഷകളിൽ [0123] സ്വരങ്ങൾ വ്യജ്ഞനത്തോട് ചേർന്നുനിൽക്കുന്നു. ദേവനാഗരിയിൽ ഇടതു-വലതു രേഫങ്ങൾ വ്യജ്ഞനത്തോട് ചേർന്നു നില്ക്കുന്നു. മലയാളത്തിൽ വലതു രേഫം വ്യജ്ഞനത്തോട് ചേർന്നുനില്ക്കുന്നു.
  • ആയിരക്കണക്കിനു വർഷത്തെ നിലനില്പും ഉപയോഗവുംകൊണ്ടു് അടിസ്ഥാന അക്ഷരങ്ങളും സംയുക്താക്ഷരങ്ങളും ഓരോ ഭാഷയ്ക്കും ഉറച്ചുകിട്ടിയിട്ടുണ്ടു്. അച്ചടി അത് കൂടുതൽ ബലപ്പെടുത്തിയിരിക്കുന്നു. ഇങ്ങനെ രേഖപ്പെടുന്നത് അറിവിന്റെ നിലനില്പിനും വ്യാപനത്തിനും സജ്ജമാക്കാനും, ആയിരംവർഷം കഴിഞ്ഞാലും വിനിമയസാദ്ധ്യമാക്കാനും ഇതിനെ അന്ധമായി നിലനിർത്തുക എന്നതേ മാർഗ്ഗമായുള്ളു. ഒരു ഭാഷാസമൂഹം കാലങ്ങളായി വികസിപ്പിച്ചെടുത്ത അക്ഷരരൂപങ്ങളിൽ നിന്നുള്ള വ്യതിചലനം ആ ഭാഷാസമൂഹം വികസിപ്പിച്ചെടുത്ത അറിവിന്റെ തിരോധാനത്തിനു വഴിവെക്കുമെന്ന് നാം തിരിച്ചറിയണം. സൈന്ധവലിപികളിൽ ഇതു സംഭവിച്ചിട്ടുണ്ടു്. ലിപി പരിഷ്കാരത്തോടെ നമ്മുടെ ഭാഷയിലും സമൂഹത്തിലും ഇതു സംഭവിച്ചിട്ടുണ്ടു്. ഇതിനെയാണു് നാം രചനയിലൂടെ ശരിയാക്കിയെടുക്കാൻ 1999 മുതൽ ശ്രമിക്കുന്നതു്. ഇതിനായി നാം അനുവർത്തിക്കുന്ന രീതിശാസ്ത്രം സംശയങ്ങളൊന്നുംതന്നെ ഇല്ലാത്തതാണു് — ഉപയോഗത്തിലിരുന്ന പഴയ/തനതു അക്ഷരങ്ങൾ കണ്ടെത്തുക, പുനഃസൃഷ്ടിക്കുക, പുതുതായൊന്നും സൃഷ്ടിക്കാതിരിക്കുക.

രചന ചെയ്തതും ചെയ്യാതിരുന്നതും

  1. പതിനാറാം നൂറ്റാണ്ടോടുകൂടി നാട്ടെഴുത്തച്ഛന്മാരുടെ കീഴി‍ൽ ഗ്രാമഗ്രാമാന്തരങ്ങളിൽ പ്രചാരത്തിലായ പൊതുവിദ്യാഭ്യാസത്തിലുടെ, ബെഞ്ചമിൻ ബെയ്‌‌ലിയുടെ കാലം (1824) തൊട്ടു് അച്ചടിയിലൂടെ ജനകീയവൽക്കരിച്ച് മലയാളി കണ്ടും എഴുതിയും പഠിച്ച എല്ലാ അക്ഷരരൂപങ്ങളും വീണ്ടെടുക്കുക; അതു് അച്ചടിയിലും ഡിജിറ്റൽ ഡോക്യുമെന്റുകളിലും കണിശമായ കൃത്യതയോടെ പ്രയോഗിക്കുകയും പരിപാലിക്കുകയും ചെയ്യുക; കൂട്ടക്ഷരങ്ങൾ നിർമ്മിക്കാൻ കഴിയാത്ത അവസരങ്ങളിൽ (ഇതു് പിന്നീടു് വിശദീകരിക്കുന്നുണ്ടു്) അടിസ്ഥാന നിയമങ്ങൾ അനുസരിച്ചുകൊണ്ടു് കൂട്ടക്ഷരങ്ങളെ ഘടകീകരിക്കുക.
  2. ഒരു കാരണവശാലും ഭാവനാത്മകമായി പുതിയ കൂട്ടക്ഷരങ്ങൾ ഉണ്ടാക്കാൻ പാടില്ല. അങ്ങനെയുള്ള സാദ്ധ്യതകൾ എല്ലാ ഭാഷയിലും നിലനിന്നിരുന്നു. അച്ചടി പ്രചരിച്ചു കഴിഞ്ഞ 500 വർഷങ്ങളിൽ വരമൊഴിയിലുള്ള ഏതാണ്ടു് 700 ഭാഷകളിൽ ലോഹ അച്ചുകളിൽ വിജ്ഞാനം രേഖപ്പെടുത്തുന്നതിലൂടെ അക്ഷരങ്ങളും സംയുക്താക്ഷരങ്ങളും ലോഹം പോലെ ഉറച്ചു കിട്ടിയിട്ടുണ്ടു്. ഇതിനിനി ഇളക്കം തട്ടാൻ പാടില്ല, അക്ഷരങ്ങൾ നഷ്ടപ്പെട്ടോ ആകൃതികൾക്ക് വ്യതിയാനം സംഭവിച്ചോ അറിവുകൾ ഇല്ലാതാകാൻ പാടില്ല. പുതിയ അക്ഷരങ്ങൾ കടന്നു കയറി അറിവുകളിൽ മായം ചേർക്കാൻ പാടില്ല.

ഇത്തരം പരികല്പനകളാണു് സമഗ്രലിപി സഞ്ചയം രൂപപ്പെടുത്തുമ്പോൾ ചിത്രജകുമാറിന്റെ മനസ്സിലുണ്ടായിരുന്നതു്. അതു് രചന അക്ഷരവേദി 1999-ൽ അവതരിപ്പിച്ച അക്ഷരസമുച്ചയത്തിലും രചന ഫോണ്ടിലും എങ്ങനെ പിന്തുടർന്നു എന്ന് നമുക്കു് പരിശോധിക്കേണ്ടതു്.

[ക] ചേർന്നുള്ള അക്ഷരരൂപീകരണം

മലയാളത്തിലെ കൂട്ടക്ഷരരൂപീകരണത്തിന്റെ സുനിശ്ചിതമായ പാറ്റേൺ പിന്തുടർന്നാണു് രചന ഫോണ്ടു് രൂപകല്പന ചെയ്യാനായി 1998-ൽ ചിത്രജകുമാർ നഷ്ടപ്പെട്ട അക്ഷരങ്ങൾ കണ്ടെത്തുന്നതും അവയെ ആകാരാദിക്രമത്തിൽ നിരത്തിവച്ചുള്ള പട്ടിക (list) തയ്യാറാക്കുന്നതും.

  • 0123-കാരങ്ങൾ വ്യജ്ഞനത്തോട് ചേർത്തുനിറുത്തുക: [ക കു കൂ കൃ കൄ കൢ].

അപ്രവചനീയത

മലയാള അക്ഷരങ്ങളിൽ സ്വരങ്ങൾ കൂടിച്ചേർന്നുള്ള രൂപങ്ങൾ എവിടെ ഏതൊക്കെയാണെന്നുള്ളതിന്റെ അപ്രവചനീയത അക്കങ്ങളിലെ prime numbers പോലെയാണു്. എന്നാൽ അതു മുഴുവൻ ആസ്കി രചന ഫോണ്ടുകൾ മുതലേ നമുക്കു് അടുക്കും ചിട്ടയോടും കൂടി ലഭ്യമാണു്.

  • [ക, ഗ] എന്നിവയ്ക്കു് [3]-കാരമുണ്ടു് — [കൄ]$, []$
  • എന്നാൽ [ഖ, ഘ] എന്നിവയ്ക്കില്ല — [_]#, [a]#
  • [ക, ച, ട, ത, പ] എന്നിവയുടെ അനുനാസികങ്ങളിൽ ത-വർഗ്ഗത്തിനും പ-വർഗ്ഗത്തിനും മാത്രമേ [2]-കാരം ഉള്ളൂ.
[b]# [¢]# [£]# [നൃ]$ [മൃ]$
  • [3]-കാരവും ഇതേപോലെ: [c]# [g]# [k]# [©]$ [ª]$
  • സാദ്ധ്യമായ എല്ലാകൂട്ടക്ഷരങ്ങളും കണ്ടെത്തുക. ഒരു കാലത്തും ഉപയോഗത്തിലില്ലാതിരുന്നവ ഒഴിവാക്കുക.
[ക്ക, ക്ട, ക്ണ, ക്ത, ക്ന, ക്മ, ക്ല, ക്ഷ, ക്സ, ക്റ്റ]$
ഇവിടെ സാധാരണ യുക്തിക്കു സാദ്ധ്യമെന്നു തോന്നുന്ന അനേകം കൂട്ടക്ഷരങ്ങൾ ഉപേക്ഷിച്ചിരിക്കുന്നു.
[F/G, H/I, J/K] #
  • രണ്ടിൽ കൂടുതൽ അക്ഷരങ്ങൾ കൂടിച്ചേർന്ന കൂട്ടക്ഷരങ്ങൾ കണ്ടെത്തുക — [ക്ഷ്ണ, ക്ഷ്മ].
    • ([ക്ട]-യും [ഷ്ട]-യും ഉണ്ടെങ്കിലും [S] ഇല്ല. [S W]എന്നിങ്ങനെ ഒട്ടേറെ കൂട്ടക്ഷരങ്ങൾ പരിഗണിച്ചിട്ടില്ല.
    • ([ക്റ്റ] ഒറ്റനോട്ടത്തിൽ മൂന്നക്ഷരങ്ങൾ കൂടിച്ചേർന്നതായി തോന്നാം — [ക + റ + റ]. എന്നാൽ അതു് യഥാർത്ഥത്തിൽ രണ്ടക്ഷരങ്ങൾ കൂടിച്ചേർന്നതാണു് — [ക + ഺ + ഺ]).
  • കൂട്ടക്ഷരങ്ങളുടെ [0123]-കാരങ്ങൾ കണ്ടെത്തുക.
ക്കു, ക്കൂ, ക്കൃ,  ക്ടു ക്ടൂ  ക്ണു,ക്ണൂ
ക്തു, ക്തൂ, ക്തൃ, ക്തൄ  ക്നു ക്നൂ  ക്മ ക്മൂ
ക്ലു ക്ലൂ  ക്ഷു ക്ഷൂ ക്ഷൃ  ക്ഷ്ണു ക്ഷ്ണൂ
ക്ഷ്മു ക്ഷ്മൂ ക്ഷ്മൃ  ക്സു, ക്സൂ, ക്സൃ  ക്റ്റു, ക്റ്റൂ
  • ഇവിടെ വിശേഷാൽ കാണപ്പെടുന്ന ചില കാര്യങ്ങളുണ്ടു്:
    • []-യ്ക്ക് [3]-കാരമുണ്ടെങ്കിലും അതിന്റെ ഇരട്ടിപ്പിനു് ഇല്ല — [കൄ]$ [¤]#.
    • []-യ്ക്കു് [23]-കാരങ്ങൾ ഉണ്ടു്.
    • എന്നാൽ [ക, ട] ചേർന്നുവരുന്ന കൂട്ടക്ഷരങ്ങൾക്കു് ഇവയില്ല: ക്ട ക്ടു ക്ടൂ [L]# [M]#.
    • എന്നാൽ [ക, ത] ചേർന്നു വരുന്ന കൂട്ടക്ഷരങ്ങളിൽ ഇവ പ്രത്യക്ഷപ്പെടുന്നു — [ക്തൃ ക്തൄ].
    • Vertical conjunct-കളിൽ 23-കാരങ്ങളില്ല, horizontal conjuct-കളിലെല്ലാമുണ്ടു് എന്നു് ഇതിനെ സാമാന്യവൽക്കരിക്കാനും കഴിയില്ല. കാരണം [ക്ഷ]-യ്ക്കു് 2-കാരമുണ്ടു്, എന്നാൽ 3-കാരമില്ല: [ക്ഷൃ]$ [§]#.
  • വലതു രേഫത്തെ മുറിക്കാതെ 0123 പോലെ വ്യജ്ഞനത്തോടു് ചേർത്തു നിറുത്തുക — ക്ര.
കൂട്ടക്ഷരങ്ങളുടെ രേഫവും ഇതേപോലെ — [ക്ക്ര, ക്ട്ര, ക്ക്ര].
ഇവിടെ [ക്ന, ക്മ, ക്സ, ക്റ്റ] ഉണ്ടെങ്കിലും [ന, മ, സ, റ്റ] എന്നിവയുടെ റ-കാരങ്ങൾക്കു് കൂട്ടക്ഷരങ്ങളിലിടമില്ല: [ക്ട്ര]$ [¨]# [P]# [Q]# [R]#.
[]-യ്ക്കു് റ-കാരം ഇല്ലേയില്ല — [l]#. അതിനാൽ [ക്ണ] ഉണ്ടെങ്കിലും [N]-യ്ക്കു് ഒരു സാദ്ധ്യതയും ഇല്ല.
  • കൂട്ടക്ഷരങ്ങളുടെ റ-കാരങ്ങളുടെ [01] എന്നിവ കണ്ടെത്തുക: ക്ക്രു ക്ക്രൂ  ക്ടു ക്ടൂ  ക്ക്രു ക്ക്രൂ.
ഇതോടെ [] എന്ന അടിസ്ഥാന അക്ഷരത്തിന്റെ സാദ്ധ്യമായ കൂട്ടക്ഷരങ്ങളുടെ നിര കൃത്യപ്പെടുകയായി.
കു കൂ കൃ കൄ കൢ ക്ക ക്കു ക്കൂ ക്കൃ ക്ക്ര ക്ക്രു ക്ക്രൂ
ക്ട ക്ടു ക്ടൂ ക്ണ ക്ണു ക്ത ക്തു ക്തൂ ക്തൃ ക്തൄ ക്ത്ര ക്ത്രു ക്ത്രൂ
ക്ന ക്നു ക്നൂ ക്മ ക്മു ക്മൂ ക്ര ക്രു ക്രൂ
സാധാരണ ഒരു നേർയുക്തിയ്കു് (linear logic) സൃഷ്ടിക്കാൻ കഴിയുന്ന കൂട്ടക്ഷരങ്ങളല്ല മലയാളത്തിനുള്ളതു് എന്ന് ഇതിൽ നിന്നും സ്പഷ്ടമാണു്. കൂടിച്ചേരുന്നതോടൊപ്പം കൂടിച്ചേരാതിരിക്കലുമാണ് മലയാളത്തിന്റെ സമഗ്രത എന്നു് ഇതിൽനിന്നും നാം കണ്ടെത്തുന്നു.

ലിപിയുടെ ഗൂഢാത്മകത

മനുഷ്യന്റെ സംസ്കാരിക ചരിത്രത്തിൽ ലിപികളുണ്ടായിട്ടു് 3000 വർഷങ്ങളേ ആയിട്ടുള്ളൂ. അക്ഷരങ്ങളാണു് ഇന്നു് നാം വ്യവഹരിക്കുന്ന സാംസ്കാരിക മനുഷ്യനെ നിർമ്മിച്ചെടുത്തതു്. ദൈവികതയും ഗൂഢാത്മകതയും അക്ഷരങ്ങളിൽ ആരോപിക്കാനിടയായതിന്റെ കാരണവും ഈ പഴമയാണു്. മനുഷ്യചരിത്രത്തിലെ ഏറ്റവും വലിയ കണ്ടുപിടുത്തം ഭാഷയും ലിപിയുമായിരിക്കേ, ശബ്ദവും ചിഹ്നങ്ങളും തമ്മിലുള്ള പാരസ്പര്യത്തെക്കുറിച്ചുള്ള ചിന്തകളുടെ ആയിരം വർഷങ്ങൾ ലിപിപരിണാമത്തിലെ ഗൂഢാത്മകതയുടെ കാലങ്ങളാണു്. ഭാരതീയ ലിപികളിലും മലയാള ലിപികളിലുമൊക്കെ ഇന്നും കണ്ടെത്തപ്പെടാനാകാത്ത ‘കാരണങ്ങൾ’ നിരവധിയാണു്.

ഇതിന്റെ പ്രത്യക്ഷോദാഹരണം 0123 കൂടിച്ചേർന്ന വ്യഞ്ജനങ്ങളാണു്. മറ്റെല്ലാ സ്വരചിഹ്നങ്ങളും വ്യഞ്ജനത്തിൽ നിന്നും വേറിട്ടു നിൽക്കുന്നു. ഇടത്തോ, വലത്തോ മുകളിലോ താഴെയോ ആയാണു് അവയുടെ സ്ഥാനങ്ങൾ. പക്ഷെ 0123-കാരങ്ങൾ വ്യജ്ഞനത്തോടു്‌ ചേർന്നു നില്ക്കുന്നു. ഇന്ത്യയിലെ എല്ലാ ഭാഷകളിലും ഇതു് ആവർത്തിക്കുന്നു. ഇതിനുള്ള കാരണം ഒരിടത്തും വിശദീകരിക്കപ്പെട്ടിട്ടില്ല. ഇതിനെയാണു് 1970-ലെ ലിപിപരിഷ്കരണത്തിൽ നാം ‘ശാസ്ത്രീയമായി’ പുനഃക്രമീകരിച്ചതു്!

  • ഉച്ചരിക്കുന്നതുപോലെ എഴുതുന്ന ഭാഷ എന്ന ഒരു സാമാന്യ നിയമം മലയാളം കഴിയുന്നത്ര പാലിച്ചു പോരുന്നുണ്ടു്. കൂട്ടക്ഷരങ്ങളുടെ ഉച്ചാരണം എപ്പോഴും അതിന്റെ പൂർവ്വാപരക്രമം പാലിച്ചാണു്. ക്തഎന്നതിൽ ആദ്യവും രണ്ടാമതും ഉച്ചരിക്കുന്നു. [ക്സ]-യും [സ്ക]-യുമൊക്കെ ഇതെപോലെയാണു് ഉച്ചരിക്കപ്പെടുന്നതു്. പക്ഷെ []-യുടെ രണ്ടു കൂട്ടക്ഷരങ്ങളിൽ ഇത് തകിടം മറിയുന്നു. [ഹ്ന], [ഹ്മ] ഇവയിൽ രണ്ടാമത്തെ അക്ഷരത്തിന്റെ ഉച്ചാരണത്തിനാണു് പ്രഥമ സ്ഥാനം.
  • []-യുടെ ഇരട്ടിപ്പായാണു് [റ്റ]-യെ കാണുന്നതും എഴുതുന്നതും കമ്പ്യൂട്ടറിൽ ടൈപ്പു് ചെയ്യുന്നതും. എന്നാൽ ഇതു് [] (half-റ്റ)-യുടെ ഇരട്ടിപ്പാണെന്നു് എ. ആർ .രാജരാജവര്‍മ്മ സമർത്ഥിച്ചിട്ടുണ്ടു്.[8] അതുകൊണ്ടു് ക്റ്റ, സ്റ്റ, ഫ്റ്റ എന്നിവ രണ്ടക്ഷരങ്ങൾ കൂടിച്ചേർന്ന കൂട്ടക്ഷരങ്ങളാണു്, മൂന്നക്ഷരങ്ങൾ ചേർന്നവയല്ല. പക്ഷെ യൂണിക്കോഡിൽ ഇത് [റ + റ] കൂടിച്ചേർന്നാണു് ഉണ്ടാകുന്നതു്. [ക + ഺ + ഺ ക്റ്റ] എന്നതാണു് ശരിയായ കോഡിംഗ്. ഇതിനി നേരെയാക്കാൻ പറ്റുമെന്നു് തോന്നുന്നില്ല.
  • []-യ്ക്കു് [01] എന്നിവയുണ്ടെങ്കിലും [2]-കാരം ഇല്ല — [«]#
എന്നാൽ [] കൂടിച്ചേർന്നു വരുന്ന കൂട്ടക്ഷരങ്ങൾക്കു് 2-കാരം ഉണ്ടു്! [ത്ഥൃ]$ [ത്സ്ഥൃ]$ [സ്ഥൃ]$
  • [റ്റ]-യ്ക്കു് റ-കാരമില്ല. എന്നാൽ ഇതു് കൂടിച്ചേർന്നു വരുന്ന [സ്റ്റ]-യ്ക്ക് റ-കാരമുണ്ടു് — [സ്റ്റ്ര].
  • []-യ്ക്കു് [2]-കാരമുണ്ട് — [രൃ]; എന്നാൽ []-യ്ക്കു് ഇല്ല — [¸‍] #

രചന ഫോണ്ടിന്റെ ഘടന

ആസ്കി-യുടെ കാലം മുതലേ ഡിറ്റിപി പ്രചാരത്തിലായ ഇന്ത്യൻ ഭാഷകളിലുണ്ടായ ഫോണ്ടുകളിലെ അക്ഷരങ്ങളുടെ ഘടന പൊതുവെ ഘടകീകരണത്തിൽ അധിഷ്ഠിതമായിരുന്നു. ദേവനാഗരിയുടെ ഹിന്ദി ഭാഷയ്ക്കു വേണ്ടിയുണ്ടാക്കിയ ഫോണ്ടുകൾ പരിശോധിച്ചാൽ ഇതു വ്യക്തമാകും. []-യുടെ സ്വരം മൂന്നു് പ്രത്യേക വലിപ്പത്തിലാണു് ആ ഫോണ്ടുകളിലുള്ളതു്. ചെറുതും വലുതുമായ അക്ഷരങ്ങൾക്കു് []-കാരം ഉണ്ടാക്കാൻ ഇതുപയോഗപ്പെടുത്തിയിരുന്നു. കാരണം []-യുടെ സ്വരചിഹ്നത്തേക്കാൾ []-യുടെ []-സ്വരചിഹ്നം ഇടത്തേയ്ക്കു കൂടുതൽ നീളം ആവശ്യപ്പെടുന്നുണ്ടു്. മലയാളത്തിൽ സംഭവിച്ചതുപോലെ അക്ഷരങ്ങളുടെ ഘടനയെ വ്യാപകമായി അട്ടിമറിച്ചുള്ള ഒരു പരിഷ്കരണം എഴുപതുകളിൽ ഇന്ത്യയിലെ മറ്റൊരു ഭാഷയിലും നടന്നിട്ടില്ല. കൂട്ടക്ഷരങ്ങളേയും സ്വരചിഹ്നങ്ങളേയും ഘടകീകരിച്ചു്, പൊതുഘടകങ്ങൾ രൂപകല്പന ചെയ്തു് ആവശ്യം വരുമ്പോൾ ചേർച്ചയുള്ളതു ചേർത്തു നിറുത്തി കഴിയുന്നത്ര പരമ്പരാഗതലിപി വ്യവസ്ഥയെ സംരക്ഷിച്ചാണു് ഇതര ഭാരതീയഭാഷകളിൽ ഡിറ്റിപി-ലിപി ഉണ്ടാക്കിയതു്. മലയാളത്തിലും ഇതു സാദ്ധ്യമാകുമായിരുന്നു. ഉദാഹരണത്തിനു് [പു] [ബു] [വു] [യു] [സു] എന്നിവയിൽ പൊതുഘടകമായി വരുന്ന [ ƒ] ചിഹ്നം (അടിയിലെ വട്ടം) ഒരൊറ്റയെണ്ണം ഡിസൈൻ ചെയ്തു് ആവശ്യത്തിനനുസരിച്ചു് [] [] [വ‍ ] [] [സ‍]-യോടു് ചേർത്തൊട്ടിച്ചാൽ ഭൂരിപക്ഷം ഉകാരങ്ങളെയും വ്യജ്ഞനത്തോടു ചേർത്തുനിറുത്താമായിരുന്നു. അവശേഷിക്കുന്ന ഉകാരങ്ങൾ വളരെ കുറച്ചേയുള്ളൂ — [കു] [ഗു] [ഛു] [ജു] [ണു] [തു] [നു] [രു] [ഹു]. ഇതൊക്കെ തന്നെയാണു് []-കാരത്തിന്റെയും []-കാരത്തിന്റെയും സ്ഥിതി. പൊതുഘടകീകരണത്തിന്റെ മറ്റൊരു സാദ്ധ്യത രേഫചിഹ്നത്തിനാണ്. മലയാളത്തിലും മൂന്നു് വക്രങ്ങൾ വെച്ചു് ഇതു സാധിച്ചെടുക്കാം. [പ്ര സ്ര ന്ധ്ര] എന്നിവയിലെ പലവലിപ്പത്തിലുള്ള റ-കാരത്തിന്റെ വക്രങ്ങളെ പൊതുഘടകങ്ങളാക്കി മാറ്റാം.

1998 മുതലേ ഫോണ്ടു് ഡിസൈനിംഗിൽ രചന അവലംബിച്ച രീതിശാസ്ത്രം മറ്റു ഭാരതീയ ഭാഷകളുടേതിൽ നിന്നും തീർത്തും വ്യത്യസ്തമായിരുന്നു. ചിത്രജകുമാർ സ്വരൂപിച്ച അക്ഷരങ്ങളുടെ സമഗ്രത പരിപൂർണ്ണമായും പിന്തുടരുക എന്നതാണു് രചനാ ഫോണ്ടിന്റെ രൂപകല്പനയിൽ തുടക്കം മുതലേ സ്വീകരിക്കപ്പെട്ടതു്. അതുകൊണ്ടു് ഇന്ത്യൻ ഭാഷകളുടെ ആസ്കി ഫോണ്ടുകളിൽ അവലംബിച്ച ഘടകീകരണരീതി തുടക്കം മുതലേ രചന തിരസ്കരിച്ചു. ഹിന്ദിയുടെ യുണികോഡ് ഫോണ്ടുകളിൽ ഇന്നും ആസ്കി-യുടെ അതേ രീതിയാണു് ഇപ്പോഴും പിന്തുടരുന്നതു്.

ô ñ í î ôñíî

മലയാളത്തിന്റെ ആദ്യ യൂണികോഡ് ഫോണ്ടുകളിൽ ഘടീകരണത്തിന്റെ ഇതേ രീതിയാണുണ്ടായിരുന്നതു്. മലയാളത്തിൽ യുണികോഡ് സന്നിവേശിച്ചപ്പോൾ മൈക്രോസോഫ്റ്റ് ഇറക്കിയ Kartika.ttf-ൽ ഇതു് തെളിഞ്ഞുകാണാം. കാർത്തിക പരിഷ്കരിച്ച ലിപിയിൽ അധിഷ്ഠിതമായിരുന്നതിനാൽ കൂട്ടക്ഷര നിർമ്മിതിയ്ക്കു് വലിയ അവസരങ്ങൾ നല്കിയിരുന്നില്ല. അവയിലുള്ള കൂട്ടക്ഷരങ്ങൾ പലതും മലയാളത്തിന് അന്യമാണ്.

ച്ല ജ്ല ഭ്ല റ്ല ള്ല    

Vertical conjuct-കളുടെ രൂപീകരണത്തിനായി ചുരുക്കം അക്ഷരങ്ങൾ “താഴക്ഷരങ്ങൾ” ആയി സ്ലോട്ടുകളിൽ നിക്ഷേപിച്ചിരിക്കുന്നു. *ഛ *ദ *ധ. ഇവ മലയാളത്തിലെ ചില പ്രധാന അക്ഷരരൂപീകരണത്തിനുള്ള അത്യാവശ്യ ഘടകങ്ങളാണെന്നു് ആദ്യനോട്ടത്തിൽ തോന്നാം — ച്ഛ, ബ്ദ, ബ്ധ എന്നിവപോലെ. എന്നാൽ ഇവ പല അസംഭവ്യതകളെയും ഉത്പാദിപ്പിക്കുന്നു.

AnjaliOldLipi (2005) ആണു് രചനയ്ക്കു മുമ്പേ തനതു ലിപിയിലിറങ്ങിയ ആദ്യ യുണികോഡ് ഫോണ്ടു്. ആസ്കി-യിൽ 1999-ൽ ഇറങ്ങിയ രചനയുടെ തനതു അക്ഷരങ്ങളുടെ പിന്തുടർച്ചയായിരുന്നു അഞ്ജലിയെങ്കിലും vertical conjuct-കളുടെ രൂപീകരണത്തിൽ കാർത്തികയുടേതുപോലെയുള്ള ഘടകീകരണരീതിയാണു് അവലംബിച്ചതു്. ഇതിന്റെ ഫലമായി അസംഭവ്യമായ പലകൂട്ടക്ഷരങ്ങളും രൂപം കൊണ്ടു — [F f Á]. ഇപ്പോൾ SMC സൈറ്റിലുള്ള അഞ്ജലി ഫോണ്ടിൽ പൊതുവായ ‘താഴക്ഷരങ്ങൾ’ (common below glyphs) കഴിയുന്നത്ര കുറച്ചിരിക്കുന്നു. എന്നാൽ [മൃ] താഴക്ഷരത്തിലുൾപ്പെടുത്തിയതിനാൽ [O] പോലുള്ള അസംഭവ്യതകൽ സംഭവിക്കുന്നു.

ഭാരതീയലിപികൾക്കായി 1997-ൽ മൈക്രോസോഫ്റ്റ് പുറത്തിറക്കിയ opentype specifications പൊതുഘടകീകരണത്തെ ആസ്പദിച്ചായിരുന്നു.[9] ദേവനാഗരി സ്ക്രിപ്റ്റിന്റെ OpenType font specifications ഇൻഡിക് സ്ക്രിപ്റ്റിനു് പൊതുവായാണു് കണക്കാക്കപ്പെടുന്നതു്. Above-base, below-base, pre-base, post-base എന്നീ ഗ്ലിഫ് വിഭജനങ്ങൾ അടിസ്ഥാന ഗ്ലിഫുകൾക്കു (base glyph) പുറമേ അവയിൽ വിശദീകരിക്കപ്പെട്ടിരിക്കുന്നു. വ്യഞ്ജനങ്ങളെ ഇടത്തും വലത്തും മുകളിലും താഴെയുമായി പിരിക്കാൻ പറ്റുന്ന പൊതുരൂപങ്ങളുടെ വർഗ്ഗീകരണമാണതു്. മലയാളത്തിന്റെ തനതുലിപിയിൽ vertical conjuct-കളിൽ താഴക്ഷരങ്ങൾ ഇതനുസരിച്ച് Below-base രൂപങ്ങളായി ഘടകീകരിക്കാം. ഉദാഹരണത്തിനു് ക്ന, പ്ന, സ്ന എന്നീ അക്ഷരങ്ങളുടെ അടിയിലുള്ള [  ø]-യെ വേറിട്ടൊരു ഗ്ലിഫായി രൂപകല്പന ചെയ്യാം. ആവശ്യം വരുമ്പോൾ വേറിട്ടു നിൽക്കുന്ന മുകളക്ഷരങ്ങളുമായി (above-base glyph) കൂട്ടിച്ചേർക്കാം. ഇങ്ങനെ യോജിപ്പിക്കുന്ന പണി shaping engine-ന്റേതാണു്.

I +    ø
c +    ø
q +    ø

ഇതിന്റെയൊരപകടം, കൂടിച്ചേരാനിടയില്ലാത്തവയെ നിഷ്കൃഷ്ടമായി തരംതിരിച്ചില്ലെങ്കിലുള്ള അസംഭവ്യതകളാണു്. വ്യജ്ഞനത്തോടു് കൂടിച്ചേർന്നു നിൽക്കുന്ന [0123]-കാരങ്ങളെ ഇങ്ങനെ below-base ഘടകങ്ങളായി പരിഗണിക്കാവുന്നതാണു്.

c ƒ   d ƒ
h ƒ   p ƒ
c Œ   d Œ
e Œ   g Œ

ഇരട്ടിപ്പുകളേയും ഇപ്രകാരം ഘടകീകരിക്കാം

N ä   e ä
h ä   n ä

ഇതിൽപ്പെടാതെ ഒറ്റയ്ക്കു നിൽക്കാൻ ശേഷിയുള്ള കൂട്ടക്ഷരങ്ങൾ ‘അഖണ്ഡ്’ എന്ന പേരിലാണു് അറിയപ്പെടുന്നതു് — ക്ക, ച്ച, ട്ട, … എന്നിങ്ങനെ. കു, തു, നൂ, … എന്നിവയെ പൊതുവേ ‘psts’ (post-base substitution) എന്ന നിയമപ്രകാരമാണ് രൂപപ്പെടാറ്. ചേരുവകളുടെ കൃത്യമായ വർഗ്ഗീകരണമില്ലെങ്കിൽ ഇവിടെയും അപകടം സംഭവിക്കാം:

ക ു I ƒ
ഗ ു K ƒ
ത ു X ƒ

ലംബസംയുക്തങ്ങളിലെന്നപോലെ തിരശ്ചീനസംയുക്തകങ്ങളിലും (horizontal conjucts) അപൂർവ്വമായി ഘടകങ്ങൾ കണ്ടെത്താൻ കഴിയും.

Ý , Þ , â  എന്നിവയെ pre-base forms ആയും     † , Š , ƒ എന്നിവയെ post-base ആയും പരിഗണിച്ചാൽ

Ý P † ÝP†
Þ P Š ÞPŠ
â g ƒ âgƒ

ഇങ്ങനെ pre-base, post-base, below-base ആയി അക്ഷരങ്ങളെ ഘടകീകരിച്ചും പിന്നീട് കൂട്ടിച്ചേർത്തും മലയാളത്തിൽ അനേകം കൂട്ടക്ഷരങ്ങൾ നിർമ്മിച്ചെടുക്കാം.

MISIS-മീര

കഴിയുന്നത്ര ഘടകീകരിച്ചു്, പിന്നീടു് കൂട്ടിച്ചേർത്തു് മലയാളത്തിന്റെ തനതു് അക്ഷരങ്ങൾ ഉല്പാദിപ്പിക്കാൻ മലയാളത്തിൽ ആദ്യശ്രമം നടന്നതു് 2003-ൽ ആണു്. യുനസ്കോയുടെ CDS/ISIS[10] എന്ന database മലയാളത്തിനായി MISIS (Malayalam ISIS) എന്ന പേരിൽ പ്രോഗ്രാം ചെയ്യുന്ന അവസരത്തിലാണതു് സംഭവിച്ചതു്. തലശ്ശേരി ബ്രണ്ണൻ കോളേജിലെ 22,000 പുസ്തകങ്ങളുടെ Bibliographic database ഉണ്ടാക്കുന്നതിലേക്കായിരുന്നു MISIS രൂപകല്പന ചെയ്തതു്. മീര (Meera) എന്ന ലിപിനാമം (font name) ആദ്യമായി പ്രത്യക്ഷപ്പെടുന്നതു് അതിലാണു്. ഘടകങ്ങളെ യോജിപ്പിച്ചു് തനതു് അക്ഷരങ്ങളുണ്ടാക്കിയതു് രചന എഡിറ്റർ പ്രോഗ്രാമിന്റെ പ്രത്യേകം പ്രോഗ്രാം ചെയ്ത സംയോജനതത്വങ്ങൾ (combining rules) ആണു്. അടുത്ത വർഷം തന്നെ യുണികോഡ് മലയാളത്തിൽ പ്രത്യക്ഷപ്പെട്ടപ്പോൾ MISIS പരീക്ഷണം അപ്രസക്തമായി. മലയാളത്തിന്റെ സാദ്ധ്യമായ എല്ലാ ഗ്ലിഫുകളും ഒരൊറ്റ ഫോണ്ടിൽ ഒതുക്കാമെന്നായതോടെ, 2006-ൽ തിരുവനന്തപുരത്തെ സ്റ്റേറ്റ് സെൻട്രൽ ലൈബ്രറിയിൽ യൂണികോഡ് അധിഷ്ഠിതമായി ആദ്യത്തെ Search and Retrieval System രൂപംകൊണ്ടു. ഗ്ലിഫുകളെ ഘടകീകരിക്കാതെ തന്നെ മലയാളത്തിന്റെ ഫോണ്ടുകൾ ഡിസൈൻ ചെയ്യാനുള്ള സാദ്ധ്യതകൾ മലയാളം യൂണിക്കോഡിലെ എണ്ണമറ്റ സ്ലോട്ടുകൾ തുറന്നിട്ടു. MISIS-നു വേണ്ടിയുണ്ടാക്കിയ ‘മീര’യുടെ orthography-യേയും പൊതുഘടകീകരണ ഘടനയേയും പിന്നീടുണ്ടായ എല്ലാ ഫോണ്ടുകളിലും ഉപേക്ഷിക്കുകയും ചെയ്തു.

എന്നിട്ടും എന്തുകൊണ്ടാണു് MS കാർത്തികയും അഞ്ജലിയുമൊക്കെ ഘടകീകരണരൂപകല്പനയെ ആശ്രയിച്ചത്? രണ്ടു കാരണങ്ങൾ കണ്ടെത്താം.

  • ഘടകീകരണത്തെ ആശ്രയിച്ചാൽ ഫോണ്ടിന്റെ രൂപകല്പനയിൽ സമയക്കുറവു ലാഭിക്കാം (ഘടകങ്ങൾ കണ്ടെത്താനും പിന്നീട് അവയെ സൂക്ഷ്മമായി സംയോജിപ്പിക്കാനും കൂടുതൽ സമയം വേണമെന്നതാണ് വാസ്തവം.)
  • മൈക്രോസോഫ്റ്റിന്റെ specification-നെ[11] ധിക്കരിക്കാനുള്ള ധൈര്യക്കുറവു്. ഇതര ഭാരതീയഭാഷകളിലെ ഫോണ്ടുകളുടെ രൂപകല്പനയിൽനിന്നു് വ്യതിചലിച്ചാൽ മലയാളത്തിന്റെ സംയുക്താക്ഷരങ്ങൾക്കു് എന്തെങ്കിലും തകരാറുകൾ സംഭവിക്കുമോ, എല്ലാവരും പിന്തുടരുന്ന രീതിശാസ്ത്രത്തിൽ നിന്നുള്ള വ്യതിയാനം സ്റ്റാൻഡേർഡൈസേഷനെ ബാധിക്കുമോ എന്നൊക്കെയുള്ള ആശങ്കകൾ സ്വാഭാവികം.
  • ലിപിസഞ്ചയം സമസ്ത അക്ഷരങ്ങളും ഉൾക്കൊള്ളുന്നില്ലെങ്കിൽ (non-exhaustive) പുത്തൻ അക്ഷരങ്ങൾ വരുന്ന മുറയ്ക്ക് സ്വയമുണ്ടാകാനുള്ള ശേഷി (on-the-fly/automatic) ഘടകീകരണത്തിലുടെ കിട്ടുമല്ലൊ എന്ന പ്രതീക്ഷ.

ഘടകീകരണ സമ്പ്രദായം ഒറ്റനോട്ടത്തിൽ എളുപ്പമെന്നു് തോന്നാമെങ്കിലും പലന്യൂനതകളും അതിനുണ്ടു്.

  • ഘടകങ്ങൾ തമ്മിൽ text rendering-ൽ കൂട്ടിയോജിപ്പിക്കുന്നതിനു് വിദഗ്ദ്ധമായ kerning pairs ഉണ്ടാക്കേണ്ടതായിട്ടുണ്ടു്.
  • സംയോജനങ്ങൾ പാടില്ലാത്തവയെ കണ്ടുപിടിക്കാനും ഗ്രൂപ്പ് ചെയ്യാനും തടുത്തുനിറുത്തുവാനും എത്ര എളുപ്പമല്ല. അഞ്ജലി ഉല്പാദിപ്പിച്ച ചില കൂട്ടക്ഷരങ്ങൾ നോക്കുക.
  • Pre-base, post-base ഗ്ലിഫുകൾ യോജിക്കുമ്പോഴുണ്ടാകുന്ന ചേർച്ചക്കുറവു് നികത്താൻ base glyph-കളുടെ സ്വാഭാവിക വക്രങ്ങളെ ചിലപ്പോൾ മാറ്റേണ്ടതായി വരാം. ഒരു ഭാഷയുടെ സ്വാഭാവിക രൂപങ്ങളെ/കാലിഗ്രാഫിൿ സൗന്ദര്യങ്ങളെ ഒത്തുതീർപ്പാക്കാൻ ധാരാളം ഒത്തുതീർപ്പുകൾ (compromises) ഘടകീകരണ-പുനഃസംയോജന പ്രക്രിയയിൽ സംഭവിക്കുന്നു.

ഇത്തരം കാരണങ്ങളാൽ രചന ഫോണ്ടിന്റെ ആദ്യരൂപകല്പനയിൽ തന്നെ (1999, ആസ്കി) ഘടകീകരണ രീതിശാസ്ത്രത്തെ തീർത്തും തള്ളിക്കളഞ്ഞു. മേൽപ്പറഞ്ഞവ കൂടാതെ രചനയിലേക്ക് വരുമ്പോൾ സവിശേഷ കാരണങ്ങൾ ഇവയാണു്.

  • സമഗ്രലിപിസഞ്ചയം രചന അവതരിപ്പിക്കുന്നതിലൂടെ മലയാളത്തിന്റെ സാദ്ധ്യമായ കൂട്ടക്ഷരങ്ങൾ കണ്ടെത്തി കഴിഞ്ഞിരുന്നു. അവയിലില്ലാത്ത അക്ഷരങ്ങൾ കണ്ടെത്താനുള്ള സംഭവ്യത ഏറ്റവും കുറവാണു്. അഥവാ കണ്ടെത്തിയാൽ അവ ഒരൊറ്റ ഗ്ലിഫായി രൂപകല്പന ചെയ്ത് ലിപി സഞ്ചയത്തിൽ കൂട്ടിച്ചേർക്കാവുന്നതേയുള്ളൂ.
  • ഒരൊറ്റ ഗ്ലിഫായി രൂപകല്പന ചെയ്യുമ്പോഴാണു് ഒരോ അക്ഷരത്തിന്റെയും Composition, Balance, Footing, Weight എന്നിവ പരിപൂർണ്ണതയിലെത്തൂ. [  ø] ഒരു പൊതു below-base ആയി കണക്കാക്കിയാൽ [ക്ന]-യും [സ്ന]-യും ഉല്പാദിപ്പിക്കാവുന്നതേയുള്ളൂ. പക്ഷെ []-യുടെ വീതിയുമായി പൊരുത്തമില്ലാത്ത [  ø] എന്ന below-base [ക്ന] എന്ന അക്ഷരത്തിന്റെ സൗന്ദര്യത്തെ കെടുത്തിക്കളയുന്നു. []-യുടേയും []-യുടേയും അടിയിൽ [  ø]-യ്ക്ക് ഇതത്ര സംഭവിക്കുന്നില്ല. []-യുടേയും []-യുടേയും അടിഭാഗം [  ø]-യുമായി ചേർന്നുപോകാൻ vertical kerning അതിസൂക്ഷ്മമായി ശ്രദ്ധിക്കേണ്ടിയിരിക്കുന്നു. ഇത് ഒറ്റയ്ക്കൊറ്റക്കുള്ള ഗ്ലിഫുകളിൽ സാധിച്ചെടുക്കാൻ എളുപ്പമാണ്. കൂടുതൽ കൃത്യതയും കൈവരിക്കാം.
  • ഒരു അക്ഷരത്തിന്റെ ദൃശ്യപൂർണ്ണത സാക്ഷാൽകരിക്കണമെങ്കിൽ അതു് അതായിട്ടു തന്നെ ഒരു single entity ആയി കാണണം എന്നതു് രചനയുടെ സമഗ്രതയുടെ ആവിഷ്കാരം കൂടിയായിരുന്നു. വേറിട്ട ഘടകങ്ങൾ വേണ്ടാത്ത അക്ഷരങ്ങൾ ഉല്പാദിപ്പിച്ചു് സമഗ്രതയെ തകർക്കുമെന്നു് ആദ്യം മുതലേ രചന തിരിച്ചറിഞ്ഞു. അന്നു് നിലവിലുണ്ടായിരുന്ന ആയിരക്കണക്കിനു് ഇന്ത്യൻ ആസ്കി ഫോണ്ടുകളുടെ ഘടകീകരണഘടനയും പിന്നീടു് അതിനെ അതേപടി പകർത്തിയ യൂണികോഡ് ഫോണ്ടുകളും രചനയ്ക്കു് പ്രലോഭനങ്ങൾ തീർത്തില്ല.
  • റോമൻ ഫോണ്ടുകളുടെ യൂണികോഡിനു മുമ്പുള്ള extended character set (ISO 8859) ഫോണ്ടുകൾ രചനയുടെ വീക്ഷണത്തെ ബലപ്പെടുത്തി. അവയിലെ accented character set-ഉം diacritical character set-ഉം നിർമ്മിക്കാൻ വളരെ കുറച്ചു രൂപങ്ങളേ (above-base forms) ആവശ്യമുണ്ടായിരുനുള്ളൂ — [Ø Ù Ú Û] എന്നിവ.

എന്നിട്ടും അക്ഷരങ്ങളോരോന്നും അഖണ്ഡമായി രൂപകല്പന ചെയ്യാനിടയാക്കിയതു് kerning കൊണ്ടു് ഒരിക്കലും പ്രാപ്യമല്ലാത്ത Composition-ഉം Balancing-ഉം കൈവരിക്കാനാണു്.

[Ý Ý Þ ß] [à á â ã]
[ä å æ ç] [è é ê ë]

റോമൻ ഫോണ്ടുകളുടെ രൂപകല്പന രചനയുടെ കാഴ്ചപ്പാടിനു് ബലം നല്കി.

  • അതുകൊണ്ടു് രചനയിലെ എല്ലാ സംയുക്താക്ഷരങ്ങളും ‘അഖണ്ഡ് ’ എന്ന നിലയ്ക് ഒരൊറ്റ രൂപത്തിൽ മാത്രം രൂപല്പന ചെയ്യാമെന്ന ഉറച്ച തീരുമാനത്തിലെത്തുകയും ആസ്കി രചന 1999-ൽ പ്രകാശനം ചെയ്യുകയും ചെയ്തു.
  • 2005-ൽ രചനയുടെ യൂണികോഡ് ഫോണ്ടു് രൂപകല്പന ചെയ്തപ്പോൾ ആസ്കി രചനയിലെ ആറു് ഫോണ്ടുകളിലായി (RC1, RC2, RC3, RC4, RC5, RC6) വ്യാപിച്ചു കിടക്കുന്ന ഗ്ലിഫുകളെ അതേപടി ക്രമമായി യൂണികോഡ് സ്ലോട്ടുകളിൽ നിരത്തിവെക്കുകയാണു് ചെയ്തതു്. രചന എഡിറ്ററിൽ കൂട്ടക്ഷരങ്ങൾ ഉണ്ടാക്കാനായി ഉപയോഗിച്ച combination file-നു സമാനമായി യൂണികോഡ് രചനയുടെ featuring-ഉം നിർവ്വഹിച്ചു. തെറ്റുകളും സന്ദേഹങ്ങളും ഒഴിവാക്കാനും ഘടകങ്ങളേയും സംയുക്താക്ഷരങ്ങളേയും കൃത്യതയോടെ പ്രത്യക്ഷവൽക്കരിക്കാനുമാണു് ഇന്നും എല്ലാ SMC ഫോണ്ടുകളിലും പിന്തുടരുന്ന glyph notation (naming convention) ആവിഷ്കരിച്ചതു്. (ഈയൊരു രീതിശാസ്ത്രം എല്ലാ ഭാരതീയ ഭാഷകളിലെ ഫോണ്ടുകൾക്കും മാതൃകയാക്കാവുന്നതാണു്. ‘മീര ഇനിമൈ’ എന്ന തമിഴ് ഫോണ്ടിൽ ഇതാണു് അനുവർത്തിച്ചിട്ടുള്ളതു്.)

സമഗ്രതയ്ക്കു് ഇളക്കം തട്ടുന്നു

1999 മുതൽ രചന മുറുകെപ്പിടിച്ച അക്ഷരങ്ങളുടെ സമഗ്രതയും ഗ്ലിഫുകളുടെ അഖണ്ഡതയും യൂണികോഡിന്റെ വരവോടെ ഇളക്കം തട്ടാൻ തുടങ്ങി. ആദ്യം പ്രത്യക്ഷപ്പെട്ടതു് [>] എന്ന below-base രൂപമാണു്. []-കാരത്തിന്റെ സാദ്ധ്യമായ എല്ലാ രൂപങ്ങളും രചനയിൽ ഉണ്ടെന്നിരിക്കെ [>] തീർത്തും അപ്രസക്തമായിരുന്നു. അതാകട്ടെ അസ്പഷ്ടമായ പല കൂട്ടക്ഷരങ്ങളും ഉണ്ടാക്കി — [ള്ല], [ഴ്ല], [Ì].

പിന്നീടു് രചനയിലെ vertical conjunct-കളിൽ സംഭവിക്കാൻ പാടില്ലാത്ത താഴക്ഷരങ്ങളായി അടിസ്ഥാന അക്ഷരങ്ങൾ പ്രത്യക്ഷപ്പെടാൻ തുടങ്ങി. രചനയുടെ സമഗ്രത തീർത്തും തകരാറിലായി. 1970-ലെ ലിപി പരിഷ്കരണവും 1990-കളിൽ വ്യത്യസ്ത മാപ്പിംഗുകളിലുമുള്ള അനേകം ആസ്കി ഡിറ്റിപി ഫോണ്ടുകളും മലയാളത്തിന്റെ അദ്ധ്യയനത്തിൽ ഉണ്ടാക്കിയെടുത്ത ‘തോന്ന്യാക്ഷരങ്ങൾ’ രചനയിലും വ്യാപകമായി. ഇത്തരം അസംഭവ്യമായ കൂട്ടക്ഷരങ്ങളുടെ തള്ളിക്കയറ്റത്തിനു കാരണം രചനയുടെ സമഗ്രതയെക്കുറിച്ചുള്ള അജ്ഞതയാകാം.

ഇന്നു് പ്രചാരത്തിലില്ലാത്തതും പിന്നീട് ഉപേക്ഷിക്കപ്പെട്ടതുമായ അനേകം കൂട്ടക്ഷരങ്ങൾ ഭാഷയിൽ ഇതിനു മുമ്പും സംഭവിച്ചിട്ടുണ്ടു്. എഴുപത്തഞ്ചോളം കൂട്ടക്ഷരങ്ങൾ 1920-ൽ ടൈപ്പ്സെറ്റു ചെയ്ത സത്യവേദപുസ്തകത്തിൽ (ബൈബിൾ) കാണുന്നുണ്ടു്.

¬­ (മ¬­³യാസ്), ² (മി²@ർ), ® (നെബൂഖ´®ശർ), ¯ (ബേ´¯ബ) എന്നീ vertical conjunct-കൾ.
അവയിൽ ഏറ്റവും വിചിത്രമായതു് °-യാണു് — വര°, മെരു°.

ഗുണ്ടർട്ടിന്റെ Malayalam Grammar Book-ൽ[12] ഴ്ല പോലെ അക്ഷരങ്ങളും കാണാം. കാലാന്തരത്തിൽ ഇവയൊക്കെ മലയാളത്തിൽനിന്നും അപ്രത്യക്ഷമായി. ചില horozontal conjunct-കളും അപ്രത്യക്ഷമായവയിൽപ്പെടുന്നു.

r (ഹഗ്ഗിr@ഗ്, ഗു´r@ദെക്ക്)
m n (മmലം, പെnട്ടി)

തലശ്ശേരിയിൽ നിന്നും ഇറങ്ങിയ ബാസൽ മിഷന്റെ ഗ്രന്ഥങ്ങളിലാണു് ഇവ അധികമായി കാണുന്നതു്. ലിത്തോഗ്രാഫിൿ പ്രസ്സുകളാണു് ഇത്തരം കൂട്ടക്ഷരണങ്ങളുടെ സമൃദ്ധിയ്ക്കു കാരണമായിത്തീർന്നിട്ടുണ്ടാവുക. കൈകൊണ്ടു് സൂക്ഷ്മമായി അക്ഷരങ്ങൾ വരച്ചുണ്ടാക്കാൻ ലിത്തോഗ്രാഫിക്കിനു് കഴിയുമായിരുന്നു. പിന്നീടുള്ള ദശകങ്ങളിൽ സെമറ്റിക് സർവ്വനാമങ്ങൾക്കായുണ്ടാക്കിയ കൂട്ടക്ഷരങ്ങൾ ഒന്നൊന്നായി അപ്രത്യക്ഷമായി. അവ ചന്ദ്രക്കലയിട്ടു് പിരിച്ചെഴുതുന്ന രീതി പ്രചാരത്തിലായി.

ആര്യ-ദ്രാവിഡ സ്റ്റോക്കിൽപ്പെട്ട പദങ്ങൾക്കു വേണ്ടിയാണു് മലയാളത്തിന്റെ കൂട്ടക്ഷരങ്ങൾ രൂപംകൊണ്ടതു്. നമ്മുടെ ഭാഷാസമൂഹത്തിന്റെ തനതു ശബ്ദങ്ങളുടെ ദൃശ്യാവിഷ്കാരമാണു് അതിലൂടെ സാക്ഷാൽകരിച്ചതു്. (± എന്നതു് ഷ±-ത്തിൽ ഉപയോഗിക്കുന്നു. ആംഗലേയ പദമായ judge എഴുതേണ്ടതു് ചന്ദ്രക്കലയിട്ടു പിരിച്ചാണു് — ജഡ്ജി. പല വൈദേശിക പദങ്ങളും ഉപയോഗത്തിന്റെ ആധിക്യം നിമിത്തം മലയാളമായിത്തീർന്നിട്ടുണ്ടു് — ബസ്, പെൻസിൽ, സ്വിച്ച്, … അങ്ങനെ പരിഗണിക്കുമ്പോൾ ജ±µ-യും ജസ്റ്റിസ്-ഉം ചന്ദ്രക്കലയിട്ടു പിരിക്കാതെ കൂട്ടക്ഷരമായി ഉപയോഗിക്കുന്നതും ശരിയായി വരുന്നു.

കൂട്ടക്ഷരങ്ങൾ ഉണ്ടാക്കുന്ന പ്രവണത, പ്രത്യേകിച്ചു് vertical conjuncts ചില പ്രത്യേക കാലയളവിൽ ലോഹ അച്ചുകളിൽ നിലനിന്നിരുന്നെങ്കിലും ഡിജിറ്റൽ ഫോണ്ടുകളുടെ കാലത്താണു് അവ അധികരിക്കാൻ തുടങ്ങിയതു്. രചന ആദ്യം മുതലേ ഇതിനെ സമർത്ഥമായി പ്രതിരോധിച്ചെങ്കിലും പിന്നീടു് സമഗ്രതയെത്തന്നെ അപ്രസക്തമാക്കുന്ന തരത്തിൽ അതിന്റെ പ്രയോഗം വർദ്ധിക്കുകയും അസംഭ്യവതകളുടെ അക്ഷരങ്ങളാൽ തനതു മലയാളം നിറയുകയും ചെയ്തു. അപ്രവചനീയമായ അക്ഷരങ്ങളുടെ ആധിക്യം നിമിത്തം പാഠപുസ്തകങ്ങൾ ടൈപ്പ്സെറ്റു് ചെയ്യാൻ രചന അസമർത്ഥമാണെന്നുവരെ SCERT-യിലെ അദ്ധ്യാപക സുഹൃത്തുക്കൾ ഉന്നയിച്ചു. “ഇത്തരം ലംബസംയുക്തകങ്ങൾ ഉണ്ടാവുന്നതു് അത്രയ്ക്കു് അപകടകാരികളല്ല, അവയെ വേണ്ടാത്തിടത്തു് ZWNJ[13] ഉപയോഗിച്ചു് വേർപെടുത്താവുന്നതേയുള്ളൂ” എന്നൊരു വാദഗതി നിലവിലുണ്ടു്. മലയാളത്തിൽ ഇല്ലാത്ത അക്ഷരങ്ങൾ ഉണ്ടാക്കിയിട്ടു് പിന്നെ അതിനെ ഇല്ലാതാക്കുന്നതിനു പകരം, ഉണ്ടാക്കാതിരിക്കുന്നതല്ലെ ശാസ്ത്രീയം? എത്ര ശ്രദ്ധിച്ചാലും ഡാറ്റ എൻട്രിയിലും പ്രൂഫ് വായനയിലും ഇത്തരം ‘അസംഭവ്യകൂട്ടക്ഷരങ്ങൾ’ ഒഴിവാക്കാൻ പ്രയാസമേറി വരുന്നു. ‘ജനയുഗം’ സ്ക്രൈബസ് പ്രോജക്റ്റിൽ ഇതിന്റെ ആധിക്യം ഇല്ലാതാക്കാനായി ഫ്രീക്കൻസ് എന്ന എഡിറ്ററിൽ ഇവയെ ZWNJ ഉപയോഗിച്ചു് പിരിച്ചു് ‘ശുദ്ധിവരുത്താൻ’ പ്രത്യേകം പ്രോഗ്രാം ചെയ്യുകയുണ്ടായി.

ZWNJ യൂണികോഡ് മലയാളത്തിൽ നിന്നും തീർത്തും ഒഴിവാക്കാൻ നിവൃത്തിയില്ലെന്നും കാണേണ്ടതുണ്ടു്. [റഹ്‌‌മാൻ] എന്നതു് [ബ്രഹ്മം] പോലെ ആകാതിരിക്കാൻ ZWNJ ഉപയോഗിക്കുക തന്നെ വേണം. ഇതു് തമിഴ്നാടു് (തമിഴ്‌‌നാടു്), പേ´eക്കർ (പേജ്‌മേക്കർ) എന്നിങ്ങനെ അപൂർവ്വം ഇടങ്ങളിൽ സംഭവിക്കുന്നു. രചന വിഭാവനം ചെയ്ത vertical conjuct-കൾ മാത്രമുള്ളപ്പോൾ ZWNJ-ന്റെ ഉപയോഗം പരമാവധി കുറയുന്നു.

വേണ്ടാത്ത vertical conjuct-കളെ ഉല്പാദിപ്പിക്കാനുള്ള അനൗചിത്യം horizontal conjuct-കളുടെ കാര്യത്തിൽ അധികമുണ്ടായില്ല എന്നതു് ശ്രദ്ധേയമാണു്. തിരശ്ചീനത തുടർച്ചയായ വക്രങ്ങളിൽ സംഭവിക്കുന്നതിനാൽ ഘടകീകരണം എളുപ്പമല്ലാത്തതാകാം അവയെ തൊടുന്നതിൽനിന്നും ഡിസൈനർമാരെ അകറ്റി നിറുത്തുന്നത്. ലംബസംയുക്തകങ്ങളിൽ ‘താഴക്ഷരങ്ങൾ’ ‘മേലക്ഷര’ങ്ങളുമായി വേറിട്ടു നില്ക്കുന്നതിനാൽ അവയുടെ ഘടന അയഞ്ഞതായി തോന്നാനിടയാക്കിയിരിക്കണം. 400 വർഷത്തെ കയ്യെഴുത്തിന്റെയും 150 വർഷത്തെ ലോഹഅച്ചുകളുടെയും orthography സൂക്ഷ്മമായി പിന്തുടർന്ന രചന, പ്രയോഗത്തിൽ നിന്ന് അപ്രത്യക്ഷമായ അക്ഷരങ്ങളുടെ ചരിത്രബോധവും ഉൾക്കൊണ്ടിരുന്നു.

രചനയുടെ ഉപഗണങ്ങളും ഉപരിഗണങ്ങളും (Subset and Superset)

ഒന്നു്
മീര ഫോണ്ടിനു ശേഷം രൂപകല്പനചെയ്ത കേരളീയം, ഉറൂബു്, സുന്ദർ, ടിയെൻജോയ്, ജനയുഗം, ആർസുഗതൻ ഫോണ്ടുകൾ രചനയോ മീരയോപോലെ body text-നു വേണ്ടിയുള്ളതായിരുന്നില്ല. Heading/ornamental font-കളുടെ അഭാവം മുദ്രണത്തിലെ വൈവിദ്ധ്യത്തെ ബാധിക്കാൻ ഇടവരുമെന്നതിന്റെ അടിസ്ഥാനത്തിലാണു് രചനയുടെ കാരക്ടർ സെറ്റിന്റെ ഉപഗണങ്ങൾക്ക് രൂപംകൊടുത്തതു്. പത്രങ്ങൾ, മാസികകൾ, സൈൻബോർഡ്, ഫ്ലക്സുകൾ എന്നിവയിൽ [ഗ്ദ്ധ്രൂ] പോലെയുള്ള അക്ഷരം വരാനുള്ള സാദ്ധ്യത ഇല്ലെന്നുതന്നെ പറയാം. (അഥവാ ഉണ്ടെങ്കിൽ രചനയോ മീരയോ ഉപയോഗിക്കുകയും ചെയ്യാം) ഏകദേശം അറുന്നൂറ്റമ്പതോളം അക്ഷരങ്ങൾ തിരഞ്ഞെടുത്താണു് കേരളീയത്തിന്റെ അക്ഷരസഞ്ചയം ഉണ്ടാക്കിയതു്. [സ്ക്രൂ] പോലെ അടിവശം വല്ലാതെ ഇറങ്ങിക്കിടക്കുന്ന താഴക്ഷരങ്ങൾ, [ഗ്ദ്ധ്രൂ]പോലെ തീരെ സാദ്ധ്യതകളില്ലാത്തവ മുതലായവ ഉപേക്ഷിച്ചാണു് ഈ ഉപഗണം ഉണ്ടാക്കിയതു്. [സ്ക്രൂ] എന്ന അക്ഷരം ഇല്ലെങ്കിലും അവയെ [സ്‌ക്രൂ] എന്നു പിരിച്ചെഴുതാം എന്ന മലയാളത്തിന്റെ സാദ്ധ്യതകൾ കൂടി ഈ ഉപഗണത്തിന്റെ നിർമ്മിതിയിലുണ്ടു്.
ഇത്തരം പിരിച്ചെഴുതൽ കമ്പ്യൂട്ടറൈസ്ഡ് ടൈപ്പ്സെറ്റിംഗ്/ഡിറ്റിപി വരുന്നതിനുമുമ്പു് ഏകദേശം ഒന്നര നൂറ്റാണ്ടു കാലം ലോഹ അച്ചുകൾ ഉപയോഗിച്ചുള്ള ലെറ്റർപ്രസ്സുകളിൽ പ്രയോഗത്തിലുണ്ടായിരുന്നു. ലോഹ ടൈപ്പുകൾ വലിയ വിലകൊടുത്തു വാങ്ങേണ്ടിയിരുന്നതിനാൽ പ്രസ്സുകളുടെ വലിപ്പച്ചെറുപ്പം അക്ഷരങ്ങളുടെ സമൃദ്ധിയെ ബാധിച്ചിരുന്നു. സാമ്പത്തികശേഷിയുള്ളവർ [സ്ക്രൂ] പോലെയുള്ള കൂട്ടക്ഷരങ്ങൾ വാങ്ങുമ്പോൾ മുടക്കുമുതൽ കുറഞ്ഞവർ [ക്രൂ] മാത്രം വാങ്ങി, ആവശ്യം വരുമ്പോൾ [സ്‌ക്രൂ] എന്നു് ലോഹ അച്ചുകൾ നിരത്തി അച്ചടി നിർവ്വഹിച്ചുപോന്നു. [സ്ക്രൂ] വാങ്ങാൻ ശേഷിയുള്ളവർ തന്നെ സ, ക, ക്ര, ക്രൂ എന്നിവയുടെ എണ്ണത്തിന്റെ അത്രയും വാങ്ങിയിരുന്നുമില്ല. ചെറിയ അക്ഷരങ്ങൾ 50 കിലോ വാങ്ങുമ്പോൾ ടൈപ്പിന്റെ വലിപ്പം (point size) കൂടുന്നതിനനുസരിച്ചു് ഹെഡ്ഡിംഗുകൾക്കും മറ്റും ഉപയോഗിക്കാനുള്ള വലിയ അക്ഷരങ്ങൾ ഇരുപത്തഞ്ചോ പത്തോ കിലോ ആക്കി ചുരുക്കിയിരുന്നു. അങ്ങനെ ലോഹഅച്ചുകളുടെ കാലത്തു് പോയിന്റു സൈസുകൾക്കും മുടക്കുമുതലിനും അനുസരിച്ചു് കൂട്ടക്ഷരങ്ങളുടെ ഉപയോഗത്തിൽ പിരിച്ചെഴുതൽ സർവ്വസാധാരണമായിരുന്നു. ഇങ്ങനെ പിരിച്ചെഴുതുമ്പോഴും ലിപിപരിഷ്കരണത്തിൽ പ്രയോഗിച്ച വെട്ടിമുറിക്കൽ അക്ഷരങ്ങളിൽ സംഭവിച്ചുമില്ല. മലയാളത്തിന്റെ ഉപഗണത്തിൽപെട്ട ഡിജിറ്റൽ ഫോണ്ടുകളിൽ കൂട്ടക്ഷരങ്ങളുടെ തിരഞ്ഞെടുക്കൽ ലെറ്റർപ്രസ്സ് കാലത്തെ പ്രയോഗങ്ങളിൽനിന്നും കടംകൊണ്ടവയാണ്. ഒരു പക്ഷെ കേരളീയത്തിലും പിന്നീടു് ഉറൂബ്, സുന്ദർ, ടിയെൻജോയ് മുതലായ അലങ്കാരഫോണ്ടുകളിൽ രൂപപ്പെട്ട reduced character set (Subset) ചില സന്ദർഭങ്ങളിൽ വീണ്ടും ചുരുക്കേണ്ടതായി വരാം — ഭീമാകാരമായ സൈൻബോർഡുകൾക്കായി ഫോണ്ടുകൾ ഡിസൈൻ ചെയ്യുമ്പോൾ വരികൾക്കിയിലെ അകലം (leading) ഏറ്റവും മിനിമത്തിൽ നിറുത്തേണ്ടതുണ്ടു്. കേരളീയം ഉപഗണത്തിലുള്ള [സ്തു‍] ഭീമാകാരമായ സൈൻബോർഡുകളിൽ ഉപേക്ഷിച്ചു് [സ്‌തു‍] ആയി പിരിക്കേണ്ടി വരാം.
രണ്ട്
പ്രത്യേക ആവശ്യങ്ങൾക്കായി ഉപഗണങ്ങൾ രൂപംകൊള്ളുന്നതുപോലെ രചനയിൽ കൂട്ടക്ഷരങ്ങൾ കൂട്ടേണ്ടതായും വരും. ആസ്കി രചനയിൽ ഇത്തരമൊരു സന്ദർഭം വന്നതു് 2002-ൽ സത്യവേദപുസ്തകം (ബൈബിൾ) ടൈപ്പ്സെറ്റു് ചെയ്യുമ്പോഴാണു്. ഏകദേശം എഴുപത്തഞ്ചോളം അക്ഷരങ്ങൾ പുതുതായി ഡിസൈൻ ചെയ്യേണ്ടിവന്നു — ¬, ², ®, ¯, °, r, m, n എന്നിവ കൂടാതെ, {, |, } മുതലായ കുത്തക്ഷരങ്ങളും ഇവയിൽപ്പെടും. മലയാളം അച്ചടിയുടെ ചില പ്രത്യേക കാലഘട്ടത്തിന്റെ പാരമ്പര്യം അതേപടി പുനഃസൃഷ്ടിക്കാൻ അത്തരം അക്ഷരങ്ങൾ സവിശേഷമായി ഡിസൈൻചെയ്തു് കൂട്ടിച്ചേർത്തു് രചനയുടെ ഒരു ഉപരിഗണത്തിന് (Superset) രൂപംകൊടുക്കാവുന്നതാണു്. സമകാലിക പാഠങ്ങൾക്കായുള്ള രചനയുടെ ഒരു standard character set-ഉമായി ഇവ കൂട്ടിക്കുഴയ്ക്കരുതു്. ഇത്തരം കൂട്ടക്ഷരങ്ങൾ ഓരോ കാലഘട്ടത്തിനും പാകത്തിൽ പ്രത്യേകം ഉണ്ടാക്കുന്നതിനുപകരം on-the-fly ഉണ്ടാക്കാനുള്ള പ്രലോഭനങ്ങളിലേക്കു് വഴുതിപ്പോകാനും പാടില്ല.
മലയാളഭാഷയുടെ അക്ഷരരൂപീകരണ പാറ്റേൺ, മലയാളിയുടെ ലാവണ്യബോധം, അഭിരുചി, ശബ്ദവിശേഷങ്ങൾ, എഴുത്തിലും അച്ചടിയിലും ഉപയോഗത്തിലിരുന്ന അക്ഷര ചരിത്രം ഇവയെ മാനിച്ചും, അസാധാരണവും ഗൂഢാത്മകവുമായ യുക്തി (അല്ലെങ്കിൽ യുക്തിഭംഗങ്ങൾ) അംഗീകരിച്ചും, ചിത്രജകുമാർ ആവിഷ്കരിച്ച അക്ഷരസമുച്ചയത്തെ കലർപ്പില്ലാതെ പകർത്തുന്നതിലൂടെ മാത്രമേ രചനയുടെ സമഗ്രത ഡിജിറ്റലായി ആവിഷ്കരിക്കാൻ കഴിയൂ. ഭാഷയിൽ ഇതുവരെ പ്രത്യക്ഷപ്പെടാത്ത/പ്രത്യക്ഷപ്പെടാൻ സാദ്ധ്യതയില്ലാത്ത അക്ഷരങ്ങൾ, ഡിജിറ്റലായി എന്തുംചെയ്യാം എന്ന ഉത്സാഹത്തിൽ രൂപകല്പന ചെയ്യാം എന്ന അവസ്ഥ അക്ഷരങ്ങളുടെ അപ്രവചനീയതയ്ക്കു് ഇടവരുത്തുകയും ലിപിപരിഷ്കരണം ചെയ്ത അതേ ദ്രോഹം മറ്റൊരു തലത്തിൽ ആവർത്തിക്കാനിടവരികയും ചെയ്തിട്ടുണ്ട്. രചനയുടെ വർദ്ധിച്ചുവരുന്ന പ്രാധാന്യത്തെയും പ്രചരണത്തേയും കണക്കിലെടുത്തു് ഇത്തരം പ്രവണതകൾ എന്നെന്നേക്കുമായി അവസാനിപ്പിക്കേണ്ടതാണു്.

ഭാവി പരിഗണനകൾ

  • [ണ്ട്ര] പോലെ അഭംഗി വരുത്തുന്ന അക്ഷരങ്ങൾ ഉപേക്ഷിക്കുക.
  • [«] എന്ന അക്ഷരം ഇല്ലെങ്കിലും ഉപഗണത്തിൽ [സ്ഥൃ]-യും [ത്സ്ഥൃ] യഥാക്രമം [സ്‌«], [ത്സ്‌«] എന്നിങ്ങനെ പ്രകടിപ്പിക്കാനായി [«] കൂട്ടിച്ചേർക്കാം. [¹] ഇല്ലെങ്കിലും [ഞ്ചൃ ശ്ചൃ] എന്നിവയുണ്ടെന്നുള്ളതും ശ്രദ്ധിക്കുക.
  • [Í, Î]-യും അതുപയോഗിക്കുന്ന [സ്റ്റ്ര]-യും ഉപേക്ഷിക്കുക. (ഇതിന്റെ ധർമ്മം മലയാളത്തിൽ [ട്ര]-യും [സ്ട്ര]-യും ഭംഗിയായി നിർവ്വഹിച്ചുകൊള്ളും — സ്ട്രാറ്റജി, സ്ട്രീക്കിംഗ്, സ്ട്രീം, സ്ട്രോക്ക്, … എന്നാൽ [സ്റ്റ] നിലനിറുത്തേണ്ടതുണ്ടു് — സ്റ്റാറ്റിസ്റ്റിക്സ്, സ്റ്റുഡൻസ്, സ്റ്റോക്ക്, …)
  • പുതിയ അക്ഷരങ്ങൾ എപ്പോഴൊക്കെ സമഗ്രലിപിസഞ്ചയത്തിൽ കൂട്ടിച്ചേർക്കാം എന്നതു് കാലം തീരുമാനിക്കേണ്ട പ്രശ്നമാണു്. ഒരു നൂറ്റാണ്ടിൽ അപൂർവ്വം അക്ഷരങ്ങൾക്കേ ഇങ്ങനെയൊരു ഭാഗ്യം കൈവരൂ, ചിലപ്പോൾ ഒട്ടും സംഭവിച്ചില്ലെന്നിരിക്കും. ഉദാഹരണത്തിനു് [e] എന്നൊരക്ഷരം ക്രമാതീതമായി ഉപയോഗിക്കപ്പെടുകയും, മലയാളികൾക്കതു് കൂടെകൂടെ ആവശ്യമായി വരികയും, അതുൾക്കൊള്ളുന്ന പദം [ബസ്]പോലെ, [±µ]പോലെ മലയാളപദമായിത്തീരുകയും ചെയ്യുമ്പോൾ സമഗ്രലിപിസഞ്ചയത്തിൽ അതിനു് ഇടം കൊടുക്കാം. [പേ´eക്കർ] അങ്ങനെ ഉപയോഗിച്ചിരുന്നു. ആ പാക്കേജ് ഡിറ്റിപി-യിൽ നിന്ന് അപ്രത്യക്ഷമാകുന്നതോടെ ആ വാക്കിന്റെ ഉപയോഗം ഇല്ലാതാവുകയാണു്. അതുകൊണ്ടു് [e] എന്ന അക്ഷരം മലയാളത്തിനു് ആവശ്യമില്ലെന്ന് കരുതാം.
  • ആര്യ-ദ്രാവിഡ-ശബ്ദ-അക്ഷര സമുച്ചയങ്ങൾക്കു അപരിചിതമായ ചില അക്ഷരങ്ങൾ മലയാളി ജനസാമാന്യം വ്യാപകമായി ഉപയോഗിക്കുന്നുണ്ടു് — അല്ലാഹു/അള്ളാഹു (ഇതു രണ്ടുമല്ല ഉച്ചാരണവും അക്ഷരങ്ങളും), സംസം, ഫ്രാൻസ്വ, … ഇങ്ങനെ സെമിറ്റിൿ, ലാറ്റിൻ ശബ്ദങ്ങളെ കൃത്യമായി പ്രതിനിധീകരിക്കുന്ന അക്ഷരങ്ങൾ മലയാളത്തിലില്ല. പക്ഷെ ജനതയുടെ വലിയൊരു വിഭാഗത്തിന്റെ ദൈനംദിന ജീവിതത്തിന്റെ ഭാഗവുമാണതു്. ഇത്തരം അക്ഷരങ്ങൾ മലയാളത്തിൽ ഉണ്ടാകേണ്ടതുണ്ടു്. ഖുർആനോടും ബൈബിളിനോടും ബന്ധപ്പെട്ട എഴുത്തുകളിൽ, ചർച്ചകളിൽ, പ്രാർത്ഥനകളിൽ ഈ‌‌ ശബ്ദങ്ങളുടെ സത്യസന്ധമായ ആലേഖനം സാദ്ധ്യമാക്കുന്ന അക്ഷരങ്ങളുടെ രൂപകല്പന നമ്മുടെ ഭാഷാസമൂഹത്തോടു് ചെയ്യാവുന്ന വലിയൊരു നീതിയാണു്. പക്ഷെ ഇത്തരം അക്ഷരങ്ങൾ ഡിസൈൻ ചെയ്യുമ്പോൾ നാം അനുവർത്തിക്കേണ്ട സമീപനം രണ്ടു ഭാഷകളുടേയും രൂപലാവണ്യങ്ങളെയും orthography-യെയും സമഞ്ജസമായി ഇണക്കുന്നതായിരിക്കണം. അത്തരം അക്ഷരങ്ങൾ രചനയുടെ സമഗ്രതയെ വിപുലപ്പെടുത്തുകയും അർത്ഥവത്താക്കുകയും ചെയ്യും.
  • [സ്‌വൃ], [സ്‌വ്ര] എന്നിവയെ പ്രതിനിധീകരിക്കാൻ [¾ ¿] എന്നിവ വളരെ അപൂർവ്വമായെങ്കിലും ഒരു കാലത്ത് ഉപയോഗിച്ചിരുന്നു — സ¾ദ്ധ (ശബ്ദതാരാവലി). ആ സ്വരചിഹ്നങ്ങളെ രചനയുടെ ഉപരിഗണത്തിൽ കൂട്ടിച്ചേർക്കാവുന്നതാണ്.

ഏതേതക്ഷരങ്ങൾ?

കമ്പ്യൂട്ടിംഗിന്റെ വരവോടെ ഏതക്ഷരങ്ങൾ വേണം–വേണ്ട എന്ന ചർച്ചകൾ മറ്റു ഭാഷകളിൽ സജീവമായി നടന്നിട്ടുണ്ടു്. മലയാളത്തിൽ ലിപിപരിഷ്കരണത്തിനു‌ശേഷം എടുത്തു പറയേണ്ട രണ്ടു സന്ദർഭങ്ങൾ കേരള ഭാഷാ ഇൻസ്റ്റിറ്റ്യൂട്ടിന്റെ ‘മലയാളത്തനിമ’യും (1998) രചന അക്ഷരവേദിയുടെ (1999) രംഗപ്രവേശവുമായിരുന്നു. ‘മലയാളത്തനിമ’ അക്ഷരങ്ങളെ ഒന്നടങ്കം വികലമാക്കുന്ന സംരംഭമായിരുന്നെങ്കിൽ, ‘രചന’ ഭാഷയുടെ പൈതൃകത്തേയും മലയാളം കമ്പ്യൂട്ടിംഗിനേയും രക്ഷിച്ചെടുക്കുന്ന പ്രസ്ഥാനമായി മാറി. യൂണികോഡ് കാലത്തു് സ്വന്ത്ര മലയാളം കമ്പ്യൂട്ടിംഗിന്റെ ശ്രമഫലമായി തനതുലിപി മലയാളത്തിന്റെ അക്ഷരങ്ങളായി ശക്തിപ്രാപിക്കുകയും ചെയ്തു.

ഇതിനു വിഘാതമായിത്തീർന്ന അക്ഷരങ്ങൾ ഉപേക്ഷിച്ച് മലയാളത്തിന്റെ സമഗ്രത വീണ്ടെടുക്കേണ്ടത് അത്യാവശ്യമായി തീർന്നിരിക്കുന്നു. രചന അവതരിപ്പിച്ച സമഗ്ര ലിപിസഞ്ചയം മലയാള അക്ഷരങ്ങളുടെ അവസാന വാക്കായി ഉറപ്പിക്കുകയും, പഠനത്തിലും പ്രയോഗത്തിലും പ്രചരിപ്പിക്കുകയും ചെയ്യേണ്ടിയിരിക്കുന്നു. അക്ഷരങ്ങൾക്കു വേണ്ടി സർക്കാർ ഭാഗത്തു നിന്നുള്ള കഴിഞ്ഞ അര നൂറ്റാണ്ടു കാലത്തെ എല്ലാ ഇടപെടലുകളും ഭാഷയുടെ നാശത്തിലേക്കുള്ള വഴികളാണു് തുറന്നിട്ടതെന്നതിനാൽ ഇനിയും വല്ല ലിപിപരിഷ്കരണ ശ്രമങ്ങൾ സർക്കാർ ഭാഗത്തു നിന്നുണ്ടാവുന്നത് ജാഗ്രതയോടെ നിരീക്ഷിക്കേണ്ടതുണ്ട്. ഇരുപതു വർഷങ്ങൾക്കുള്ളിൽ മലയാളം കമ്പ്യൂട്ടിംഗിൽ രചനയ്ക്കുണ്ടായ സ്വീകാര്യത എല്ലാ ലിപിപരിഷ്കരണചിന്തകളേയും പ്രതിരോധിക്കാൻ സമർത്ഥമാണ്. അതുകൊണ്ടുതന്നെ മലയാളലിപിയുടെ സമഗ്രത പൂർവ്വാധികം ശ്രദ്ധയോടെ കാത്തുസംരക്ഷിക്കേണ്ടത് പുതിയ ഫോണ്ടുകൾ രൂപകല്പന ചെയ്യുന്നവരുടേയും, രചനയുടെ പരിപാലകകരുടേയും കടമയാണ്.

  1. ആർ. ചിത്രജകുമാർ, മുതൽപേർ. 1999. രചന അക്ഷര വേദി.
  2. ആർ. ചിത്രജകുമാർ, മുതൽപേർ. എന്താണു് തനതുലിപി.
  3. Government of Kerala. 1971, Malayalam script: adoption of new script for use. https://www.unicode.org/L2/L2008/08039-kerala-order.pdf
  4. മലയാളത്തനിമ.
  5. ബ്രാഹ്മി ലിപി പൊതു സവിശേഷതകൾ: https://en.wikipedia.org/wiki/Brahmic_scripts#Characteristics
  6. കാവ്യ മനോഹർ, രജീഷ് കെ.വി. 2015. രേഫത്തിന്റെ ചിത്രീകരണം. https://blog.smc.org.in/malayalam-rendering-and-fonts-reph-sign-chapter-2/
  7. സ്വതന്ത്ര മലയാളം കംപ്യൂട്ടിങ്. 2008. അറ്റോമിക് ചില്ല് സംവാദം. UTC proposal L2/08-038. https://wiki.smc.org.in/images/2/23/SMC_Unicode_5.1.pdf
  8. എ. ആർ. രാജരാജവര്‍മ്മ. 1917. കേരളപാണിനീയം. അദ്ധ്യായം 1.
  9. മൈക്രോസോഫ്റ്റ്. ഓപ്പണ്‍ടൈപ് സ്പെസിഫിക്കേഷൻ. https://docs.microsoft.com/en-us/typography/script-development/malayalam
  10. യുനെസ്കോ. CDS/ISIS database software. http://www.unesco.org/new/en/communication-and-information/information-society/open-source-and-low-cost-technologies/information-processing-tools/cdsisis-database-software/.
  11. മൈക്രോസോഫ്റ്റ്. ഓപ്പണ്‍ടൈപ് സ്പെസിഫിക്കേഷൻ. https://docs.microsoft.com/en-us/typography/script-development/malayalam
  12. ഹെര്‍മ്മൻ ഗുണ്ടര്‍ട്ട്. 1868. മലയാള ഭാഷാവ്യാകരണം. https://books.google.co.in/books?id=uPGEQAAACAAJ
  13. Zero width non joiner: കൂട്ടക്ഷരങ്ങൾ യോജിക്കാതിരിക്കൻ അവയ്ക്കിടയിൽ ചേര്‍ക്കാവുന്ന യൂണികോഡിലെ ഒരു കോഡ് പോയിന്റ്.