മനുഷ്യ ജീനോം യഥാർത്ഥത്തിൽ പൂർത്തിയാകുമ്പോൾ


ഡോ.പ്രസാദ് അലക്സ്

2021 മെയ് മാസത്തിൽ, ഒരു കൂട്ടം ശാസ്ത്രജ്ഞരുടെ സംഘം യഥാർത്ഥത്തിൽ പൂർണ്ണമായ ആദ്യത്തെ മനുഷ്യ ജീനോം പ്രിപ്രിന്റ് രൂപത്തിൽ പ്രസിദ്ധീകരിച്ചു. മനുഷ്യരാശി ഇന്നേവരെ നടത്തിയിട്ടുള്ള ശാസ്ത്രസംരംഭങ്ങളിൽ  സുപ്രധാനവും അതിശയകരവുമായ മുന്നേറ്റമാണ് സ്വന്തം ‘ജീവന്റെ പുസ്തകം’  വായിച്ചെടുത്തത് അഥവാ  ‘ജനിതകഭൂപടം’ സ്വയം വരച്ചെടുത്തത്.

  ഒരു ജീവിയുടെ സമ്പൂർണ ജനിതകപദാർത്ഥമാണ് ജീനോം (genome).  ജീവി രൂപപ്പെടുന്നതിനും  വളരാനും വികസിപ്പിക്കാനും വേണ്ട ‘നിർദ്ദേശപുസ്തകം’ (complete set of genetic instructions) എന്ന് വിളിക്കാം. ശാസ്ത്രചരിത്രത്തിലെ അനിതരസാധാരണമായ നിമിഷമെന്നാണ് 2000- ൽ മനുഷ്യ ജീനോം പൂർ‌ണ്ണമായി ‘വായിച്ചെടുത്തുവെന്ന’ പ്രഖ്യാപനം വിശേഷിപ്പിക്കപ്പെട്ടത്. യഥാർത്ഥത്തിൽ അന്ന്, മനുഷ്യ ജീനോം പൂർണ്ണമായി വെളിപ്പെട്ടിരുന്നില്ല. പ്രാഥമിക ഡ്രാഫ്റ്റ് മാത്രമായിരുന്നു അത്. അവ്യക്തതയും അപൂർണതയും ധാരാളമുണ്ടായിരുന്നു. 2003 – ൽ മനുഷ്യ ജീനോം വീണ്ടും പൂർത്തിയായാതായി പ്രഖ്യാപനമുണ്ടായി. പക്ഷേ അപ്പോഴും പൂർണ്ണമായിരുന്നില്ലെന്നതാണ് വസ്തുത. പുതുക്കിയ ഡ്രാഫ്റ്റിലും  ജനിതകശ്രേണിയിൽ എട്ട് ശതമാനം കണ്ടെത്താതെ അവശേഷിക്കുന്നുണ്ടായിരുന്നു. അന്നത്തെ സാങ്കേതികവിദ്യ ഉപയോഗിച്ച് ‘വായിച്ചെടുക്കാൻ’ അതീവദുഷ്കരമായ ആവർത്തനസ്വഭാവമുള്ള ശ്രേണീഖണ്ഡങ്ങൾ നിറഞ്ഞ, ഭാഗങ്ങളാണ് വിട്ട് പോയത്.

 

ഇരുപത് വർഷം മുൻപ്  വിട്ടുപോയ ഭാഗങ്ങൾ ഇപ്പോൾ പൂർത്തിയായി.  മനുഷ്യ ജീനോം  സങ്കീർണമായ ഒരു ഭൂവിന്യാസക്രമം പോലെയാണ്.  ജീനുകളുടെയും റെഗുലേറ്ററി സീക്വൻസുകളുടെയും (genes and regulatory sequences) സങ്കീർണ്ണവും വൈവിധ്യപൂർണ്ണവുമായ ഘടനാവിന്യാസമാണ് താരതമ്യത്തിൻറെ അടിസ്ഥാനം. അത് കൊണ്ടാണ് ഹ്യൂമൻ ജീനോം പ്രോജക്ടിന് (Human Genome Project) ജനിതകഭൂപടനിർമാണമെന്ന് പറയാറുള്ളത്. തുടക്കത്തിൽ സൂചിപ്പിച്ച പോലെ, ഒരു ജീവിയുടെ ജനിതകവിവരങ്ങളുടെ സമ്പൂർണ്ണസമാഹാരമാണ്  ജീനോം; ജീവന്റെ പ്രവർത്തനത്തിനുള്ള  അടിസ്ഥാനനിർദ്ദേശങ്ങളുടെ പൂർണശേഖരമാണത്.  ക്രോമോസോമുകൾ (chromosomes) എന്നറിയപ്പെടുന്ന ദൈർഘ്യമേറിയ ഡി.എൻ.എ. തന്മാത്രാശ്രേണികളുടെ കൂട്ടമായാണ് ജീനോമിന്റെ ഘടന. കോശകേന്ദ്രങ്ങളിൽ പ്രോട്ടീനുകളുമായി ചേർന്ന ഡി.എൻ‌.എ.യുടെ സംഘടിത പാക്കേജുകളായാണവ കാണപ്പെടുന്നത്. ‘ജീനുകൾ’ (genes) എന്നാൽ പ്രോട്ടീൻ  നിർമ്മാണത്തിന്റെ കോഡ് വഹിക്കുന്ന (protein encoding regions) ക്രോമസോമിലെ ഭാഗമാണ്. റെഗുലേറ്ററി സീക്വൻസ്  (regulatory sequences) ജീനുകളുടെ പ്രവർത്തനത്തെ നിയന്ത്രിക്കുന്ന ഭാഗങ്ങളാണ്. പക്ഷേ ജനിതകശ്രേണീപഥത്തിലെ കുറെയധികം ഖണ്ഡങ്ങൾ മരുഭൂമിയിലെ വിശാലപാതപോലെ ഏകതാനവും ആവർത്തനസ്വഭാവമുള്ളതുമാണ്.

 

2021 മെയ് മാസത്തിൽ, പുതിയ ഒരു കൂട്ടം ശാസ്ത്രജ്ഞരുടെ സംഘം യഥാർത്ഥത്തിൽ പൂർണ്ണമായ ആദ്യത്തെ മനുഷ്യ ജീനോം പ്രിപ്രിൻറ് രൂപത്തിൽ പുറത്ത് വിട്ടു. 23 മനുഷ്യ ക്രോമസോമുകളിലായി 3.055 ശതകോടി ‘ജനിതക അക്ഷരങ്ങൾ’ (base sequence – ബേസ് സീക്വൻസ്) ക്രമത്തിൽ വായിച്ചെടുത്ത്. ലോകമെമ്പാടുമുള്ള താരതമ്യേന ചെറുപ്പക്കാരായ ഗവേഷകരുടെ സംഘം, 20 വർഷം മുമ്പ് നിന്ന് പോയ ശാസ്‌ത്രദൗത്യം പൂർത്തിയാക്കാൻ ഒത്തുകൂടി. ദുഷ്കരവും അവഗണിക്കപ്പെട്ടതും ആവർത്തനസ്വഭാവമുള്ളതുമായ ഭാഗങ്ങൾ കണ്ടെത്താനുള്ള ശാസ്ത്രീയ രീതികൾ വികസിപ്പിച്ച് കൊണ്ടാണ് ഗവേഷകർ ഇത് സാദ്ധ്യമാക്കിയത്.

വിട്ടുപോയ ഭാഗങ്ങൾ 

ശരീരത്തിലെ എല്ലാ കോശങ്ങളിലും ജീനോമിന്റെ പതിപ്പുകൾ ഉണ്ട്.  മനുഷ്യരിൽ ഇത് ഘടനാപരമായി ഇരുപത്തിമൂന്ന് ജോടി ക്രോമസോമുകളായി  ക്രമീകരിച്ചിരിച്ചിട്ടുണ്ട്. പരസ്പരപൂരകമായ ഇരട്ട ഡി എൻ എ ശ്രേണീ തന്മാത്രയും ഹിസ്റ്റോണുകൾ (histones) എന്ന് വിളിക്കുന്ന പ്രോട്ടീൻ തന്മാത്രകളും കൂടിച്ചേർന്നിരിക്കുന്ന ഒതുക്കമുളള ഘടനായാണ് ക്രോമസോമുകളുടേത്. അതീവ ദൈർഘ്യമേറിയ ഡി.എൻ.എ. ശ്രേണികളിൽ  ജീനുകളും റെഗുലേറ്ററി സീക്വൻസുകളും നോൺ കോഡിംഗ് ഭാഗങ്ങളുമുണ്ട്. ഓരോ ക്രോമസോമിനും ചെറുതും വലുതുമായ രണ്ട് ഭുജങ്ങളുണ്ട് (p and q arms). അവ തമ്മിൽ ചേരുന്ന ഭാഗമാണ് ‘സെൻട്രോമിയർ’ (Centromere) എന്നറിയപ്പെടുന്നത്. സവിശേഷതകളുള്ള ഡി.എൻ.എ. സീക്വൻസുകൾ ഈ ഭാഗത്തിന്റെ പ്രത്യേകതയാണ്. സമാനതകളുള്ള ആയിരക്കണക്കിന് α- സാറ്റലൈറ്റ് സീക്വൻസുകൾ (α- satellite sequences) സെൻട്രോമിയറുകളിൽ ഉൾപ്പെടുന്നു. ഒരു α- സാറ്റലൈറ്റ് സീക്വൻസ് 171-ബേസ്-ജോഡി യൂണിറ്റുകൾ (base pair units) ചേർന്നതാണ്. ക്രോമസോം സ്ഥിരതയും കോശവിഭജനവും ഉറപ്പാക്കുന്നതിൽ ഈ ശ്രേണീഭാഗങ്ങൾക്ക് പ്രധാനപ്പെട്ട പങ്കുണ്ട്.  ക്രോമസോമുകൾ സെൻട്രോമിയറിൻറെ സ്ഥാനമനുസരിച്ച് വിഭജിക്കാറുണ്ട്. ഏതാനും എണ്ണങ്ങളിൽ ഏതാണ്ട് മദ്ധ്യഭാഗത്താണ്. അപ്പോൾ ഇരു ഭുജങ്ങളും തമ്മിൽ വലിയ ദൈർഘ്യവ്യത്യാസമുണ്ടാവില്ല. മറ്റ് ചിലതിൽ ഇരുഭുജങ്ങൾ തമ്മിൽ സാരമായ വ്യത്യാസമുള്ള രീതിയിലാണ്. അഞ്ച് എണ്ണത്തിൽ സെൻട്രോമിയർ ഒരു അറ്റത്തോട് വളരെ അടുത്താണ്. അക്രോസെൻട്രിക് (acrocentric) ക്രോമസോമുകൾ എന്നറിയപ്പെടുന്ന ഇവ  13, 14, 15, 21, 22, എന്നീ ക്രമസംഖ്യകൾ സൂചിപ്പിക്കുന്നവയാണ്. ഇവയുടെ ഹൃസ്വഭുജങ്ങളിൽ പൊതുവേ ജീനുകൾ കുറവാണ്, തന്നെയുമല്ല ആവർത്തനസ്വഭാവമുള്ള ശ്രേണീഖണ്ഡങ്ങൾ നിറഞ്ഞവയുമാണ്.

ആദ്യത്തെ ഡ്രാഫ്റ്റ് ഹ്യൂമൻ ജീനോം പ്രസിദ്ധീകരിച്ച് രണ്ട് പതിറ്റാണ്ട് കഴിഞ്ഞിട്ടും സെൻട്രോമിയർ സീക്വൻസുകളും  മറ്റ് ചില പ്രത്യേകഭാഗങ്ങളും ജീനോം ഭൂപടത്തിലെ വെല്ലുവിളി ഉയർത്തുന്ന വിടവുകളായി തുടർന്നു. ഏതാനും വർഷങ്ങൾക്ക് മുമ്പ് വരെ, അവ സമീപഭാവിയിൽ പൂരിപ്പിക്കാനാവുമെന്ന് പൊതുവേ ഗവേഷകർക്ക്  പ്രതീക്ഷയില്ലായിരുന്നു. സെൻ‌ട്രോമിയറുകൾ‌, മുൻ പറഞ്ഞ ഹ്രസ്വഭുജങ്ങൾ , മറ്റ് തരത്തിൽ ആവർത്തനസ്വഭാവമുള്ള ഭാഗങ്ങൾ എന്നിവടങ്ങളിലുള്ള 238 ദശലക്ഷം അക്ഷരങ്ങ്ങൾ (ബേസ് നിര) ഏതാണ്ട് പൂർണമായി  ശാസ്ത്രജ്ഞരിപ്പോൾ ‘വായിച്ചെടുത്തു’

ഡിഎൻ‌എയുടെ ദീർഘശ്രേണീഖണ്ഡങ്ങൾ, കണ്ണികൾ വിട്ടുപോകാതെ ‘വായിച്ചെടുക്കാൻ’ ശേഷിയുള്ള സാങ്കേതികവിദ്യകളുടെ വികസനമാണ് കാര്യങ്ങൾ മാറ്റിത്തീർത്തത്. അങ്ങനെ ഡി‌എൻ‌എ ശ്രേണികൾ കൃത്യമായി ‘വായിച്ചെടുക്കാനുള്ള’  മെച്ചപ്പെട്ട രീതികളുടെ സഹായത്തോടെ തുടക്കം മുതൽ അവസാനം വരെ മനുഷ്യജീനോം അനാവരണം ചെയ്യാൻ ഗവേഷകർക്ക് കഴിഞ്ഞു. കാലിഫോർണിയ സർവകലാശാലയിലെ  ജനിതകശാസ്ത്രജ്ഞയായ കാരെൻ മിഗ (Karen Miga) യുടെയും  നാഷണൽ ഇൻസ്റ്റിറ്റ്യൂട്ട് ഓഫ് ഹെൽത്തിലെ കമ്പ്യൂട്ടേഷണൽ ജനിതകശാസ്ത്രജ്ഞനായ ആദം ഫിലിപ്പി (Adam M Phillippy) യുടെയും ഇതര ശാസ്ത്രജ്ഞരുടെയും  നേതൃത്വത്തിൽ പ്രവർത്തിക്കുന്ന ഗവേഷകസംഘമാണ് ടെലോമിയർ ടു ടെലോമിയർ (T2T ) കൺസോർഷ്യം. ഓരോ ക്രോമസോമിനും, ഒരറ്റത്തെ  ടെലോമിയറിൽ നിന്ന് (ക്രോമസോം ആരംഭിക്കുകയും അവസാനിക്കുയും ചെയ്യുന്ന ആവർത്തന ശ്രേണീഘടകങ്ങൾ) മറ്റേ അറ്റത്തെ  ടെലോമിയർ വരെയെത്തുന്ന, തുടക്കം മുതൽ ഒടുക്കം വരെയുള്ള (end to end), ജനിതകഭൂപടം (genome map) നിർമ്മിക്കുക എന്ന ലക്ഷ്യത്തോടെ പ്രവർത്തിക്കുന്ന ഗവേഷകരുടെ സംഘമാണ് ടെലോമിയർ ടു ടെലോമിയർ (T2T ) കൺസോർഷ്യം. വിവിധയിടങ്ങളിലെ  ഗവേഷകസ്ഥാപനങ്ങളും വിദഗ്ദ്ധരും കൺസോർഷ്യത്തിൽ ഭാഗഭാക്കുകളാണ്. ‘ബയോ ആർ‌ക്‌സിവ്’ (bioRxiv) എന്ന ജൈവശാസ്ത്രശാഖക്കായുള്ള (biological sciences) ഓപ്പൺ ആക്‌സസ് പ്രീ-പ്രിന്റ് ശേഖരണത്തിൽ (open access pre-print repository) 2021  മെയ് 27 ന് സമ്പൂർണ്ണജീനോം ശ്രേണി ലഭ്യമാക്കി മനുഷ്യജീനോമിന്റെ ആദ്യത്തെ ഡ്രാഫ്റ്റ് സീക്വൻസ് പുറത്ത് വന്നപ്പോൾ മുതൽ നടന്നു വരുന്ന പര്യവേഷണമാണ്  20 വർഷം കൊണ്ട് പൂർത്തിയാവുന്നത്. സമാനഗവേഷകരുടെ അവലോകനം പൂർത്തിയായ ശേഷം പഠനഫലങ്ങൾ പ്രസിദ്ധീകരിക്കുന്നതിനൊപ്പം മാത്രമേ ഔദ്യോഗിക പ്രഖ്യാപനം ഉണ്ടാവൂ എന്നാണ് കാരെൻ മിഗ അറിയിച്ചിരിക്കുന്നത്. ജനിതകശ്രേണിയിലെ പ്രധാനമല്ലാത്ത ചില വിടവുകൾ അടയ്ക്കുന്നു, ശ്രേണികൾ കൃത്യമായി മനസിലാക്കുന്നു എന്നല്ല, നേരെ മറിച്ച് ഗണ്യമായ  ജീവശാസ്ത്രധർമ്മങ്ങൾ, ഇതുവരെ  മറഞ്ഞിരുന്ന ശ്രേണീഖണ്ഡങ്ങൾക്കുണ്ടാവുമെന്നാണ് ഗവേഷകർ കരുതുന്നത്. പക്ഷെ അവയൊക്കെ കണ്ടെത്താൻ, അനേകസാമ്പിളുകളിൽ പ്രസ്തുതഭാഗങ്ങളുടെ ശ്രേണീക്രമം കണ്ടെത്തേണ്ടതുണ്ട്. അവയുടെ വൈവിധ്യവും വ്യതിയാനവും മനസ്സിലാക്കുകയും വേണം.

മദ്ധ്യഭാഗത്തെ ദുഷ്കരശ്രേണികൾ 

2001 ഫെബ്രുവരിവിയിൽ  പ്രസിദ്ധീകരിച്ച  മനുഷ്യ ജീനോമിന്റെ ആദ്യ ഡ്രാഫ്റ്റിൽ മുൻപ് സൂചിപ്പിച്ചപോലെ കുറെ വിടവുകൾ ഉണ്ടായിരുന്നു. ഹ്യൂമൻ ജീനോം പ്രോജക്റ്റിലെ ശാസ്ത്രജ്ഞർ  ക്രോമസോമുകളിലെ ഡിഎൻ‌എയുടെ  ഹ്രസ്വശ്രേണീഖണ്ഡങ്ങൾ  ‘വായിച്ചെടുക്കുകയാണ്’ ചെയ്തത്. അടുത്തടത്ത് വരുന്ന ഹൃസ്വഖണ്ഡങ്ങൾ ഓവർലാപ്പ് ചെയ്യുന്ന രീതിയിലാണ് പര്യവേഷണം ആസൂത്രണം ചെയ്ത് നടപ്പിലാക്കിയത്. ആവർത്തന സ്വഭാവമുള്ള ഭാഗങ്ങളിൽ നിന്നുള്ള ഖണ്ഡങ്ങൾ ഏതാണ്ട് ഒരുപോലെയാണ് എന്നതാണ് പ്രശ്നം. വ്യത്യസ്ത ഖണ്ഡങ്ങൾ ‘ഓവർലാപ്’ ചെയ്യുന്ന ഭാഗങ്ങൾ തിരിച്ചറിയുക ഏതാണ്ട് അസാധ്യമാകുന്നു. കമ്പ്യൂട്ടേഷണൽ അൽ‌ഗോരിതങ്ങൾ ഉപയോഗിച്ച് അവയെ ശരിയായി കൂട്ടിച്ചേർത്തെടുക്കണം.  അത്തരം തുടർച്ചയായ ശ്രേണിയെ ജനിതകശാസ്ത്രജ്ഞർ  ‘കോണ്ടിഗ്’ (contig) എന്നാണ് വിളിക്കുന്നത്. ഒരോ ക്രോമസോമിനെയും  ഓരോ ‘കോണ്ടിഗ്’ കൊണ്ട് മാത്രം പ്രതിനിധീകരിക്കുന്നതാണ് അതിൻറെ പൂർണമായ ‘ജീനോം മാപ്പ്’ അഥവാ ജനിതകഭൂപടം. പക്ഷേ ആദ്യത്തെ ഡ്രാഫ്റ്റിൽ ഇരുപത്തിമൂന്ന് ജോടി ക്രോമസോമുകളെ പ്രതിനിധീകരിക്കാൻ 1,246  ‘കോണ്ടിഗ്’ ശ്രേണികൾ ഉണ്ടായിരുന്നു. അന്നത്തെ ജനിതകഭൂപടത്തിൽ ധാരാളം വിടവുകൾ ഉണ്ടായിരുന്നെന്ന് വ്യക്തമാണ്. അത് കൊണ്ട് തുടർന്നുള്ള ഗവേഷണം അനുപേക്ഷണീയമായിരുന്നു. അത്തരമൊരു സംരംഭമാണ് ജീനോം റഫറൻസ് കൺസോർഷ്യം (GRC). അതിൻറെ ഭാഗമായി പ്രവർത്തിക്കുന്ന ശാസ്ത്രജ്ഞർ ജനിതകഭൂപടം വിശദമായി പരിശോധിക്കുകയും സീക്വൻസിംഗ് വിശകലനം ഉപയോഗിച്ച് പിശകുകളും വിടവുകളും ഉള്ള ഭാഗങ്ങൾ തിരിച്ചറിയുകയും തിരുത്തലുകൾ വരുത്തുകയും ചെയ്യുന്നു. പ്രവർത്തനം ഇപ്പോഴും തുടരുന്നു.  ഇങ്ങനെ തുടർഗവേഷണങ്ങളുടെ ഫലമായി, GRCh38 എന്നറിയപ്പെടുന്ന മനുഷ്യ ജീനോമിന്റെ ഏറ്റവും പുതിയ പതിപ്പ് 2013 ലാണ്  പ്രസിദ്ധീകരിച്ചത്. വിടവുകൾ പൂർത്തിയാക്കുന്ന പ്രവർത്തനങ്ങൾ അതിനുശേഷവും തുടർന്നു. എന്നിട്ടും  ‘സെൻട്രോമിയറുകളും’ മറ്റ് ചില സവിശേഷഭാഗങ്ങളും ഉൾപ്പെടെ ജനിതകശ്രേണിയിൽ അഞ്ച് മുതൽ പത്ത് ശതമാനം വരെ കൃത്യമായി ‘വായിച്ചെടുക്കാനാവാതെ’ തുടരുകയായിരുന്നു. പ്രോട്ടീൻ നിർമ്മാണത്തിൽ പങ്കെടുക്കുന്ന പ്രധാനപ്പെട്ട കോശഭാഗമാണ്  റൈബോസോമുകൾ (ribosomes). ആർ‌എൻ‌എയും അനുബന്ധ പ്രോട്ടീനുകളും അടങ്ങിയ ചെറുകണങ്ങളാണിവ. ഇവയിലെ ആർ.എൻ.എ  ശ്രേണികളുടെ  കോഡുവഹിക്കുന്ന ജീനുകൾ വരുന്ന ഭാഗങ്ങൾ ജീനോമിലുണ്ട്. നിരവധി ജീൻ പകർപ്പുകൾ ആവർത്തിച്ചു വരുന്ന, ജീനോമിലെ പൂരിപ്പിക്കേണ്ട ദൈർഘ്യമുള്ള വിടവുകളുടെ, ഭാഗങ്ങളാണിത്. പരിണാമവഴിയിൽ സംഭവിച്ചിട്ടുള്ള ക്രോമസോം പുനക്രമീകരണങ്ങളുടെ ഫലമായി ചില ഖണ്ഡങ്ങൾ ആവർത്തിച്ച് (segmental duplications) വരുന്ന, ‘വായിച്ചെടുക്കാൻ  പ്രയാസമുള്ള’ ഏകതാനമായ വേറേ വലിയ ശ്രേണീഭാഗങ്ങളും ജീനോമിലുണ്ട്.

മുൻപറഞ്ഞ ഭാഗങ്ങളാണ് ജനിതക ഭൂപടം പൂർണമാക്കാനുള്ള  ശ്രമങ്ങൾക്ക് വിഘാതമാമായത്. തുടക്കത്തിൽ ഹൃസ്വശ്രേണീഖണ്ഡങ്ങൾ ‘വായിക്കാൻ’ ഉതകുന്ന സങ്കേതങ്ങൾ ആയിരുന്നു ലഭ്യമായിരുന്നത്. കാലിഫോർണിയയിലെ  ബയോടെക്നോളജി കമ്പനിയായ ഇല്ലുമിന വാണിജ്യവത്ക്കരിച്ചത് പോലെയുള്ള സാങ്കേതികവിദ്യകളാണ് ഇതുവരെയുള്ള ‘സീക്വൻസിംഗ്’ യത്നങ്ങൾക്ക് ഉപയോഗിച്ചത്. ഇല്ല്യൂമിനയുടെ പ്ലാറ്റ്ഫോം വളരെ കൃത്യമായ ഡാറ്റ നൽകുന്നത് തന്നെയാണ്. പക്ഷേ സാധാരണയായി ഏതാണ്ട് നൂറിലധികം ബേസുകൾ വരെയേ ഒരു തവണ വായിച്ചെടുക്കാനാവൂ. ദൈർഘ്യമേറിയ ആവർത്തനങ്ങൾ വരുന്ന ശ്രേണികൾ കൃത്യതയോടെ ‘വായിച്ചെടുക്കാൻ’ ഇത് മതിയാവില്ല. ‘ഓവർലാപ്’ ചെയ്യുന്ന ഹൃസ്വഖണ്ഡങ്ങൾ കൃത്യമായി യോജിപ്പിക്കുക പലപ്പോഴും സാദ്ധ്യമാവില്ല. ജീനുകൾ വരുന്ന ഖണ്ഡങ്ങൾ കൂട്ടിച്ചേർക്കുക എളുപ്പമാണ്. കാരണം വളരെ ചെറിയ ഖണ്ഡങ്ങൾ പോലും ഒരുപോലെ അല്ലാത്തതിനാൽ ‘ഓവർലാപ്’ ചെയ്യുന്ന ഭാഗങ്ങൾ കൃത്യമായി തിരിച്ചറിയാൻ എളുപ്പമാണ്. പക്ഷേ, ജീനുകൾക്കിടയിലെ, ധാരാളം ആവർത്തനങ്ങളുള്ള ഭാഗങ്ങളുടെ കാര്യത്തിൽ  ‘ഓവർലാപ്’ കൃത്യമായി മനസ്സിലാക്കുകയും ഹൃസ്വഖണ്ഡങ്ങൾ ശരിയായി  കൂട്ടിച്ചേർക്കുകയും ചെയ്യുന്നത് വളരെ ദുഷ്കരമാണ്. വ്യത്യസ്‌തഖണ്ഡങ്ങൾ ഓവർ ലാപ് ചെയ്യുന്ന ഭാഗങ്ങൾ തിരിച്ചറിയുക പ്രശ്‌നമാകുന്നു.

 പുതു സാങ്കേതികവിദ്യ

ദീർഘശ്രേണികൾ ‘വായിച്ചെടുക്കാൻ’ പ്രാപ്തമായ  രണ്ട് പുതിയ സാങ്കേതികവിദ്യകൾ  വിടവുകൾ നികത്തി ജിനോം ഭൂപടം പൂർത്തിയാക്കാൻ സഹായിക്കുന്നു. സമാന്തരമായി ലക്ഷക്കണക്കിന് ഡിഎൻഎ ശ്രേണികൾ, ഇമേജിംഗ് സംവിധാനം ഉപയോഗിച്ച്,  ഒരേ സമയം നേരിട്ട് ‘വായിക്കാൻ’ ഉപയുക്തമായ സങ്കേതമാണ്  കാലിഫോർണിയയിലെ ബയോടെക്നോളജി കമ്പനിയായ പസഫിക് ബയോസയൻസസ് (Pacific Biosciences) വികസിപ്പിച്ചത്. ഓരോ ശ്രേണിയിലും ആയിരക്കണക്കിന് ബേസുകളുണ്ടാവാം. അവയൊക്കെ കൃത്യമായി മനസ്സിലാക്കാൻ കഴിയും.യുകെ കമ്പനിയായ ഓക്സ്ഫോർഡ് നാനോപോർ ടെക്നോളജീസ് (Oxford Nanopore Technologies) വികസിപ്പിച്ച് പ്രചാരത്തിലെത്തിച്ചതാണ് കാര്യക്ഷമമായ മറ്റൊരു സങ്കേതം. പ്രോട്ടീൻ നിർമിതമായ നാനോപോറുകളിലൂടെ അഥവാ അതിസൂക്ഷ്മ സുഷിരങ്ങളിലൂടെ ഡിഎൻ‌എ തന്തുക്കൾ കടത്തിവിടുന്നു , ന്യൂക്ലിയോടൈഡുകൾ ചാനലിലൂടെ സഞ്ചരിക്കുമ്പോൾ ഉണ്ടാകുന്ന വൈദ്യുത പ്രവാഹത്തിലെ സൂക്ഷ്മമായ മാറ്റങ്ങൾ അളക്കുന്നതിലൂടെ പതിനായിരക്കണക്കിന് ബസുകൾ ഒന്നിന് പുറകെ ഒന്നായി തിരിച്ചറിയുന്നു.

വിടവുകൾ നികത്തുന്നു 

മുൻപറഞ്ഞ പുതുസാങ്കേതികവിദ്യകൾ ആദ്യമായി പുറത്തിറക്കിയപ്പോൾ (2010 ൽ പസഫിക് ബയോസയൻസസും   2014 ൽ ഓക്സ്ഫോർഡ് നാനോപോറും), അവ വേണ്ട കൃത്യത പുലർത്തിയിരുന്നില്ല. മുൻപ് നിലവിലുണ്ടായിരുന്ന ഇല്ലുമിന 99% ത്തിലധികം കൃത്യത നൽകുമ്പോൾ ഇപ്പറഞ്ഞ പുതുസാങ്കേതികവിദ്യകൾ ഉപയോഗിക്കുമ്പോൾ 15  മുതൽ 30 ശതമാനം വരെ പിശകുകൾ വരുന്നതായിരുന്നു തുടക്കത്തിലേ അനുഭവം. എന്നാൽ കൃത്യത ക്രമാനുഗതമായി മെച്ചപ്പെട്ടു, അതോടൊപ്പം ‘വായിക്കാവുന്ന’ ശ്രേണിയുടെ ദൈർഘ്യവും വർദ്ധിച്ചു. കഴിഞ്ഞ മൂന്നോ നാലോ വർഷങ്ങൾകൊണ്ട് വളരെയധികം മുന്നേറ്റമുണ്ടായി. ഇപ്പോൾ 100000 – ലധികം ബേസുകൾ ദൈർഘ്യ മുള്ള ശ്രേണികൾ കൃത്യമായി വായിക്കാൻ കഴിയും. ഈ ഘട്ടത്തിലാണ് മേരിലാൻഡിലെ  യുഎസ് നാഷണൽ ഹ്യൂമൻ ജീനോം റിസർച്ച് ഇൻസ്റ്റിറ്റ്യൂട്ടിലെ ബയോ ഇൻഫോർമാറ്റിഷ്യൻ (Bio informatician) ആദം ഫിലിപ്പിയും (Adam Phillippy) കാലിഫോർണിയ സർവകലാശാലയിലെ ജീനോമിക്‌സ് ഗവേഷകയായ കാരെൻ മിഗയും കൂട്ടരും ചേർന്ന് T2T കൺസോർഷ്യം സമാരംഭിച്ചത്. 2019 ന്റെ തുടക്കത്തിൽ ആരംഭിച്ച കൺസോർഷ്യം  മനുഷ്യ ക്രോമസോമോരോന്നിൻറെയും  ഒരറ്റം മുതൽ മറ്റേ അറ്റം വരെ കൃത്യമായി ശ്രേണീനിർണയം നടത്താനാണ് ലക്ഷ്യമിട്ടത്. ലോകമെമ്പാടുമുള്ള നൂറിലധികം സീക്വൻസിംഗ്, ജീനോമിക്സ് വിദഗ്‌ദ്ധർ സംരംഭത്തിൽ പങ്കടുക്കുന്നുണ്ട്. അവരിൽ പലരും ഇതിനകം തന്നെ ദീർഘശ്രേണീനിർണയ രീതികളുടെ ശക്തി വെളിവാക്കുന്ന ഗവേഷണങ്ങൾ നടത്തിയിട്ടുണ്ട്.

2018 ൽ പ്രസിദ്ധീകരിച്ച രണ്ട് പ്രധാനപ്രബന്ധങ്ങൾ കൺസോർഷ്യം ഈ രംഗത്ത് നടത്തിയ മുന്നേറ്റം വ്യക്തമാക്കുന്നു. നോട്ടിംഗ്ഹാം സർവകലാശാലയിലെ കമ്പ്യൂട്ടേഷണൽ ബയോളജിസ്റ്റ് മാത്യു ലൂസും (Mathew Loose) സഹപ്രവർത്തകരും  ചേർന്ന് പ്രസിദ്ധീകരിച്ചതാണ് ഒന്ന്. ഓക്സ്ഫോർഡ് നാനോപോർ ഡാറ്റ പൂർണ്ണമായും ആശ്രയിച്ച് മനുഷ്യ ജീനോം ഭൂപടം നിർമ്മിച്ചു . നാനോപോർ രീതിയിൽ ലഭിക്കുന്ന ദീർഘ ശ്രേണീഖണ്ഡങ്ങളിലെ പിശകുകൾ ‘ഇല്ല്യൂമിന’ ഡാറ്റ ഉപയോഗിച്ചു തിരുത്തലുകൾ വരുത്തുന്ന രീതിയായിരുന്നു ആദ്യമൊക്കെ അവലംബിച്ചിരുന്നത്. എന്നാൽ ലൂസും കൂട്ടരും ‘GRCh38’ എന്ന ജിനോം സാമ്പിളിൻറെ 90% നാനോപോർ ഡാറ്റ മാത്രം ഉപയോഗിച്ച് 99.8% കൃത്യതയോടെ വ്യക്തമാക്കി. റഫറൻസ് ആയി ഉപയോഗിച്ച ജീനോമിലെ ഒരു ഡസൻ പ്രധാന വിടവുകൾ നികത്താനും കഴിഞ്ഞു.

രണ്ടാമത്തെ പഠനത്തിൽ, മിഗയും കൂട്ടരും Y ക്രോമസോമിലെ സെൻട്രോമിയറിലേ ശ്രേണി കണ്ടെത്തി. മനുഷ്യജീനോമിലെ ഏറ്റവും ചെറിയ സെൻട്രോമിയറാണ് Y ക്രോമസോമിലേത്. ശ്രേണിയിലെ പിശകുകൾ പെട്ടെന്ന് തിരിച്ചറിയാനും തിരുത്താനും കഴിയുന്ന കൃത്യതയാർന്ന അംഗീകാരയോഗ്യമായ സീക്വൻസുകൾ സൃഷ്ടിക്കുന്നതിനായി അവർ നിരവധി നീണ്ട ശ്രേണീഖണ്ഡ’വായനകൾ’ നടത്തി. അനേക ദീർഘഖണ്ഡങ്ങൾ ‘മാനുവൽ’ (manual) ആയി കൂട്ടിച്ചേർക്കുകയാണ് ചെയ്തത്.

പര്യവേഷണതന്ത്രം 

ആദ്യവിജയങ്ങൾ, കൺസോർഷ്യത്തിൻറെ അന്തിമലക്ഷ്യം നേടാനാവുമെന്ന ശുഭപ്രതീക്ഷ വർദ്ധിപ്പിച്ചു. അതിന് വേണ്ടിയുള്ള പ്രയത്നം അല്പം ലഘൂകരിക്കാൻ ചില മാർഗങ്ങൾ അവലംബിച്ചു. ഒരിനം ട്യൂമറിൽ നിന്ന് ഉത്ഭവിച്ച കോശപരമ്പരയായ (സെൽ ലൈൻ) CHM13 -ൽ ശ്രദ്ധ കേന്ദ്രീകരിച്ചു. ഇവിടെയുണ്ടായ മെച്ചം  ഒരേ പോലെയുള്ള  ക്രോമസോം ജോഡികൾ അടങ്ങിയ ജീനോമാണ്. അസാധാരണമായി ബീജസങ്കലനം ചെയ്ത അണ്ഡത്തിൽ നിന്ന് വികസിപ്പിച്ച   പ്രത്യേക തരം ട്യൂമറിൽ കോശങ്ങളാണ് ഉപയോഗിച്ചത്. മാതാപിതാക്കളിൽ നിന്ന് കിട്ടുന്ന വ്യത്യസ്തതതകളുള്ള ക്രോമസോം പകർപ്പുകൾ ജോഡിയായി വരുന്ന സാധാരണ കോശങ്ങളിലെ ഡിപ്ലോയിഡ് (diploid) ജീനോമുകളുടെ സങ്കീർണ്ണത അങ്ങനെ ഒഴിവാക്കാൻ കഴിഞ്ഞു..

2020  അവസാനത്തിൽ, T2T ശാസ്ത്രജ്ഞർ X, 8 എന്നീ ക്രോമസോമുകളുടെ ആദ്യത്തെ പൂർണജനിതകഭൂപടം പ്രസിദ്ധീകരിച്ചു. ഓക്സ്ഫോർഡ് നാനോപോർ സാങ്കേതികവിദ്യ ഉപയോഗിച്ചാണ് ഇത് സാദ്ധ്യമാക്കിയത്. 70,000 ബേസുകളേക്കാൾ ദൈർഘ്യമുള്ള ഖണ്ഡങ്ങളുടെ ക്രമം ഓരോ ശ്രമത്തിലും ‘വായിച്ചെടുക്കാൻ’ കഴിഞ്ഞു.  ടെലോമിയർ മുതൽ ടെലോമിയർ വരെയുള്ള ക്രോമസോമുകളുടെ നട്ടെല്ല് അതായത് ഡി എൻ എ ശ്രേണി വിടവുകളില്ലാതെ കണ്ടെത്തി. പക്ഷേ ശ്രേണീകൃത്യത അഭികാമ്യമായ തലത്തിൽ എത്തിയെന്ന് പറയാൻ കഴിയില്ല. പ്രശ്നം പരിഹരിക്കുന്നതിനായി ഇല്ല്യൂമിന, പസഫിക് ബയോസയൻസസ് ഹൃസ്വശ്രേണീവായനകൾ  പൂരകമായി ഉപയോഗിച്ച് ഭേദഗതികൾ വരുത്തി.

വാഷിംഗ്ടൺ സർവകലാശാലയിലെ ജീനോം ശാസ്ത്രജ്ഞനായ ഇവാൻ ഐക്ലറും (Evan Eichler) അദ്ദേഹത്തിൻറെ ലാബിലെ പോസ്റ്റ് ഡോക്ടറൽ ഫെലോ ആയ  ഗ്ലെനിസ് ലോഗ്സ്ഡണുമാണ് (Glennis Logsdon) ക്രോമസോം 8-ൻറെ സമ്പൂർണശ്രേണി കണ്ടെത്തിയ പര്യവേഷണത്തിന് ചുക്കാൻ പിടിച്ചത്. പ്രസിദ്ധീകരിക്കപ്പെട്ട പ്രസ്തുതപഠനത്തിൻറെ ഒന്നാം ലേഖകനായ ലോഗ്സ്ഡൺ പറയുന്ന പ്രകാരം ഓരോരോ സാങ്കേതികവിദ്യയ്ക്ക് അതാതിന്റേതായ മേന്മകളും പരിമിതികളുമുണ്ട്. ആഡിനൈൻ (Adenine- A ), ഗ്വാനിൻ (Guanine-G) ബേസുകൾ അധികമായി വരുന്ന ശ്രേണികളിൽ പസഫിക് ബയോസയൻസ് സങ്കേതത്തിന് കൃത്യത കുറയും. അത് പോലെ നാനോപോർ സാങ്കേതികവിദ്യയ്ക്ക്  ഒരേ ന്യൂക്ലിയോടൈഡിൻറെ ആവർത്തനമുള്ള ഭാഗങ്ങളിൽ പിശകുകൾക്ക് സാദ്ധ്യതയേറും. അത് കൊണ്ട് വ്യത്യസ്തസങ്കേതങ്ങളിൽ നിന്ന് ലഭിക്കുന്ന വിവരങ്ങൾ പരസ്പരപൂരകമായി ഉപയോഗിക്കാൻ കഴിയും.

ശ്രേണീഖണ്ഡങ്ങൾ യോജിപ്പിച്ച് പൂർത്തിയാക്കാനും കൂട്ടിച്ചേർക്കുന്നതിന്റെ സാധുത പരിശോധിക്കുന്നതിനും കാലിഫോർണിയ സർവകലാശാലയിലെ ഫിലിപ്പിയും കമ്പ്യൂട്ടേഷണൽ ബയോളജിസ്റ്റായ പാവൽ പെവ്സ്നറും (Pavel Pevzner) മറ്റ് ഗവേഷകരും ചേർന്ന് വികസിപ്പിച്ച  പ്രോഗ്രാം ആണുപയോഗിച്ചത്. ഖണ്ഡങ്ങളുടെ തുടക്കത്തിലോ ഒടുക്കത്തിലോ വരുന്ന 7,000 ബേസ് ദൈർഘ്യം ഒരുപോലെ വരുമ്പോൾ മാത്രമേ അവ കൂട്ടി യോജിപ്പിച്ചിരുന്നുള്ളൂ. നല്ല ജാഗ്രത പുലർത്തിയിരുന്നെന്ന് സാരം. കൂട്ടിയോജിപ്പിച്ചശേഷം പിശകുകൾ ഉണ്ടെങ്കിൽ പരിഹരിക്കുക വളരെ പ്രയാസമാണ്. അതീവ സൂക്ഷ്മത പുലർത്തി 99.9 ശതമാനം കൃത്യതയോടെ ശ്രേണികൾ രൂപീകരിക്കാൻ കഴിഞ്ഞുവെന്ന് ഗവേഷകർ പറയുന്നു.

പൂർത്തീകരണത്തിലേക്ക് 

T2T സമീപനം 8, X ക്രോമസോമുകളുടെ കാര്യത്തിൽ വിജയകരമാണെങ്കിലും, വളരെയധികം സമയവും ക്ലേശകരമായ അധ്വാനവും വേണ്ടതായിരുന്നു. ഈ സമയത്ത് ഉണ്ടായ ഒരു സുപ്രധാന സാങ്കേതിക മുന്നേറ്റം കൺസോർഷ്യത്തിൻറെ ശ്രമങ്ങൾക്ക് ഊർജ്ജം പകർന്നു. പസഫിക് ബയോസയൻസസ് സർക്കുലാർ കൺസൻസസ് സീക്വൻസിംഗ് (സിസിഎസ് – CCS) എന്നറിയപ്പെടുന്ന രീതി വികസിപ്പിച്ചെടുത്തു. അതനുസരിച്ച് വ്യത്യസ്ത ഡിഎൻ‌എ ശ്രേണീഖണ്ഡങ്ങൾ രണ്ടറ്റം കൂട്ടിച്ചേർത്ത  ലൂപ്പുകളായി പരിവർത്തനം ചെയ്യപ്പെടുന്നു, അവ പലതവണ ആവർത്തിച്ച് വായിച്ചെടുക്കാൻ കഴിയുന്നു. ആവർത്തിച്ചുള്ള ‘വായനകൾ’ താരതമ്യം ചെയ്യുന്നതിലൂടെ, യാദൃശ്ചിക പിശകുകൾ ഒഴിവാക്കി കൃത്യമായ ഫലം ലഭിക്കാൻ സഹായിക്കുന്നു.

സി‌സി‌എസിന്റെ (CCS) ആദ്യകാല പതിപ്പുകൾ ഏതാനും ആയിരം ബേസുകൾ ദൈർഘ്യമുള്ള ഖണ്ഡങ്ങളിലാണ് പ്രായോഗികമായത്. അത് കൊണ്ട് ജീനോം വായനയിലെ  ഉപയോഗം പരിമിതമായിരുന്നു. എന്നാൽ 2019 ൽ പ്രക്രീയ നവീകരിച്ചു  തത്‌ഫലമായി 99% കൃത്യതയോടെ 20,000 ലധികം ബേസുകൾ ദൈർഘ്യമുള്ള ഖണ്ഡങ്ങൾ വായിക്കാൻ കഴിയുന്നു. ഉയർന്ന കൃത്യതയുള്ള വായനകളിൽ നിന്ന് സെൻട്രോമിയറുകൾ പൂർണ്ണമായും കൂട്ടിച്ചേർക്കാനാകും. എന്നിരുന്നാലും അത്തരം ഡാറ്റയിൽ പ്രവർത്തിക്കാൻ കഴിയുന്ന കാലിബ്രേറ്റ് ചെയ്ത അൽഗോരിതങ്ങൾ അതിനാവശ്യമാണ്.

ദുഷ്കരമായ ‘ജിഗ്‌സാ പ്രശ്നം’ കൂട്ടിച്ചേർക്കുന്നപോലെയാണ് സെൻ‌ട്രോമിയർ‌ ഖണ്ഡങ്ങൾ യോജിപ്പിക്കുന്നത്. തെളിഞ്ഞ നീലാകാശചിത്രം ഛിന്നഭിന്നമാക്കി ശകലങ്ങൾ കൃത്യമായി ചേർക്കുന്നത്ര ദുഷ്കരം. പക്ഷേ സൂക്ഷ്മമായി നോക്കിയാൽ മങ്ങിയ, മിക്കവാറും അദൃശ്യമായ മേഘങ്ങൾ അവിടവിടെ കാണാം. അവയുടെ തുടർച്ച കണ്ടെത്തിയാൽ ശകലങ്ങൾ കൃത്യമായി യോജിപ്പിക്കാൻ കഴിയും. നവീകരിച്ച രീതി സെൻ‌ട്രോമിയറുകളുടെ കാര്യത്തിൽ സമാനമായി പ്രവർത്തിക്കുന്നു. കൃത്യമായി സൂക്ഷ്മ ശ്രേണി വ്യത്യാസങ്ങൾ തിരിച്ചറിഞ്ഞ് അവ കൂട്ടിയോജിപ്പിച്ച് ജനിതകഭൂപടം സൃഷ്ടിച്ചെടുക്കാൻ കഴിയുന്നു.

കൂടുതൽ കൂടുതൽ ദൈർഘ്യമുള്ള ശ്രേണികൾ കൈകാര്യം ചെയ്യാൻ തുടർച്ചയായി നാനോപോർ സാങ്കേതികവിദ്യ ശേഷി നേടിയതും ഖണ്ഡങ്ങൾ കൂട്ടിയോജിപ്പിക്കുന്ന പുതിയ സമീപനവും ചേർന്ന് കാര്യങ്ങൾ വേഗത്തിലാക്കി. X, 8 ക്രോമസോമുകളുടെ പര്യവേഷണം പൂർത്തിയാക്കാൻ ഒരു വർഷത്തിലധികമെടുത്തു. മറ്റ് ക്രോമസോമുകളുടെ  പര്യവേഷണം പൂർത്തിയാക്കാൻ രണ്ട് മാസമേ വേണ്ടി വന്നുള്ളൂ. ക്രോമസോം -9 ഒഴികെ മറ്റുള്ള സെൻട്രോമിയറുകളെല്ലാം വളരെ കൃത്യമായി അനാവരണം ചെയ്യാൻ കഴിഞ്ഞു. 9-ലെ സെൻട്രോമിയർ 27 ദശലക്ഷം ബസുകൾ ദൈർഘ്യമുണ്ട്. അതുമിപ്പോൾ പൂർത്തിയായി. റൈബോസോമിലെ ആർ എൻ എ യുടെ കോഡ് വഹിക്കുന്ന ജനിതക ശ്രേണിയും മിഗെയും  സംഘവും കണ്ടെത്തിയിട്ടുണ്ട്.  അങ്ങനെ  CHM13 കോശത്തുടർച്ചയുടെ ഡി എൻ എ ശ്രേണി പൂർത്തിയാക്കി.

മുന്നോട്ടുള്ള പ്രയാണം; അനന്തരഫലങ്ങൾ 

ഏതെങ്കിലും ഒരു പ്രത്യേക ജീനോം ആദ്യം മുതൽ അവസാനം വരെ  ശ്രേണി മനസ്സിലാക്കുന്നത് നിർണായകമായ കാൽവയ്പ് തന്നെയാണ്. പക്ഷേ അതിൽ നിന്ന് ഒരുത്തിരിച്ചെടുക്കാവുന്ന സംഗതവും പ്രയോഗക്ഷമവുമായ വിജ്ഞാനത്തിന് പരിമിതിയുണ്ട്. വ്യത്യസ്ത വ്യക്തികളിൽ നിന്നുള്ള മറ്റനവധി ജീനോമുകളുടെ താരതമ്യത്തിലൂടെ  മാത്രമേ അത്തരം അറിവുകളിലേക്ക് കടക്കാനാവൂ.  2020 അവസാനത്തോടെ സമാനലക്ഷ്യങ്ങളോട് പ്രവർത്തിക്കുന്ന സമാന്തര സംരംഭമായ  ഹ്യൂമൻ പാൻജീനോം റഫറൻസ് കൺസോർഷ്യവുമായി (Human Pangenome Reference Consortium -HPRC), T2T ലക്ഷ്യത്തിനായി സഹകരിച്ച് പ്രവർത്തിക്കാൻ തുടങ്ങി. കുറഞ്ഞപക്ഷം 350 വ്യക്തികളിൽ നിന്നുള്ള പൂർണജീനോം ഡാറ്റയെ അടിസ്ഥാനമാക്കി, മനുഷ്യരിലെ ജനിതകവൈവിധ്യത്തിൻറെ വ്യാപ്തി നന്നായി ഉൾക്കൊള്ളുന്ന റഫറൻസ് ജീനോം സൃഷ്ടിക്കുക, അത് നിലവിലുള്ള റഫറൻസ് ജീനോമായ GRCh38 പകരമാകുക എന്ന ഉദ്ദേശത്തോടെയാണ് 2019 ൽ HPRC ആരംഭിക്കുന്നത്. ജീനോം അടിസ്ഥനമാക്കിയ മരുന്നുകളുടെ വികസനത്തിന് ഇത് സഹായകരമാവും.

ടോക്കിയോ സർവകലാശാലയിലെ കമ്പ്യൂട്ടേഷണൽ ബയോളജിസ്റ്റ് ഷിനിചി മോറിഷിതയുടെ (Shinichi Morishita) Shinichi ലാബിലെ റിസർച്ച് അസോസിയേറ്റായ യൂട സുസുകി (Yuta Suzuki) ജപ്പാനിൽ നിന്നും ലോകത്തിന്റെ മറ്റ് ഭാഗങ്ങളിൽ നിന്നുമുള്ള 36 വ്യക്തികളുടെ സെൻട്രോമിയറുകൾ പസഫിക് ബയോസയൻസസ് സീക്വൻസിംഗ് ഉപയോഗിച്ചു വിശകലനം ചെയ്തു. ജപ്പാനിൽ നിന്നുള്ള വ്യത്യസ്ത സാമ്പിളുകളിൽ  സെൻട്രോമിയറുകൾ വ്യത്യസ്തതയുള്ളതായിരുന്നു. അത് കൊണ്ട് ഒരു റഫറൻസ് ജീനോം കൊണ്ടോ അല്ലെങ്കിൽ ഓരോ ജനതയ്‌ക്ക്  ഒരു റഫറൻസ് എന്നത് മാത്രം കൊണ്ടോ മതിയാകില്ല. വൈവിദ്ധ്യം ഉൾക്കൊള്ളുന്ന അനേകം സാമ്പിളുകൾ ചേർന്ന റഫറൻസ് ആണ് വേണ്ടത്. നൂറുകണക്കിന് വ്യത്യസ്ത മനുഷ്യ സെൻട്രോമിയർ സാമ്പിളുകൾ വിശകലനം ചെയ്യാൻ മോറിഷിതയും കൂട്ടരും  പദ്ധതിയിടുന്നു. ഈ ഭാഗങ്ങളിൽ കാണുന്ന ജനിതക വ്യത്യസ്തതകൾ (polymorphism) പല രോഗങ്ങളുണ്ടാകാൻ സാദ്ധ്യത വർദ്ധിപ്പിക്കുന്നു, അഥവാ കാരണമാകുന്നു എന്ന് മോറിഷിത അഭിപ്രയപ്പെടുന്നു. സെൻട്രോമിയർ ശ്രേണികളിൽ ആവർത്തിക്കുന്ന ഭാഗങ്ങളിൽ ചില പ്രശ്നങ്ങൾ ഉളവാകാമെന്നാണ് അർത്ഥമാക്കുന്നത്. ഘടനാപരമായ വ്യത്യസ്തരൂപങ്ങൾ (polymorphs) സെൻട്രോമിയറുകളുടെ സ്ഥിരതയെ പ്രതികൂലമായി ബാധിക്കാമെന്ന് മോറിഷിത അഭിപ്രായപ്പെടുന്നു. റൈബോസിമിലെ ആർ‌എൻ‌എ ജീനുകൾ കൃത്യമായ മനസ്സിലാക്കി കഴിഞ്ഞാൽ കോശങ്ങളിലെ പ്രോട്ടീൻ ഉൽ‌പാദന സംവിധാനങ്ങളുമായി ബന്ധപ്പെട്ട രോഗങ്ങൾ നന്നായി മനസ്സിലാക്കാൻ കഴിയുമെന്ന് ഫിലിപ്പി പ്രത്യാശിക്കുന്നു.

എന്നാൽ ഡിപ്ലോയിഡ് ജീനോമുകളിൽ (ഓരോ ക്രോമസോമിൻറെയും രണ്ട് പതിപ്പുകൾ ഒരു കോശത്തിൽ കാണുന്ന രീതി) T2T രീതി പ്രയോഗിക്കാൻ ഗവേഷകർക്ക് കഴിയണം. ഓരോ ക്രോമോസോമിലെയും  ഡിഎൻ‌എ സ്‌ട്രാൻഡുകൾക്ക് വ്യത്യസ്‌തമായ കോണ്ടിഗുകൾ കണ്ടെത്തി കൃത്യതയോടെ കൂട്ടിച്ചേർക്കാൻ  സഹായിക്കുന്ന ജനിതക ലാൻഡ്‌മാർക്കുകൾ തിരിച്ചറിയാൻ കഴിയണം. ക്രോമസോം 8 -ന്റെ ഡി എൻ എ ശ്രേണി അനാവരണം ചെയ്യുന്ന പഠനത്തിൽ  ലോഗ്സ്ഡൺ, ഐക്ലർ, സഹപ്രവർത്തകർ എന്നിവർ ചിമ്പാൻസികളിൽ നിന്നും മനുഷ്യരിൽ നിന്നും ഡിപ്ലോയിഡ് സെൻട്രോമെറിക് ഭാഗങ്ങൾ മനസ്സിലാക്കാനുള്ള സാധ്യത വിവരിക്കുന്നു. ഒരു ജോഡിയിലെ രണ്ട് ക്രോമസോമുകളും വളരെ ജനിതകപരമായി വ്യത്യസ്തമാകുമ്പോളാണ് പ്രസ്തുത രീതികൾ കൃത്യമായി പ്രയോഗക്ഷമാകുന്നത്. എന്തായാലും ഡിപ്ലോയിഡ് ജീനോമുകളിൽ സെൻട്രോമിയർ പ്രദേശങ്ങൾ പൂർണമായി മനസ്സിലാക്കുന്നതിന് കൂടുതൽ കൃത്യമായ ദൈർഘ്യമുള്ള ‘വായനകൾ’ ആവശ്യമാണ്.

നാനോപോർ സീക്വൻസിംഗ് വിവരങ്ങൾ ഡിഎൻഎ യുലുണ്ടാകുന്ന രാസഭേദഗതിയുടെ (chemical modification) പാറ്റേണുകൾ കണ്ടെത്താൻ ലോഗ്സ്‌ഡണും മറ്റുള്ളവരും ഉപയോഗിച്ചു. ക്രോമസോം പ്രവർത്തനത്തെ സ്വാധീനിക്കാൻ  കഴിയുന്ന മാറ്റങ്ങളാണ് ഇവ. സെൻ‌ട്രോമിയറുകളിലെ  ഡി എൻ എ പൊതുവെ മെത്തിലേഷൻ (methylation) എന്ന രാസഭേദഗതി വന്ന നിലയിൽ ആണ് ഉണ്ടാവുക. പക്ഷേ സെൻ‌ട്രോമിയറുകളിലെ പ്രത്യേക ഭാഗത്ത് മെത്തിലേഷൻ വളരെ കുറഞ്ഞ് കാണപ്പെടുന്നു. ഈ ഭാഗം കോശവിഭജനസമയത്ത് ഡിഎൻ‌എയുടെ തുല്യ വിഭജനം ഉറപ്പ് വരുത്തുന്ന പ്രധാന സെൻ‌ട്രോമിയർ ഘടനയായ കൈനറ്റോകോറിന്റെ (kinetochore) സ്ഥാനം അടയാളപ്പെടുത്തുന്നു. ‘നിർമ്മിത ക്രോമസോമുകൾക്കായി’ (synthetic chromosomes) ഏറ്റവും കുറഞ്ഞ വലിപ്പത്തിൽ  സെൻട്രോമിയറുകൾ രൂപകൽപന ചെയ്യാൻ കണ്ടെത്തലുകൾ ഉപയോഗിക്കുമെന്ന് ലോഗ്സ്‌ഡൺ പ്രതീക്ഷിക്കുന്നു. രോഗപ്രതിരോധവ്യവസ്ഥയിലെ ടി – കോശങ്ങളുടെ (T – cells) ഉപരിതലത്തിലെ വ്യത്യസ്ത ആൻറിബോഡികളുടെയും റിസപ്റ്ററുകളുടെയും കോഡ് വഹിക്കുന്ന വിപുലവും സങ്കീർ‌ണ്ണവുമായ ജീൻ നിരകളുടെ ഡി എൻ എ ശ്രേണി  മനസ്സിലാക്കാനും T2T യുടെ പര്യവേഷണം മൂലം കഴിഞ്ഞു. വളരെയധികം ആവർത്തിച്ചുവരുന്ന ശ്രേണീഖണ്ഡങ്ങളുടെ ആധിക്യം  മൂലം കൂട്ടിച്ചേർത്ത് വായിക്കാൻ പ്രയാസമുള്ള ഭാഗമാണ്. ദുഷ്കരമായ ഭാഗങ്ങൾ അനാവരണം ചെയ്യുന്നത് രോഗബാധകൾക്കും വാക്‌സിനുകൾക്കുമായുള്ള രോഗപ്രതിരോധ പ്രതികരണം മനസ്സിലാക്കാനും  അതുവഴി വാക്‌സിനുകൾക്കുമായുള്ള ശ്രമങ്ങളെയും സഹായിക്കും.

ആവർത്തനസ്വഭാവമുള്ള മറ്റ് ഭാഗങ്ങളെപ്പോലെ സെൻട്രോമിയർ സീക്വൻസുകളുടെ ധർമ്മം ഇതുവരെ പൂർണ്ണമായി മനസ്സിലായിട്ടില്ല. പക്ഷേ അവ കോശവിഭജനത്തിൻറെ ആധാരസ്ഥാനമായാണ് കണക്കാക്കാറുള്ളത്. അപ്പോൾ ഒരു പ്രോട്ടീൻ സ്പിൻഡിൽ (protein spindle) സെൻട്രോമിയറുകളുമായി ബന്ധിക്കുന്നു. വിഭജന ശേഷം  ഓരോ കോശത്തിനും ശരിയായ എണ്ണം ക്രോമസോമുകൾ ലഭിക്കുന്നുണ്ടെന്ന് ഉറപ്പുവരുത്തി വേർതിരിക്കുന്നു. അണ്ഡത്തിലോ ബീജത്തിലോ  ക്രോമസോം സംഖ്യ തെറ്റിയാൽ ഡൗൺ സിൻഡ്രോം, (Down syndrome) ടർണർ സിൻഡ്രോം (Turner syndrome) പോലുള്ള അപാകതകളോടെ  കുഞ്ഞുങ്ങൾ ജനിക്കാം.  മറ്റ് കോശങ്ങളിൽ ഈ പ്രശ്നമുണ്ടാകുമ്പോൾ ശരിയായ എണ്ണത്തിൽ കൂടുതലോ കുറവോ ക്രോമസോമുകൾ ഉള്ള  രക്തകോശങ്ങൾ ഉണ്ടായിത്തീരാം. ക്രോമസോം സംഖ്യയിലെ വ്യത്യാസം വാർദ്ധക്യത്തിൻറെ ലക്ഷണമാണ്. ഉദാഹരണമായി 70 വയസ്സിനു മുകളിൽ പ്രായമുള്ള പുരുഷന്മാർക്ക് രക്തകോശങ്ങളിലെ Y ക്രോമസോമുകൾ നഷ്ടപ്പെടുന്നത് അസാധാരണമല്ല. സമ്പൂർണ്ണ ജീനോമിനൊപ്പം ചേർത്ത പ്രബന്ധങ്ങളിൽ T 2 T കൺസോർഷ്യം ഓക്‌സ്‌ഫോർഡ് നാനോപോർ സാങ്കേതികവിദ്യ ഉപയോഗിച്ച് പ്രോട്ടീൻ സ്പിൻഡിൽ സെൻട്രോമിയറിൽ കൃത്യമായി ചേരുന്നഭാഗം  മാപ്പ് ചെയ്യാൻ അല്ലെങ്കിൽ വായിച്ചെടുക്കാൻ കഴിയും. ആ പ്രദേശങ്ങളിലെ സീക്വൻസുകൾ പരിശോധിക്കുന്നത് ക്രോമസോം അപാകതകളെക്കുറിച്ച്  മനസ്സിലാക്കാൻ കഴിയും.

ക്രോമസോമുകളിലെ ആവർത്തന സമ്പന്നമായ ഹ്രസ്വ ഭുജങ്ങളുടെ ശ്രേണികൾ ഇനിയും അനാവരണം ചെയ്യുന്നത് പുതിയ വിവരങ്ങൾ ആർജിക്കാൻ പ്രാപ്തി നൽകും. ജീനുകൾ പ്രോട്ടീനുകളിലേക്ക് വിവർത്തനം ചെയ്യുന്ന കോശസംവിധാനത്തിൽ അവ പങ്ക് വഹിക്കുന്നുണ്ട്. അവയുടെ ക്രമം അറിയുന്നത് ആ പ്രവർത്തനത്തിൽ കൂടുതൽ വെളിച്ചം വീശും.

ഒരു സമ്പൂർണ്ണ മനുഷ്യ ജീനോം വായിച്ചെടുക്കുന്നത്  ശ്രദ്ധേയമായ ശാസ്ത്രസാങ്കേതിക നേട്ടമാണ്. പക്ഷേ  ഒരു ജീനോം എന്നത് ഒരു സ്നാപ്പ്ഷോട്ട് പോലെയാണ്. ആവർത്തനസ്വഭാവമുള്ള ഭാഗങ്ങൾ വ്യക്തികളിൽ എങ്ങനെ വ്യത്യാസപ്പെട്ടിരിക്കുന്നു, കാലക്രമേണ വ്യക്തികളിലും മനുഷ്യസമൂഹത്തിലും എങ്ങനെ മാറുന്നു എന്നത് കൂടുതൽ പ്രസക്തമാണ്. ക്യാൻസറിൽ എന്ത് മാറ്റമാണ് വരുന്നത്? ഒരു വ്യക്തിയുടെ വളർച്ചാഘട്ടത്തിൽ മാറ്റങ്ങളുണ്ടാകുമോ? മാതാപിതാക്കളെ അപേക്ഷിച്ച് സന്താനങ്ങളിൽ വ്യത്യാസങ്ങളുണ്ടാകുന്നുവോ എന്നതൊക്കെ പ്രസക്തമാണ്.നിലവിൽ, ചികിത്സാസംബന്ധമായ ജീനോം പഠനപരിശ്രമങ്ങൾ മിക്കവാറും അറിയാവുന്ന ജീനുകളിൽ ശ്രദ്ധ കേന്ദ്രീകരിക്കുന്നവയാണ്. ജീനോം വിശകലനത്തിനുള്ള വേഗതയേറിയതും ചെലവ് കുറഞ്ഞതുമായ സമീപനാമാണത്. എന്നാൽ ഈ പുതിയ ‘ജനിതകഭൂപ്രദേശം’ പര്യവേഷണം ചെയ്യാൻ വഴിയൊരുക്കുന്നവർ പ്രതീക്ഷിക്കുന്നത് സമഗ്രമായ ജീനോം വിശകലനങ്ങൾ മാനദണ്ഡമായിത്തീരുമെന്നാണ്. ഒരുപക്ഷേ കൂടുതൽ ചെലവേറിയതാണെങ്കിലും, വൈദ്യശാസ്ത്ര   ജനിതകഗവേഷണപഠനങ്ങളിലെ  സുപ്രധാനഘടകമായി പൂർണ ജീനോം വിശകലനം മാറുമെന്നാണ് അനുമാനം.


അവലംബം 

  1. Sergey Nurk et al, The complete sequence of a human genome, bioRxiv 2021.05.26.445798; doi: https://doi.org/10.1101/2021.05.26.445798
  2. Initial sequencing and analysis of the human genome, International Human Genome Sequencing Consortium, Nature volume 409, pages860–921 (2001)
  3. Jain, M., Koren, S., Miga, K. et al. Nanopore sequencing and assembly of a human genome with ultra-long reads. Nat Biotechnol 36, 338–345 (2018). https://doi.org/10.1038/nbt.4060
  4. Jain, M., Olsen, H., Turner, D. et al. Linear assembly of a human centromere on the Y chromosome. Nat Biotechnol 36, 321–323 (2018). https://doi.org/10.1038/nbt.4109
  5. Miga, K.H., Koren, S., Rhie, A. et al. Telomere-to-telomere assembly of a complete human X chromosome. Nature 585, 79–84 (2020). https://doi.org/10.1038/s41586-020-2547-7
  6. Logsdon, G. A. et al. Preprint at bioRxiv https://doi.org/10.1101/2020.09.08.285395 (2020).
  7. Wenger, A.M., Peluso, P., Rowell, W.J. et al. Accurate circular consensus long-read sequencing improves variant detection and assembly of a human genome. Nat Biotechnol 37, 1155–1162 (2019). https://doi.org/10.1038/s41587-019-0217-9
  8. Wenger, A.M., Peluso, P., Rowell, W.J. et al. Accurate circular consensus long-read sequencing improves variant detection and assembly of a human genome. Nat Biotechnol 37, 1155–1162 (2019). https://doi.org/10.1038/s41587-019-0217-9
  9. Rapid and ongoing evolution of repetitive sequence structures in human centromeres, ProfileYuta Suzuki1, ProfileEugene W. Myers and Shinichi Morishita, Science Advances  11 Dec 2020: Vol. 6, no. 50, eabd9230, DOI: 10.1126/sciadv.abd9230
  10. Michael Eisenstein, Closing in on a complete human genome, Nature, Technology Feature, 22 February 2021
  11. Sarah Zhang, The Human Genome Is Finally! Complete, The Atlantic, June 11, 2021, https://www.theatlantic.com/science/archive/2021/06/the-human-genome-is-finally-complete/619172/

Leave a Reply