Selamat Datang di Blog Saya

Halo pembaca semua, saya harap Anda menikmati apa yang saya ketik. Mudah-mudahan informasi tersebut berguna dan bermanfaat bagi Anda pembaca semuanya.

Salam Kenal ☜☠☞

Jumat, 03 Juli 2020

Pengantar Komputasi Modern : Bioinformatika


Nama : Jourdy Hanson Bintang
Kelas : 4IA18
NPM : 53416772
Pengantar Komputasi Modern


Bio Informatika & Penerapannya

Gambaran umum tentang bioinformatika

Definisi

Bioinformatika, sesuai dengan asal katanya yaitu “bio” dan “informatika”, adalah gabungan antara ilmu biologi dan ilmu teknik informasi (TI). Pada umumnya, Bioinformatika didefenisikan sebagai aplikasi dari alat komputasi dan analisa untuk menangkap dan menginterpretasikan data-data biologi. Ilmu bioinformatika lahir atas insiatif para ahli ilmu komputer berdasarkan artificial intelligence. Mereka berpikir bahwa semua gejala yang ada di alam ini bisa dibuat secara artificial melalui simulasi dari gejala-gejala tersebut.


Bioinformatika adalah aplikasi teknologi komputasi untuk menangani penyimpanan informasi yang berkembang pesat terkait dengan biologi molekuler. Bioinformatika menggabungkan berbagai bidang studi, termasuk ilmu komputer, biologi molekuler, bioteknologi, statistik dan teknik. Ini sangat berguna untuk mengelola dan menganalisis set data yang besar, seperti yang dihasilkan oleh bidang genomik dan proteomik.


Bioinformatika, sebagai disiplin ilmu baru yang muncul, menggabungkan matematika, ilmu informasi, dan biologi dan membantu menjawab pertanyaan biologis. Kata 'bioinformatika' pertama kali digunakan pada tahun 1968 dan definisinya pertama kali diberikan pada tahun 1978. Bioinformatika juga telah disebut sebagai 'biologi komputasi'. Namun, secara ketat, biologi komputasi terutama berkaitan dengan pemodelan sistem biologis. Komponen utama bioinformatika adalah
(1) pengembangan alat dan algoritma perangkat lunak dan
(2) analisis dan interpretasi data biologis dengan menggunakan berbagai alat perangkat lunak dan algoritma tertentu.


Bioinformatika, sesuai dengan asal katanya yaitu “bio” dan “informatika” adalah gabungan antara ilmu biologi dan teknik informasi (TI). Sebagai suatu disiplin ilmu, bioinformatika merupakan kajian yang memadukan disiplin biologi molekul, matematika dan teknik informasi (TI). Bidang ini masih tergolong relatif baru sehingga masih banyak kesalahpahaman mengenai definisinya. Secara umum, bioinformatika dapat digambarkan sebagai segala bentuk penggunaan komputer dalam menangani masalah-masalah biologi. Tetapi dalam prakteknya, definisi yang digunakan lebih bersifat terperinci. Bioinformatika itu sendiri mempunyai pengertian suatu teknologi pengumpulan, penyimpanan, analisis, interpretasi, penyebaran dan aplikasi dari data-data biologi molekul.

Sejarah lahirnya bioinformatika
Istilah bioinformatika mulai dikemukakan pada pertengahan era 1980-an untuk mengacu pada penerapan komputer dalam biologi. Namun demikian, penerapan bidang-bidang dalam bioinformatika (seperti pembuatan basis data dan pengembangan algoritma untuk analisis sekuens biologis) sudah dilakukan sejak tahun 1960-an. Kemajuan teknik biologi molekuler dalam mengungkap sekuens biologis dari protein (sejak awal 1950-an) dan asam nukleat (sejak 1960-an) mengawali perkembangan basis data dan teknik analisis sekuens biologis. Basis data sekuens protein mulai dikembangkan pada tahun 1960-an di Amerika Serikat dan Jerman (pada European Molekular Biology Laboratory). Penemuan teknik sekuensing DNA yang lebih cepat pada pertengahan 1970-an menjadi landasan terjadinya ledakan sejumlah sekuens DNA yang berhasil diungkapkan pada tahun 1980-an dan 1990-an, menjadi salah satu pembuka jalan bagi proyek-proyek pengungkapan genom, meningkatkan kebutuhan akan pengelolaan dan analisis sekuens, dan pada akhirnya lahirlah bioinformatika.





Penerapan Bio Informatika


Bioinformatika dalam Dunia Kedokteran
a. Bioinformatika dalam bidang klinis
Perananan Bioinformatika dalam bidang klinis ini sering juga disebut sebagai informatika klinis (clinical informatics). Aplikasi dari clinical informatics ini adalah berbentuk manajemen data-data klinis dari pasien melalui Electrical Medical Record (EMR) yang dikembangkan oleh Clement J. McDonald dari Indiana University School of Medicine pada tahun 1972. McDonald pertama kali mengaplikasikan EMR pada 33 orang pasien penyakit gula (diabetes). Sekarang EMR ini telah diaplikasikan pada berbagai penyakit. Data yang disimpan meliputi data analisa diagnosa laboratorium, hasil konsultasi dan saran, foto ronsen, ukuran detak jantung, dll. Dengan data ini dokter akan bisa menentukan obat yang sesuai dengan kondisi pasien tertentu. Lebih jauh lagi, dengan dibacanya genom manusia, akan memungkinkan untuk mengetahui penyakit genetik seseorang, sehingga personal care terhadap pasien menjadi lebih akurat.

Sampai saat ini telah diketahui beberapa gen yang berperan dalam penyakit tertentu beserta posisinya pada kromosom. Informasi ini tersedia dan bisa dilihat di home page National Center for Biotechnology Information (NCBI) pada seksi Online Mendelian in Man (OMIM) OMIM adalah search tool untuk gen manusia dan penyakit genetika. Selain berisikan informasi tentang lokasi gen suatu penyakit, OMIM ini juga menyediakan informasi tentang gejala dan penanganan penyakit tersebut beserta sifat genetikanya. Dengan demikian, dokter yang menemukan pasien yang membawa penyakit genetika tertentu bisa mempelajarinya secara detil dengan mengakses home page OMIM ini. Sebagai salah satu contoh, jika ketika ingin melihat tentang kanker payudara, dapat memasukan kata-kata “breast cancer” dan setelah searching akan keluar berbagai jenis kanker payudara. Kalau ingin mengetahui lebih detil tetang salah satu diantaranya, hanya perlu klik dan akan mendapatkan informasi detil mengenai hal tersebut beserta posisi gen penyebabnya di dalam koromosom.


b. Bioinformatika untuk penemuan obat
Usaha penemuan obat biasanya dilakukan dengan penemuan zat/senyawa yang bisa menekan perkembangbiakan suatu agent penyebab penyakit. Karena banyak faktor yang bisa mempengaruhi perkembangbiakan agent tersebut, faktor-faktor itulah yang dijadikan target. Diantara faktor tersebut adalah enzim-enzim yang diperlukan untuk perkembangbiakan suatu agent. Langkah pertama yang dilakukan adalah analisa struktur dan fungsi enzim-enzim tersebut. Kemudian mencari atau mensintesa zat/senyawa yang bisa menekan fungsi dari enzim-enzim tersebut. Penemuan obat yang efektif adalah penemuan senyawa yang berinteraksi dengan asam amino yang berperan untuk aktivitas (active site) dan untuk kestabilan enzim tersebut. Karena itu analisa struktur dan fungsi enzim ini biasanya difokuskan pada analisa asam amino yang berperan untuk aktivitas (active site) dan untuk kestabilan enzim tersebut. Analisa ini dilakukan dengan cara mengganti asam amino tertentu dan menguji efeknya.

Sebelum perkembangan bioinformatika, analisa penggantian asam amino ini dilakukan secara random sehingga memakan waktu yang lama. Dengan adanya Bioinformatika, data-data protein yang sudah dianalisa bebas diakses oleh siapapun, baik data sekuen asam amino-nya seperti yang ada di SWISS-PROT maupun struktur 3D-nya yang tersedia di Protein Data Bank (PDB). Dengan database yang tersedia ini, enzim yang baru ditemukan bisa dibandingkan sekuen asam amino-nya, sehingga bisa diperkirakan asam amino yang berperan untuk active site dan kestabilan enzim tersebut. Hasil perkiraan kemudian diuji di laboratorium. Dengan demikian, akan lebih menghemat waktu dari pada analisa secara random. Walaupun dengan sarana Bioinformatika bisa diperkirakan senyawa yang berinteraksi dan menekan fungsi suatu enzim, hasilnya harus dikonfirmasi melalui eksperiment di laboratorium. Namun dengan Bioinformatika, semua proses ini bisa dilakukan lebih cepat sehingga lebih efesien baik dari segi waktu maupun finansial.


c. Bioinformatika dalam Virologi
Isolasi virus adalah suatu pekerjaan yang tidak mudah. Banyak virus yang tidak bisa dikulturkan, apalagi diisolasi. Virus hepatitis C (HCV), misalnya, sampai saat ini belum ada yang bisa mengkulturkannya, sehingga belum ada yang tahu bentuk morfologi virus ini. Begitu juga virus hepatitis E (HEV) dan kelompok virus yang termasuk ke dalam family Calliciviridae, dimana sampai saat ini belum ditemukan sistem pengkulturannya. Walaupun untuk beberapa virus bisa dikulturkan, tidak semuanya bisa diisolasi dengan mudah. Oleh karena itu, sebelum perkembangan bioinformatika, kita tidak bisa mengidentifikasi dan mengklasifikasikan virus-virus semacam ini.

Dengan kemajuan teknik isolasi DNA/RNA, teknik sekuensing dan ditunjang dengan kemajuan bioinformatika, masalah diatas bisa teratasi. Untuk mengidentifikasi dan mengklasifikasikan virus, isolasi virus tidak lagi menjadi suatu hal yang mutlak. Kita cukup dengan hanya melakukan sekuensing terhadap gen-nya. Ini adalah salah satu hasil kemajuan bioinformatika yang nyata dalam bidang virologi.


d. Bioinformatika  untuk identifikasi agent penyakit baru
Bioinformatika juga menyediakan tool yang esensial untuk identifikasi agent penyakit yang belum dikenal penyebabnya. Banyak sekali contoh-contoh penyakit baru (emerging diseases) yang muncul dalam dekade ini, dan diantaranya yang masih hangat di telinga kita tentu saja SARS (Severe Acute Respiratory Syndrome).

Pada awal munculnya penyakit ini, ada beberapa pendapat tentang penyebabnya. Dari gejala pengidap SARS, diperkirakan bahwa penyakit ini disebabkan oleh virus influenza karena gejalanya mirip dengan gejala pengidap influenza. Tetapi virus influenza tidak terisolasi dari pasien, sehingga dugaan ini salah. Selain itu juga diperkirakan bahwa penyakit ini disebabkan oleh bakteri Candida karena bakteri ini terisolasi dari beberapa pasien. Tapi karena hanya terisolasi dari sebagian kecil pasien, perkiraan ini juga salah. Akhirnya ditemukan bahwa dari sebagian besar pasien SARS terisolasi virus corona yang jika dilihat dari morfologinya. Sekuen genom virus ini kemudian dibaca dan dari hasil analisa dikonfirmasikan bahwa penyebab SARS adalah virus corona yang telah berubah (mutasi) dari virus corona yang ada selama ini.

Dalam rentetan proses ini, Bioinformatika memegang peranan penting. Pertama pada proses pembacaan genom virus corona. Karena di database seperti GenBank, EMBL (European Molecular Biology Laboratory), dan DDBJ (DNA Data Bank of Japan) sudah tersedia data sekuen beberapa virus corona, yang bisa digunakan untuk men-design primer yang digunakan untuk amplifikasi DNA virus SARS ini. Berikutnya Bioinformatika juga berperan dalam mencari kemiripan sekuen (homology alignment) virus yang didapatkan dengan virus lainnya. Dari hasil analisa virus SARS diketahui bahwa genom virus corona penyebab SARS berbeda dengan virus corona lainnya, sehingga virus ini dinamakan virus SARS (SARS-CoV). Perbedaan ini diketahui dengan menggunakan homolgy alignment dari sekuen virus SARS.


e. Bioinformatika untuk diagnosa penyakit baru
Ada beberapa cara untuk diagnosa suatu penyakit. Diantaranya isolasi agent penyebab penyakit tersebut dan analisa morfologinya, deteksi antibodi yang dihasilkan dari infeksi dengan teknik enzyme-linked immunosorbent assay (ELISA), dan deteksi gen dari agent pembawa penyakit tersebut dengan Polymerase Chain Reaction (PCR). Isolasi agent pembawa penyakit memerlukan waktu yang lama. Teknik ELISA bisa dilakukan dalam waktu yang pendek, namun untuk tiap-tiap penyakit kita harus mengembangkan teknik tersebut terlebih dahulu. Untuk pengembangannya ini memerlukan waktu yang lama.
Yang banyak dan lazim dipakai saat ini adalah teknik PCR. Teknik ini simpel, praktis dan cepat. Yang penting dalam teknik PCR adalah design primer untuk amplifikasi DNA. Untuk mendesign primer ini diperlukan data sekuen dari genom agent yang bersangkutan dan software seperti yang telah diuraikan di atas. Di sinilah Bioinformatika memainkan peranannya. Untuk agent yang mempunyai genom RNA, harus dilakukan reverse transcription (proses sintesa DNA dari RNA) terlebih dahulu dengan menggunakan enzim Reverse transcriptase. Setelah DNA diperoleh baru dilakukan PCR. Dua step reverse transcription dan PCR ini bisa dilakukan sekaligus dan biasanya dinamakan RT-PCR.




a. Bioinformatika dalam bidang pertanian
Bioinformatika telah sejak lama digunakan untuk mendukung eksperimen laboratorium pada bidang pertanian. Baru-baru ini, hadirnya teknologi Next Generation Sequencing (NGS) telah mengubah paradigma dalam penelitian berbasis bioinformatika. Penelitian berbasis bioinformatika telah digunakan dalam (1) pengembangan penanda molekuler (Priyono & Putranto, 2014); (2) desain primer untuk analisis ekspresi gen diferensial (Budiani et al., 2016); (3) pengembangan peta genetik (Priyono & Putranto, 2016); dan (4) analisis ekspresi gen (Putranto et al., 2015). Kombinasi antara bioinformatika dalam anotasi gen serta desain primer dan analisis ekspresi gen menggunakan Real-Time PCR telah berhasil memetakan ekspresi 35 gen Ethylene Response Factors (ERFs) pada tanaman karet (Hevea brasiliensis). Tiga gen kemudian dipilih untuk analisis fungsional melalui transgenesis (Putranto et al., 2015). Di sisi lain, pemetaan genetik pada tanaman kopi (Coffea canephora) juga telah memanfaatkan bioinformatika. Sekuen genom tanaman kopi dari the International Coffee Genomics Network (ICGN) digunakan sebagai referensi untuk mencocokkan marka RFLP, SSR, dan SNP pada peta genetik sepanjang 1.471 cM dengan kepadatan marka 0,5 per cM (Priyono & Putranto, 2016).


b. Bioinformatika dalam bidang kesehatan dan desain obat secara in silico
Selaras dengan bidang pertanian, penelitian bioinformatika pada bidang kesehatan senantiasa terkait dengan usaha untuk mengatasi penyakit pada manusia. Salah satu contohnya adalah keberadaan basis data FIND Tuberculosis Strain Bank yang membantu peneliti dalam melakukan uji patogenisitas dan desain obat untuk mengatasi penyakit tuberculosis (TBC) (Tessema et al., 2017). Disisi lain, penelitian terkait penyakit tersebut juga maju pesat dikarenakan keberadaan basis data NGS yang membantu dalam anotasi genom patogen penyebab penyakitnya yaitu Mycobacterium tuberculosis (Skvortsov et al., 2013; Han et al., 2015; Mokrousov et al., 2016). Keberadaan basis data tersebut sebagian besar digunakan untuk desain obat secara in silico dengan memanfaatkan kemudahan sistem daring. Publikasi terkait alur langkah dalam melakukan desain obat secara in silico telah banyak ditemukan. Beberapa pembahasan diantaranya :

      a.       Metode komputasional pada polifarmakologi
Di masa yang akan datang, integrasi dari pendekatan komputasi dan eksperimental akan menjadi teknik yang baik untuk reposisi obat (Anighoro et al., 2014). Reposisi obat tesebut kemudian dapat digunakan dalam polifarmakologi. Pendekatan polifarmakologi bertujuan mendesain obat-obat multitarget melalui desain ligan dengan polifarmakologi transformasi menjadi kandidat obat (Anighoro et al., 2014).


      b.      Prediksi parameter farmakokinetik
Parameter farmakokinetika adalah besaran yang diturunkan secara matematis dari model yang berdasarkan hasil pengukuran kadar obat utuh atau metabolitnya dalam darah, urin atau cairan hayati lainya. Parameter farmakokinetik suatu obat dapat digunakan untuk memperoleh gambaran dan mempelajari suatu kinetika absorpsi, distribusi dan eliminasi di dalam tubuh (Darvas et al., 2000). Pendekatan in silico untuk memprediksi parameter farmakokinetik (absorption, distribution, metabolism, excretion atau yang sering disingkat menjadi ADME) dipelopori oleh Lipinski dan tim (Lipinski et al., 1997).

      c.       Teknologi CADD pada desain obat secara in silico
Secara umum, peralatan Computer Aided Design and Drafting (CADD) digunakan untuk merancang bagian demi bagian hingga menjadi produk secara keseluruhan. CADD merupakan tool yang sangat berguna diindustri pertanian, kesehatan hingga robotika (Kapetanovic, 2008). Pada bidang kesehatan, CADD pada awalnya dikembangkan untuk optimisasi obat (melalui quantitative structure–activity relationship yang disingkat QSAR), yang kemudian meluas menuju ke penemuan obat baru (seperti melalui skrining virtual). Sekarang peralatan CADD digunakan baik ke arah penelitian hulu maupun  hilir dalam penemuan obat. Di arah hulu, bioinformatika dan metode reverse docking biasanya digunakan untuk mengidentifikasi target dari senyawa obat dan Di arah hilir, CADD dapat digunakan untuk memprediksi ADMET secara in silico dan simulasi farmakokinetik berbasis fisiologis sebagai model uji preklinis (Tang et al., 2006).

      d.      Prediksi potensial aksi
Pendekatan bioinformatika juga dapat digunakan untuk memprediksi potensial aksi dari obat yang didesain (Williams & Mirams, 2015). Sebagai contoh, portal internet Action Potential dapat digunakan untuk memilih model elektrofisiologi secara matematis dalam menjalankan simulasi elektrofisiologi jantung terhadap senyawa obat. Tool daring tersebut dapat memperkirakan efek rerata persenyawaan yang menghambat IKr, ICaL, INa, IKs, IK1 dan Ito. Piranti lunak open source ini menyediakan interface yang sederhana. Pengguna dapat memasukkan hal-hal detail tentang persenyawaan untuk afinitas saluran-saluran ion untuk nilai IC50 atau pIC50, menjalankan simulasi, menyimpan hasil untuk pencarian, melihat ringkasan grafik-grafik dari beragam hasil, dan mengekspor data menjadi format spreadsheet (Williams & Mirams, 2015).

      e.      Aplikasi OMICs di biologi sel punca
Aplikasi OMICs pada biologi sel punca hampir selalu diikuti dengan deskripsi awal teknologi baru. Definisi dari OMICs mengacu pada bidang studi biologi yang berakhiran –omics, seperti genomika, proteomika, dan metabolomika. Perkembangan OMICs menghasilkan data komprehensif secara bioinformatika dari masing-masing kajian molekuler tertentu. Sebagai contoh, proteomika mempelajari dan mengukur proteom, genomika fungsional mempelajari dan mengkuantifikasi ekspresi gen, serta metabolomika yang mempelajari dan mengukur konsentrasi produk-produk reaksi metabolik (Baharvand et al., 2006).

      f.       Komputasi basis data lncRNA berbasis internet
Long non-coding RNAs atau yang dikenal sebagai lncRNAs merupakan RNA berukuran panjang (100-200 pb) yang tidak menyandi protein namun diketahui memiliki peran dalam mekanisme epigenetik, ekspresi gen dan ketahanan terhadap penyakit (Boerner & McGinnis, 2012; Rinn & Chang, 2012; Cheetham et al., 2013; Zhang & Zhu 2014). Studi dan pengembangan basis data lncRNAs menjadi sangat penting dalam desain obat secara in silico maupun penelitian lain pada bidang pertanian seperti studi regulasi ekspresi gen dan marka penyakit (Amaral et al., 2011).


c. Pemanfaatan sekuen genom secara daring
Saat ini, basis data genom berbagai organisme sudah dapat diakses secara daring pada situs internet: http://www.ncbi.nlm.nih.gov/genome/. Konsorsium internasional dari basis data genom juga telah membuat National Center for Biotechnology Information (NCBI) terhubung dengan European Nucleotide Archive (ENA) dan DNA Data Bank of Japan (DDBJ) sehingga memudahkan akses sekuen genom (NCBI, 2013). Aplikasi daring seperti The Basic Local Alignment Search Tool (BLAST), konstruksi pohon filogenetik, dan Map Viewer telah tersedia untuk melakukan analisis pada genom-genom tersebut (Tambunan & Parikesit, 2010). Dalam analisis lebih lanjut, aplikasi teknis seperti prediksi gen, anotasi domain protein, dan modifikasi pasca-translasi dapat digunakan untuk memberi makna biologis pada data sekuen (Parikesit et al.,  2014; Tambunan et al., 2007).

Beberapa contoh lain genom lengkap dari spesies tanaman yang sudah disekuens dalam kurun waktu 10 tahun terakhir adalah tanaman kentang, tomat, kacang kedelai, rumput, kelapa sawit, karet, kopi dan tebu (Haas et al., 2009; Schmutz et al., 2010; Vogel et al., 2010; Xu et al., 2011; Sato et al., 2012; Singh et al., 2013; Denoeud et al., 2014; de Setta et al., 2014; Lau et al., 2016; Tang et al., 2016). Sebagian basis data terkait genom tanaman tersebut bersifat publik atau disebut open access sehingga dapat digunakan dalam penelitian lanjutan oleh para peneliti di seluruh dunia. 
Disisi lain, dalam bidang kesehatan, informasi genom banyak digunakan untuk interaksi proteinprotein dalam rangka mempelajari basis molekuler dari sebuah penyakit (Parikesit, 2010). Salah satu contoh dalam kasus tersebut adalah identifikasi sifat patogenesis dari protein huntingtin (htt) penyebab Huntington’s disease, sebuah penyakit degeneratif autosomal yang menyebabkan ketidakseimbangan kognitif dan disfungsi syaraf motorik pada penderitanya. Studi interaksi protein htt dan targetnya telah mengidentifikasi 104 protein terkait dengan penyakit tersebut. Metode terapi kemudian dapat dirancang oleh dokter disesuaikan dari hasil penelitian tersebut. 



a. Basis data sekuens biologis
Basis data adalah kumpulan informasi yang disimpan di dalam komputer secara sistematik sehingga dapat diperiksa menggunakan suatu program komputer untuk memperoleh informasi dari basis data tersebut. Sesuai dengan jenis informasi biologis yang disimpannya, basis data sekuens biologis dapat berupa basis data primer untuk menyimpan sekuens primer asam nukleat maupun protein , basis data sekunder untuk menyimpan motif sekuens protein, dan basis data struktur untuk menyimpan data struktur protein maupun asam nukleat. Basis data utama untuk sekuens asam nukleat saat ini adalah GenBank (Amerika Serikat), EMBL (European Moleculer Biology Laboratory, Eropa), dan DDBJ (DNA Data Bank of Japan, Jepang ) Ketiga basis data tersebut bekerja sama dan bertukar data secara harian untuk menjaga keluasan cakupan masing-masing basis data. Sumber utama data sekuens asam nukleat adalah submisi langsung dari periset individual, proyek sekuensing genom , dan pendaftaran paten .


b. Penyejajaran sekuens
Penyejajaran sekuens (sequence alignment) adalah proses penyusunan/pengaturan dua atau lebih sekuens sehingga persamaan sekuens-sekuens tersebut tampak nyata. Hasil dari proses tersebut juga disebut sebagai sequence alignment atau alignment saja. Baris sekuens dalam suatu alignment diberi sisipan (umumnya dengan tanda "–") sedemikian rupa sehingga kolom-kolomnya memuat karakter yang identik atau sama di antara sekuens-sekuens tersebut. Berikut adalah contoh alignment DNA dari dua sekuens pendek DNA yang berbeda, "ccatcaac" dan "caatgggcaac" (tanda "|" menunjukkan kecocokan atau match di antara kedua sekuens).

ccat---caac
| || ||||
caatgggcaac


c. Prediksi struktur protein
Secara kimia/fisika, bentuk struktur protein diungkap dengan kristalografi sinar-X ataupun spektroskopi NMR , namun kedua metode tersebut sangat memakan waktu dan relatif mahal. Sementara itu, metode sekuensing protein relatif lebih mudah mengungkapkan sekuens asam amino protein. Prediksi struktur protein berusaha meramalkan struktur tiga dimensi protein berdasarkan sekuens asam aminonya (dengan kata lain, meramalkan struktur tersier dan struktur sekunder berdasarkan struktur primer protein). Secara umum, metode prediksi struktur protein yang ada saat ini dapat dikategorikan ke dalam dua kelompok, yaitu metode pemodelan protein komparatif dan metode pemodelan de novo. Pemodelan protein komparatif (comparative protein modelling) meramalkan struktur suatu protein berdasarkan struktur protein lain yang sudah diketahui, dimana Dalam pendekatan de novo atau ab initio, struktur protein ditentukan dari sekuens primernya tanpa membandingkan dengan struktur protein lain.


d. Analisis ekspresi gen
Ekspresi gen merupakan rangkaian proses penerjemahan informasi genetik (dalam bentuk urutan basa pada DNA atau RNA) menjadi protein, dan lebih jauh lagi fenotipe. Informasi yang dibawa bahan genetik tidak bermakna apa pun bagi suatu organisme apabila tidak diekspresikan menjadi fenotipe. Ekspresi gen dapat ditentukan dengan mengukur kadar mRNA dengan berbagai macam teknik (misalnya dengan microarray ataupun Serial Analysis of Gene Expression ["Analisis Serial Ekspresi Gen", SAGE]). ). Teknik-teknik tersebut umumnya diterapkan pada analisis ekspresi gen skala besar yang mengukur ekspresi banyak gen (bahkan genom ) dan menghasilkan data skala besar


e. Analisis Filogenetika
Filogenetik adalah studi yang membahas tentang hubungan kekerabatan antar berbagai macam organisme melalui analisis molekuler dan morfologi. Dengan pesatnya perkembangan teknik-teknik di dalam biologi molekuler, seperti PCR (polymerase chain reaction) dan sikuensing DNA, penggunaan sekuen DNA dalam penelitian filogenetika telah meningkat pesat dan telah dilakukan pada semua tingkatan taksonomi, misalnya famili, marga, dan species. Pemikiran dasar penggunaan sekuen DNA dalam studi filogenetika adalah bahwa terjadi perubahan basa nukleotida menurut waktu, sehingga akan dapat diperkirakan kecepatan evolusi yang terjadi dan akan dapat direkonstruksi hubungan evolusi antara satu kelompok organisme dengan yang lainnya.



Sumber referensi