LO3: Omikler ve sistem biyolojisi

Genomik ve Proteomik için Araçlar

Dizi hizalama yöntemleri, tek bir diziyi veya yapıyı analiz etmek ve tekli gen uzunluğunun çoklu dizilerini karşılaştırmak için kullanılabilir. Bu yöntemler, belirli bir genin işlevini veya belirli bir proteinin mekanizmasını anlamada yardımcı olabilir. Bununla birlikte, gen fonksiyonlarının bir organizmanın gözlemlenebilir özelliklerinde (onun fenotipi) nasıl ortaya çıktığını anlamak da ilginçtir. Bu bağlamda, bir genomdaki tüm genlerin entegre fonksiyonunun incelenmesine izin veren bazı veri türleri ve araçları mevcuttur.

Bir genin veya bir proteinin analiz edilmesi için deneysel stratejiler, birçok genin aynı anda incelendiği paralel yaklaşımlarla giderek yer değiştirmektedir. Biyoinformatik algoritmalarının kullanılması, çeşitli kaynaklardan alınan genomların karşılaştırılmasına olanak sağlamak için, genomik fonksiyonun ve ifadesinin tam bir resmini oluşturmak için entegre edilebilir. Şekil 1, genom bilgisinin fenotipik ifadede nasıl dönüştürüldüğünü göstermektedir.

Şekil 1. Genom bilgisini fenotipe aktarma

Şekil 1. Genom bilgisini fenotipe aktarma

Onlarca yıldır biyologlar, genomun işlevlerini bir bütün olarak görmek için molekülden hücresel seviyeye ve ötesine bilgi toplamaktadırlar. Biyokimyasal deneylerin otomatikleştirilmesi ve ölçeklendirilmesi ve biyokimyasal verilerin bir kamu kaynağı olarak işlenmesi süreci biyoinformatik kullanımı ile önemli ölçüde kolaylaştırılmaktadır.

İnsan Genom Projesi, yalnızca biyolojik dizi bilgisinin mevcut olduğu gigabaytları yapmakla kalmamış, biyolojik araştırmanın tüm alanını örnekleriyle değiştirmeye başlamıştır. Protein yapı tayini henüz dizi tayini ile aynı düzeyde değil, fakat yapısal genomiklerde çok sayıda proje başlatılmış olup, ana hedef, yüksek hızlı bir yapı belirleme yaklaşımı oluşturmaktır. DNA mikrodizi deneyinin arkasındaki fikir, kapsamlı biyokimyasal ve moleküler biyoloji deneylerinin yapılmasına izin vermesidir.

Biyoenformatiğin en önemli görevlerinden biri, bilgi yönetimi için, genom dizisinin her bir parçasını, işlevinden, protein ürününün yapısına (eğer varsa) kadar her şey hakkında bilgi vererek etkin bir şekilde açıklama yapabilecek yazılım sistemleri oluşturmaktır. Bu gen, bir organizmanın farklı yaşam aşamalarında ifade edilir. Genom bilgi yönetim sistemlerinin bir diğer görevi, kullanıcıların büyük veri setleri arasında sezgisel ve görsel karşılaştırmalar yapabilmelerini sağlamaktır. Çoklu genomların görsel karşılaştırmasından, genom harita verileriyle ifade verilerinin görsel entegrasyonuna kadar birçok yeni veri entegrasyonu projesi geliştirilmiştir.

Genleri ve Genomları Dizileme

Bir genin (ya da bir genomun) dizilenmesi işlemindeki ilk hesaplama zorluklarından biri, bir dizilim jelindeki parçaların modelinin yorumlanmasıdır.

Ham Sekans Verilerinin Analizi: Basecalling

DNA dizilemesinden ham verilere bir dizinin atanması işlemine basecalling denir. Bu adım doğru bir DNA dizisi üretmezse, sıralamanın sonraki analiz etkilenir. Kamuya açık veritabanlarında biriktirilen tüm diziler, sıralayıcı çıktısındaki belirsizlikler veya ekipman arızaları nedeniyle ortaya çıkan hataların önlenmesi ile etkilenmektedir. EST ve genom araştırma dizileri en yüksek hata oranlarına sahiptir (baz başına 1/10 -1/100 hata), ardından küçük laboratuvarlardan bitmiş diziler (baz başına 1/100-1 / 1.000) ve büyük genom dizileme merkezlerinden bitmiş diziler (Baz başına 1 / 10,000 -1 / 100.000). GenBank’taki herhangi bir dizinin en az bir hataya sahip olması muhtemeldir. Sekanslama teknolojisinin geliştirilmesi ve özellikle DNA dizilemesinde yer alan sinyal tespiti ve işlenmesi hala aktif araştırmaya konu olmaktadır.

DNA dizilimi için iki popüler yüksek verimli yöntem vardır. DNA dizilemesi, tek baz çözünürlükte DNA fragmanlarının bir merdivenini oluşturma ve DNA parçalarını jel elektroforezi ile ayırma yeteneğine dayanır. Genel olarak, parçalanmış DNA, her bir baz spesifik parçası için bir tane olmak üzere dört farklı floresan etiket ile etiketlenir ve bir jel şeridinde dört örneğin bir karışımını çalıştırır. Yaygın olarak kullanılan başka bir sıralama yöntemi, her bir örneği ayrı ve yakından aralıklı bir şeritte çalıştırır. Her iki durumda da, jel sırayla her bir floresan bandını harekete geçiren bir lazer ile taranır. Bu protokollerin her birinin farklı deney türlerinde avantajları vardır, bu nedenle her ikisi de ortak kullanımdadır.

Otomatik basecalling için çeşitli ticari ve ticari olmayan araçlar vardır. Bazıları belirli sıralama donanımı ve giriş veri türleri ile tam olarak entegre edilmiştir. Çoğu, dizinin belirlendiği şekilde uzman bir kullanıcının karar vermesine izin verir ve hatta bunu gerektirir.

Dizilemenin ham sonucu, bir sıralama jeli içindeki her pozisyonda bir flüoresans yoğunluğunun kaydıdır. Şekil 2, modern bir sıralama deneyinden detektör çıktısını göstermektedir. Otomatik basecalling yazılımı için zorluk, floresan piklerini dört harfli DNA dizi koduna çevirmektir. Bir sıralama jeli üzerinde bantların ayrılması mükemmel olmadığından, ayırmanın kalitesi ve bantların şekli jelin uzunluğu boyunca kötüleşir. Zirveler genişler ve birbirine karışır ve bir noktada (genellikle 400-500 baz) zirvelerin çözülmesi imkansız hale gelir. Sistematik hataların oluştuğu iyi anlaşılmıştır, bu yüzden bilgisayar algoritmaları bunları telafi edecek şekilde geliştirilmiştir. Basecalling yazılımının ana amacı, okuma sonunda her bir dizinin doğruluğunu geliştirmek ve aynı zamanda, çalışmanın sonunda daha belirsiz olan floresan zirvelerini dönüştürmek için araçlar sağlayarak, dizi sıralama çalışmalarının kapsamını genişletmektir.

Şekil 2. Bir sıralama denemesinden gelen dedektör çıkışı

Şekil 2. Bir sıralama denemesinden gelen dedektör çıkışı

Modern sıralama teknolojileri, jelleri mikroskobik kılcal sistemlerle değiştirir, ancak sürecin temel kavramları, jel bazlı dizilemede olduğu gibidir: DNA’nın parçalanması ve tek tek parçaların elektroforez ile ayrılması.

Bütün bir Genomu Sıralama

Genom dizilemesi, bir gen dizileme çalışmasının sadece ölçekli bir versiyonu değildir. 500 baz çifti gibi bir şeyin dizi uzunluğu sınırıdır. Ve bir genomun uzunluğu on binler ile milyarlarca baz çift arasında değişebilir. Böylece, bütün bir genomu dizmek için genomun parçalara ayrılması gerekir ve daha sonra dizilen parçaların sürekli bir diziye yeniden birleştirilmesi gerekir.

Genomları sıralamak için iki popüler strateji vardır: av tüfeği yaklaşımı ve klon kontigü yaklaşımı. Bu stratejilerin kombinasyonları genellikle daha büyük genomları dizmek için kullanılır.

Av tüfeği yaklaşımı

Av tüfeği DNA dizilemesi, DNA dizilemesi için otomatik bir yaklaşımdır. Burada DNA, yönetilebilir uzunluktaki (yaklaşık 2,000 KB) rastgele parçalara ayrılmıştır. Plazmidlere klonlanırlar (bir klon kütüphanesi olarak adlandırılır). Yeterince büyük miktarda genomik DNA parçalanırsa, klon seti, genomun her baz çiftini birçok kez genişletir. Her bir klonlanmış DNA parçasının ucu daha sonra sıralanır veya bazı durumlarda her iki uç sekanslanır. Her ne kadar fragmanın uçlarında sadece 400-500 baz dizilse de, eğer kütüphaneden yeterli sayıda klon rastgele seçilirse, dizilen DNA miktarı hala birkaç kez genomun her baz çiftini kapsar. Av tüfeği dizilemede son adım, dizi montajıdır. Genellikle dizilerin montajı çoklu konturlar ile sonuçlanır (birbiriyle çakışmayan açıkça monte edilmiş uzunluklar). Av tüfeği dizilimi ile tam bir genom dizilimindeki son adımlar ya eksik bölgeleri doldurabilecek klonlar bulmak ya da boşluklardan DNA dizisini çoğaltmak için PCR ya da başka teknikler kullanmaktır.

Klon contig yaklaşımı

Klon contig yaklaşımı, aynı zamanda, daha küçük bir ölçekte, av tüfeği dizilişine dayanır. Tüm genomu rastgele parçalara ayırmak yerine, klon kontig yaklaşımı onu kısıtlama parçalarına ayırarak başlar, daha sonra yapay kromozom vektörlerine klonlanabilir ve çoğaltılabilir. Klonlanmış kısıtlama fragmanlarının her biri, standart bir av tüfeği yaklaşımı ile sıralanabilir ve birleştirilebilir. Genom, kısıtlama fragmanlarına bölündüğünde, sadece kısmen ayrışır. DNA örneğine uygulanan kısıtlama enzimi miktarı, numunedeki mevcut kısıtlama alanlarının sadece yaklaşık % 50’sinde kesmek için yeterlidir. Bu, bazı fragmanların belirli bir kısıtlama bölgesini kapsayacağı, diğer fragmanların bu alanda kesileceği ve diğer kısıtlama alanlarını kapsayacağı anlamına gelir. Bu nedenle, bu kısıtlama parçalarından oluşan klon kütüphanesi, örtüşen parçalar içerecektir. Montaj süreci, kromozom yürüyüşü ile başlar. Spesifik bir klonun bulunması, daha sonra üst üste binen bir sonraki klonun bulunması ve bir sonraki, vb. Genellikle, her bir klonun içine sokulmuş olan kısıtlama fragmanının belirlenmesine yardımcı olmak için bir prob melezleştirme tekniği veya PCR kullanılır.

Genomlar çeşitli detay seviyelerinde haritalanabilir. Belirli özelliklerin ortaya çıkmasına neden olan genleri kromozomdaki spesifik lokuslara tahsis eden genetik bağlantı haritaları oluşturulabilir. Bu nedenle, araştırmacıların genom işlevini anlamalarına yardımcı olabilecek (ve tam bir genom haritasının oluşturulması için bir çerçeve sağlayan), organizmaya bağlı olarak bazen çok ayrıntılı bir dizi işaretleyici sağlarlar. Ayrıca, fiziksel haritalar DNA’yı belirli yerlerde kesilen kısıtlama enzimleri ile sindirerek, düzenli klon kütüphaneleri geliştirerek ve bir cam alt-tabakaya sabitlenmiş tek, resriksiyon enzimiyle kesilmiş DNA moleküllerinin floresan mikroskobu olmak üzere birkaç şekilde oluşturulabilir. Her yöntemin anahtarı, etiketli probların ve bilinen genetik işaretlerin (kısıtlama eşlemesinde) veya örtüşen bölgelerin (kütüphane oluşturmada) tanımlanmasıyla bir genomun parçalarının doğru bir şekilde spesifik bir haritaya doğru sıralanmasıdır.

LIMS: Mini dizileri izleme

Genomdan izole edilebilen milyonlarca eşsiz DNA örneğini izlemek, en büyük bilgi teknolojisi sorunlarından biridir. Yüksek verimli dizilemeden çıktıları yöneten sistemlere Laboratuvar Bilgi Yönetim Sistemleri (LIMS) denir ve geliştirilmesi ve bakımı biyoenformatiklerin endüstriyel ortamlardaki en büyük payını oluşturur. Mikroarray’ler ve cheminformatics gibi diğer yüksek verimli teknolojiler de karmaşık LIMS desteğini gerektirir.

Dizi Meclisi

Basecalling, tam bir genom dizilimini bir araya getirmenin ilk adımıdır (Şekil 3). Kısa dizi fragmanları elde edildikten sonra, bunların binlerce kez uzunluğunda olabilen tam bir dizi halinde toplanması gerekir. Bir sonraki adım dizi montajıdır.

Bir av tüfeği yaklaşımı kullanılarak DNA dizilimi, her biri 400-500 parça uzunluğunda binlerce veya milyonlarca mini dizi sağlar. Fragmanlar rastgele olup kısmen veya tamamen birbiriyle çakışabilir. Bu örtüşmeler nedeniyle, kümedeki her fragman, bazı diğer parçalara bitişik olarak dizi özdeşliği ile tanımlanabilir. Bu fragmanların her biri, başka bir parça ile çakışır. Son olarak, tüm fragmanların optimal olarak bir sürekli diziye birleştirilmesi gerekir. Bununla birlikte, tekrarlanan diziler, montaj işlemini karmaşıklaştırabilir. Bazı fragmanlar boyanmaz ve sekanslama süreci başarısız olur ve otomatik dizilimi karmaşık hale getiren DNA sekansında boşluklar kalır. Dizilimin devam etmesi için bir noktada yeterli bilgi yoksa, oluşturulmakta olan dizi contig bir sona gelir ve yeni bir contig başlar.

Şekil 3. Av tüfeği DNA dizileme yaklaşımı

Şekil 3. Av tüfeği DNA dizileme yaklaşımı

Web’de Genom Bilgilerine Erişme

GenBank’ta yüzlerce genomda kısmi veya tam DNA sekansları mevcuttur. Bu dizi kayıtlarını genom yapısının anlaşılabilir bir temsiline koymak o kadar kolay değildir. DNA dizisini kullanıcı dostu bir formatta daha yüksek seviyeli genom haritalarıyla entegre etmek için birçok çaba sarf edilmektedir. Şimdiye kadar, bu çabalar, önemli bitki ve hayvan model sistemlerinin insan genomuna ve genomlarına odaklanmıştır.

NCBI Genom Kaynakları

NCBI, ana web sitesinin Genomik Biyoloji bölümünden çok çeşitli web tabanlı genom analiz araçlarına erişim sunmaktadır. Arayüzleri kullanıcı dostudur ve NCBI, sağlanan araçları ve veritabanlarını nasıl kullanacağını açıklayan bol miktarda dokümantasyon sağlar.

Mevcut genomik araçlardan bazıları şunlardır:

Genom Bilgileri

Genom proje bilgisi NCBI’deki Entrez Genomes sayfasından edinilebilir. Veritabanı listeleri, tam veritabanı veya mikroorganizmalar, archaea, bakteri, ökaryotlar ve virüsler gibi ilgili organizmalar için kullanılabilir. Veritabanındaki her giriş, bir taksonomi tarayıcı girişine veya organizma hakkında mevcut bilgilere daha fazla bağlantı sağlayan bir ana sayfaya bağlanır. Organizmanın bir genom haritası mevcutsa, organizmanın ana sayfasında bir “Genomu Görün” bağlantısı görünür. Ana sayfadan, genom dizilerini ve referanslarını da indirebilirsiniz.

Harita Görüntüleyici

Genoma bağlı olarak, bilinen protein kodlama bölgelerini, protein ve RNA için kodlama bölgelerinin listelerini ve diğer bilgileri gösteren genel haritalarına erişebilirsiniz. Harita Görüntüleyici dört bilgi düzeyini birbirinden ayırır: organizmanın ana sayfası, genomun grafiksel görünümü, her bir kromozomun detaylı haritası (kullanıcının yakınlaştırılacağı yeri seçebileceği bir ana harita ile hizalanmış) ve dizi görünümü, genom dizisinin bölgeleri için ek açıklamaları grafiksel olarak göstermektedir.

ORF Bulucu

Açık Okuma Çerçevesi (ORF) Bulucu, bir DNA dizisinde açık okuma çerçevelerini bulmak için bir araçtır. ORF bulucu, standart veya kullanıcı tarafından belirlenen genetik kodu kullanarak diziyi çevirir. Kodlamayan DNA’da, durdurma kodonları sıklıkla bulunur. ORF bulucudan alınan bilgiler, bir DNA dizisi için hassas okuma çerçevesi ve kodlama bölgelerinin başladığı ve durduğu yerler hakkında ipuçları sağlayabilir. Entrez Genomes veritabanında bulunan birçok genom için ORF Finder, genomun harita görünümünden entegre bir araç olarak mevcuttur.

Homologene

HomoloGene, geniş bir ökaryotik türün eksiksiz gen setlerinden varsayılan homoloji gruplarını oluşturmak için otomatik bir sistemdir. Ortolog çiftleri ya literatür raporları veya benzerlik hesaplamaları ile tanımlanır. HomoloGene veritabanı, gen sembolleri, gen adları, GenBank katılım numaraları ve diğer özellikler kullanılarak aranabilir.

Ortolog Grupların Kümeleri (COG)

COG, ortolog protein gruplarının bir veritabanıdır. Veri tabanı, 97 genomunda protein dizileri karşılaştırılarak geliştirilmiştir. COG’deki girişler, evrimsel tarihin büyük bir bölümünü temsil etmektedir. COG veritabanı fonksiyonel kategori, filogenetik desen ve diğer birçok özellik tarafından aranabilir.

Genom Açıklaması

Pratikte genom ek açıklamaları, birden fazla veri tabanının, strüktürün ve fonksiyonel genomiklerin bir araya getirilebilir bir sistemde tamamen birbirine bağlı bir kombinasyonudur. Bu zor bir süreçtir çünkü bir genomda birbiriyle ilişkili çok sayıda bilgi parçasıdır ve ilişkisel veritabanlarıyla ilgilidir.

Genom Karşılaştırması

Genomların ikili veya çoklu karşılaştırması, evrimsel biyolojinin (genetik polimorfizmler) temel sorularını veya çok spesifik klinik soruları (fenotipte varyasyonlar) yanıtlamak gibi birçok farklı çalışmada kullanılabilen bir araçtır.

Genlerin teker teker karşılaştırılması yerine, bütün genomların karşılaştırılması, karakterize edilmemiş veya hatta varsayılan DNA’sı içinde benzerlik bölgelerinin tanımlanmasına yardımcı olabilir. Genom karşılaştırması ayrıca genomik açıklamada da yardımcı olacaktır. Prototip genom karşılaştırmaları, ek genomların dizilişini doğrulamaya izin verir ve hem harita seviyesinde hem de doğrudan sekans seviyesinde faydalıdır.

PipMaker

PipMaker, iki DNA dizisinde benzer bölgelerin hizalarını hesaplayan bir araçtır. Bu, uzun dizilerde büyük ölçekli benzerlik kalıplarının belirlenmesinde faydalıdır. PipMaker kullanma süreci nispeten basittir. İki FASTA formatlı sekans dosyası ile başlayarak, önce sekans tekrarlarını maskelemek (RepeatMasker sunucusunu kullanarak) için bir dizi komut üretilir. Bu, sekans karşılaştırmasındaki belirsiz isabet sayısını azaltır. Elde edilen bilgiler ve bilinen gen konumlarının sayısal bir listesini içeren basit bir dosya Penn State University’deki PipMaker web sunucusuna gönderilir ve sonuçlar size e-posta ile gönderilir.

MUMmer

Büyük ölçekli DNA ve protein dizilerinin ultra hızlı hizalanması için başka bir program MUMmer’dir. İlk uygulaması, iki M. tuberculosis suşunun genomlarının ayrıntılı bir karşılaştırmasıdır. MUMmer, milyonlarca baz çiftini sıralar halinde karşılaştırabilir ve benzerlik bölgelerinin renkli görselleştirmelerini üretebilir. MUMmer, sistem için son derece kolay bir şekilde çift yönlü karşılaştırmaları hızla işlemeyi kolaylaştıran bir ek algoritması olarak adlandırılan bir bilgisayar algoritmasına dayanmaktadır. MUMmer, eksik genomları da hizalayabilir; bir av tüfeği dizileme projesinden 100’lerin veya 1000’lerin kolayca işlenmesini sağlayabilir ve bunları sistemle birlikte gelen NUCmer programını kullanarak bir başka contig setine veya bir genoma hizalayacaktır. Türler, benzerliği saptamak için bir DNA dizisi hizalaması için çok farklıysa, PROmer programı, her iki giriş dizisinin altı çerçeve çevirisine dayalı hizalamalar oluşturabilir.

Fonksiyonel Genomikler

Yüksek hızlı sıralama yöntemlerinin başlatılması, proteinleri kodlayan DNA dizilerini çalışma şeklimizi değiştirmiştir. Artık bir kromozomun tüm DNA dizisini tek bir varlık olarak görmek ve bir bütün olarak organizmanın karmaşıklığını üretmek için parçalarının birlikte nasıl çalıştığını incelemek mümkün hale gelmektedir.

Genomun fonksiyonları birkaç belirgin kategoriye ayrılır: metabolizma, düzenleme, işaretleme ve yapım. Metabolik yollar, çevre kaynaklarından elde edilen kimyasal enerjiyi hücredeki yararlı çalışmaya dönüştürür. Düzenleyici yollar, genomik DNA’nın ne yaptığını kontrol eden biyokimyasal mekanizmalardır (ifade edildiğinde veya olmadığında). Genomik regülasyon sadece ifade edilen genleri değil, düzenleyici proteinlerin bağlanabildiği DNA’daki yapısal ve sekans sinyallerini de içerir. Sinyal yolları, bir hücre içindeki bir bölmeden diğerine kimyasalların akışını kontrol eder. DNA transkripsiyonunun kontrolü için birçok düzenleyici sistem üzerinde çalışılmıştır. Bu metabolik, düzenleyici ve sinyalleme sistemlerini genom dizisine eşlemek, fonksiyonel genomik alanın amacıdır.

Gen İfadesini Analiz Etmek İçin Diziye Dayalı Yaklaşımlar

Genom dizisine ek olarak, GenBank diğer birçok DNA dizisini içerir. Bir organizma için ifade edilen sekans etiketi (EST) verileri, gen ekspresyonunun analizi için son derece yararlı bir başlangıç ​​noktası olabilir. EST’ler, hücresel mRNA’nın cDNA klonlarının kısmi dizileridir. mRNA seviyeleri, hücre veya ortamındaki değişikliklere cevap verir; mRNA seviyeleri dokuya bağımlıdır ve organizmanın yaşam döngüsü sırasında da değişir. mRNA veya cDNA’nın miktar tayini, bir genomun belirli koşullar altında ne yaptığını iyi bir şekilde ölçer.

NCBI, birkaç bin EST kütüphanesine erişim sağlayan dbEST adlı bir veritabanı sunar. Bunların büyük bir kısmı insan EST kütüphaneleridir, fakat onlarca başka organizmadan da kütüphaneler vardır.

DNA Mikroarrayleri

Son zamanlarda, yeni teknoloji araştırmacıların tüm genomların ekspresyon modellerini hızla keşfetmelerini mümkün kılmıştır. Bir mikrodizi (veya gen çipi), her biri farklı bir DNA oligomeri içeren 20.000 veya daha fazla hassas yerleştirilmiş nokta ile kaplanan küçük bir camdır. cDNA, prob olarak işlev görmek için slayta da eklenebilir. İnce zarlar gibi diğer ortamlar, slaytların yerine kullanılabilir. Deneyin anahtarı, her DNA parçasının hareketsiz hale getirilmesi ve mikrodizi sinyalinde bir değişikliğe yol açan herhangi bir reaksiyonun, spesifik bir DNA dizisine kesin olarak atanabilmesidir.

Mikrodiziler kavramsal olarak Southern Blots veya Northern Blots gibi geleneksel hibridizasyon deneylerinden farklı değildir. Geleneksel kurutmada, protein örneği hareketsizdir; mikrodizi deneylerinde, prob hareketsiz hale getirilir ve bir deneyde toplanabilen bilgi miktarı çok daha büyüktür. Şekil 4, bir mikrodizi taramasının sadece bir bölümünü göstermektedir.

Şekil 4. Bir mikroarray taraması

Şekil 4. Bir mikroarray taraması

Mikro dizi teknolojisi artık DNA sıralama deneyleri için rutin olarak kullanılmaktadır (Örneğin, polimorfizmlerin varlığını test etmekte kullanılır). Bir başka gelişme, gen ekspresyon analizi için mikrodizilerin kullanılmasıdır. Bir gen eksprese edildiğinde, bir mRNA transkript üretilir. Eğer ilgilenilen genlere tamamlayıcı olan DNA oligomerleri mikrodizisine yerleştirilirse, mRNA veya cDNA, bu genlerin eksprese edilip edilmediğine ilişkin olarak hızlı bir analiz sağlayan çipe hibridize edilebilir. Bu gibi deneyler, örneğin, maya içinde, ortam şeker konsantrasyonundaki değişikliklere yanıt olarak, bütün genom ekspresyonu modellerindeki farklılıkları test etmek için gerçekleştirilmiştir. Mikroarray deneyleri, bir organizmanın genlerinin çevresel değişimlere tepki olarak davranışı hakkında bilgi sağlayabilir.

Mikroarray Tasarım ve Analizinde Biyoinformatik Zorluklar

Biyoenformatik, mikrodizi deneylerinde çoklu roller oynar. Aslında, mikrodizileri bilgisayar ve veritabanlarının katılımı olmadan faydalı olarak değerlendirmek zordur. Çiplerin özel amaçlarla, sinyallerin nicelleştirilmesinden, gen gruplarının ekstraksiyonuna kadar, mikrodizi analizi, belirli bir biyoinformatik yazılımı kullanılmadan, imkansız olmasa da zor olan bir süreçtir.

Kamu alanında, ilişkili sekanslar ve ek açıklamalar ile veri bağlantısı için çeşitli projeler devam etmektedir. En büyük mikrodizi EMBL-EBI's ArrayExpress. Ulusal İnsan Genom Araştırma Enstitüsü (NHGRI) şu anda hem analiz araçlarını hem de ilişkisel veritabanı desteğini içeren bir dizi veri yönetim sisteminin bir sunumunu sağlamaktadır.

Dizi deneylerini planlama

Mikrodizi deneylerinde önemli bir unsur çip tasarımıdır. Talaş tasarımı aylar süren bir süreçtir. Mikroarray sonuçlarının açık ve net olması için, dizideki her DNA probu, sadece bir spesifik hedef genin onunla melezleşebileceği kadar yeterli olmalıdır. Aksi takdirde, her noktada tespit edilen sinyal miktarı kantitatif olarak yanlış olacaktır.

Taranan mikrodizi görüntüleri analiz etme

Dizi denemesi tamamlandığında, dizilerinizin taranan görüntülerini içeren çok fazla sayıda büyük TIFF dosyasına sahip olursunuz. Ortak alan mikroarray analiz araçları standardı, Stanford’da geliştirilen paketlerdir. Bir paket, ScanAlyze, iyi düşünülmüş ve yaygın olarak kullanılan görüntü analiz aracıdır. TIFF dosyalarını ve Stanford SCN formatını destekler.

Mikroarray veri analizi için çok sayıda başka yazılım vardır, örneğin:

GenomeStudio Yazılımı, Illumina platformlarında üretilen mikrodizi verilerini görselleştirmenizi ve analiz etmenizi sağlar. Yazılım paketi, genom, gen ifadesi ve gen regülasyonunun kapsamlı bir görünümünü elde etmenizi sağlayan ayrık uygulama modüllerinden oluşur.

TM4 Microarray Software Suite, mikrodizi veri yönetimi ve raporlaması, görüntü analizi, normalleştirme ve boru hattı kontrolü ve veri madenciliği ve görselleştirme için açık kaynaklı bir araçtır.

MAIA, cDNA, CGH veya protein mikrodizi teknolojilerinde üretilen tek ve iki renkli görüntülerin otomatik olarak işlenmesi için bir yazılım paketidir.

AIM (Mikroarray için Otomatik Görüntü İşleme sistemi), kalibre edilmemiş mikrodizi gridleme ve kantitatif görüntü analizi için bir yöntem sağlar. AIM, en kötü durumdaki dizeler için bile çok iyi performans gösteren bir hızlı son ek dizisi inşaat algoritmasıdır. Bu sistem bağımsız olarak komut satırı araçlarının yanı sıra çalışır.

Koadarray, tek veya çoklu dizi görüntüleri tamamen katılımsız işleyebilen tam otomatik dizi görüntü analizi yazılımı.

Kümeleme ifadesi profilleri

Mikroarray verilerinin analizi için en popüler strateji, ifade profillerinin kümelenmesidir. Bir ifade profili, deney sırasında mikroarray ızgara üzerindeki bir noktada ekspresyondaki değişikliği tarif eden bir grafik olarak görselleştirilebilir. Deneyin seyri, DNA’nın diziye hibridize edilmesinden önce hücrelerin hücre döngüsü aşamalarına kadar büyütüldüğü ortamdaki besinlerin konsantrasyonundaki değişikliklerden herhangi bir şeyle değişir.

Hiyerarşik kümeleme veya SOM’lar (kendi kendini organize eden haritalar) gibi farklı kümeleme yöntemleri, farklı durumlarda daha iyi çalışabilir, ancak bu yöntemlerin her birinin genel amacı aynıdır. İki genin, ifade düzeylerini ortamdaki bir değişikliğe tepki olarak aynı şekilde değiştirmesi durumunda, bu genlerin ilişkili olduğu varsayılabilir. Bir promosyoncu kadar basit bir şey paylaşabilir ya da büyük olasılıkla aynı karmaşık düzenleyici yol tarafından kontrol edilirler. İfade profillerinin otomatik kümelenmesi benzer özellikler arar, ancak bu değişikliklerin nedenlerini göstermez.

Proteomiks

Proteomikler, bir hücrenin tüm protein tamamlayıcısını aynı anda inceleyen tekniklere değinir. Protein saflaştırma ve ayırma yöntemleri sürekli gelişirken, NMR ve x-ışını kristalografisi ile belirlenen protein yapılarının zaman-tamamlanma oranı azalırken, bir organizmanın tüm protein tamamlayıcısını hızla kristalize etmenin tek bir yolu yoktur. Biyokimyada en çok bilişim desteği gerektiren teknolojik ilerleme, immobilize gradyan 2D-PAGE prosesi ve ayrılmış protein ürünlerinin kütle spektrometresi ile sonraki karakterizasyonudır.

Proteomikte Deneysel Yaklaşımlar

Genlerin ne zaman ve hangi seviyelerde ifade edildiğini bilmek, genomun fenotipi nasıl belirlediğini anlamak için sadece ilk adımdır. mRNA seviyeleri, hücrede protein konsantrasyonu ile ilşkili olsa da, proteinler, melezleme deneyi ile tespit edilemeyen post-translasyonel değişikliklere tabidir. Hücredeki protein konsantrasyonu ve aktivitesini belirlemek için deneysel araçlar, süreçte çok önemli bir adımdır.

Fonksiyonel genomiklerde bir araç olarak ortaya çıkan bir başka yüksek verimli teknoloji, 2D jel elektroforezidir. İki boyutlu jel elektroforezi, binlerce bileşeni içeren protein karışımlarını ayırmak için kullanılabilir. Deneyin birinci boyutu, bir çözeltinin bileşenlerinin bir pH gradyanı boyunca ayrılmasıdır (izoelektrik odaklama). İkinci boyut, bileşenlerin moleküler ağırlıkla ortogonal olarak ayrılmasıdır. Bu iki boyutta ayırma, komplike bir bileşen karışımını bile çözebilir. Şekil 5, E. coli’den 2D-PAGE haritasının bir örneğini göstermektedir. 2D-PAGE deneyi, proteinleri karışık bir örnekten ayırır, böylece tek tek proteinler tanımlanabilir. Haritadaki her nokta farklı bir proteini temsil eder.

Şekil 5. *E. coli*’den bir 2D-PAGE haritası

Şekil 5. E. coli’den bir 2D-PAGE haritası

2D jel elektroforezi kullanarak, standart yüksek yoğunluklu veri dizileri ile sonuçlanan, çok hassas protein ayırmalarına izin verir. Dolayısıyla, otomatik görüntü analizine ve niceliğe tabi tutulabilir ve doğru karşılaştırmalı çalışmalar için kullanılabilir. 2D jel teknolojisini modern moleküler biyoloji yöntemlerinin ön saflarına yerleştiren diğer gelişme, kütle spektrometresi kullanılarak jeldeki her noktayı kimyasal olarak analiz etme kapasitesidir. Bu, ölçülebilir biyokimyasal fenomen (bu noktada bulunan proteinin sekansına doğrudan bağlanacak) jel üzerindeki belirli bir noktada bulunan protein miktarı sağlar.

2D-PAGE Analizinde Bilişim Sorunları

2D-PAGE jel görüntüleri için analiz yolu esasen mikrodiziler için oldukça benzerdir. İlk adım, jeldeki lekelerin konumlarının tanımlandığı ve farklı noktalar arasındaki sınırların çözüldüğü bir görüntü analizidir. Jeldeki her protein için moleküler ağırlık ve izoelektrik nokta (PI), pozisyona göre tahmin edilebilir.

Daha sonra noktalar tanımlanır ve belirli bir nokta ile onun gen dizisi arasındaki bağlantıyı yapmak için dizi bilgisi kullanılır. Proteome analizinde, immobilize proteinler ya in situ olarak dizilebilir ya da protein noktaları jelden fiziksel olarak çıkarılabilir, uzaklaştırılabilirler ve elektrosprey iyonizasyon kütle spektrometrisi (ESI-MS) veya matris destekli lazer desorpsiyonu gibi kütle spektrometri yöntemleri (iyonizasyon kütle spektrometresi, MALDI) kullanılarak analiz edilir.

Proteomik Analiz Araçları

Web’de proteomik analizi için çeşitli kamuya açık programlar mevcuttur. Bunların çoğuna Uzman Protein Analiz Sistemindeki (ExPASy) mükemmel proteomik kaynağı aracılığıyla erişilebilir. ExPASy, proteomik, genomik, filogenetik, sistem biyolojisi, populasyon genetiği, transkriptomik vb. Dahil olmak üzere yaşam bilimlerinin farklı alanlarında bilimsel veri tabanlarına ve yazılım araçlarına (kaynaklara) erişim sağlayan İsviçre Biyoenformatik Kaynak Portalı Enstitüsü’dür.

Biyokimyasal Yol Veritabanları

Gen ve protein ekspresyonu, genetik kodun fenotipe çevrilmesinde sadece iki adımdır. Genler eksprese edildikten ve proteinlere dönüştürüldükten sonra, ürünleri Şekil 6’da gösterildiği gibi karmaşık biyokimyasal etkileşimlere katılırlar. Her yol, diğer yollara kimyasal öncüler sağlayabilir, bu da her proteinin tek bir yola sahip olduğu, ancak muhtemelen birkaç yoldaki basamaklardan da geçtiği anlamına gelir. Metabolik yolakların karmaşık dallanmasının, genlerin ve genomların lineer sekanslarından daha iyi temsil edilmesi ve araştırılması daha zordur.

Şekil 6. Kompleks bir metabolik yol

Şekil 6. Kompleks bir metabolik yol

Birçok web tabanlı hizmet, metabolik yol bilgilerine erişim sunar.

KEGG

İnternetteki en iyi bilinen metabolik yol kaynakları, Genler ve Genomların Kyoto Ansiklopedisi (KEGG)’dir. KEGG metabolik gözden geçirmeleri sadece metinlerden ziyade harita illüstrasyonları olarak sunar ve görsel-odaklı kullanıcı için daha kolay kullanılabilir. KEGG ayrıca, EC sayılarının ve bunlara karşılık gelen enzimlerin listelenmesini ve enzim ve ligand terminolojisini ayrıntılı olarak tanımlayan bölgelere birçok faydalı link de sunmaktadır. KEGG ile ilişkili LIGAND veritabanı, biyokimyasal yollarda yer alan küçük molekülleri tanımlamak için yararlı bir kaynaktır. KEGG, dizi homolojisi, anahtar kelime ve kimyasal varlık tarafından aranabilir; Ayrıca iki küçük molekülün LIGAND ID kodlarını girebilir ve bunları birleştiren tüm olası metabolik yolları bulabilirsiniz.

PathDB

PathDB başka bir metabolik yol veritabanı türüdür. KEGG (bileşiklerin ve metabolik proteinlerin özdeşlikleri) ve bu varlıkları bağlayan adımlar hakkında bilgi ile aynı bilgiyi içerdiği halde, bilgiyi diğer metabolik veri tabanlarından çok daha esnek bir şekilde ele alır. Aramaları keyfi metabolik yollara sınırlamak ve önceden algılanan görüntülerle yolları tanımlamak yerine, PathDB, A noktasından B noktasına veya A bileşenini B bileşenine bağlayan herhangi bir bağlantılı reaksiyon seti bulmanızı sağlar. PathDB, normal arama araçlarına ek olarak seçilen herhangi bir yolu gözden geçirmenizi ve yolun farklı gösterimlerini görüntülemenizi sağlayan bir yol görselleştirme arayüzü içerir.

Funding

Disclaimer

The European Commission support for the production of this publication does not constitute endorsement of the contents which reflects the views only of the authors, and the Commission cannot be held responsi-ble for any use which may be made of the information contained therein.