LO3: Τεχνολογίες Omics και Βιολογία

Εργαλεία Γονιδιωματικής και Πρωτεομικής

Οι μέθοδοι στοίχισης αλληλουχιών μπορούν να χρησιμοποιηθούν για να αναλυθεί μία απλή αλληλουχία ή δομή και να συγκριθούν πολλαπλές αλληλουχίες μήκους ενός γονιδίου. Αυτές οι μέθοδοι μπορούν να βοηθήσουν στην κατανόηση της λειτουργίας ενός συγκεκριμένου γονιδίου ή του μηχανισμού δράσης μιας συγκεκριμένης πρωτεΐνης. Εντούτοις, είναι επίσης ενδιαφέρον να κατανοήσουμε πώς οι λειτουργίες των γονιδίων εκδηλώνονται ως εμφανή εξωτερικά χαρακτηριστικά ενός οργανισμού: τον φαινότυπο. Από την άποψη αυτή, υπάρχουν ορισμένα είδη δεδομένων και εργαλεία που επιτρέπουν τη μελέτη της λειτουργίας όλων των γονιδίων σε ένα γονιδίωμα.

Οι πειραματικές στρατηγικές για την ανάλυση ενός γονιδίου ή μιας πρωτεΐνης αντικαθίστανται προοδευτικά από παράλληλες προσεγγίσεις στις οποίες εξετάζονται ταυτόχρονα πολλά γονίδια. Χρησιμοποιώντας αλγορίθμους βιοπληροφορικής μπορούν να ενσωματωθούν πληροφορίες από πολλαπλές πηγές για να σχηματίσουν μια πλήρη εικόνα της γονιδιωματικής λειτουργίας και της έκφρασής της, καθώς και να επιτρέψουν τη σύγκριση μεταξύ των γονιδιωμάτων διαφόρων οργανισμών. Η Εικόνα 1 δείχνει πώς μετασχηματίζονται οι πληροφορίες του γονιδιώματος σε φαινοτυπική έκφραση.

Εικόνα 1. Μεταφορά πληροφοριών γονιδιώματος στον φαινότυπο

Εικόνα 1. Μεταφορά πληροφοριών γονιδιώματος στον φαινότυπο

Για δεκαετίες οι βιολόγοι συλλέγουν πληροφορίες από μοριακό έως κυτταρικό επίπεδο, περισσότερο για να διερευνήσουν τις λειτουργίες του γονιδιώματος στο σύνολό τους. Η χρήση της βιοπληροφορικής διευκολύνει σημαντικά τη διαδικασία αυτοματοποίησης και κλιμάκωσης του βιοχημικού πειραματισμού, και την επεξεργασία των βιοχημικών δεδομένων ως δημόσια βάση δεδομένων.

Το Πρόγραμμα χαρτογράφισης του Ανθρώπινου Γονιδιώματος δεν έχει δημιουργήσει μόνο gigabytes διαθέσιμων πληροφοριών της βιολογικής αλληλουχίας, αλλά λειτούργησε ως παράδειγμα και έτσι έχει αρχίσει να αλλάζει ολόκληρο το τοπίο της έρευνας στη βιολογία. Ο προσδιορισμός της δομής των πρωτεϊνών δεν έχει ακόμη αυτοματοποιηθεί στο ίδιο επίπεδο με τον προσδιορισμό της αλληλουχίας, αλλά ξεκινούν διάφορες εργασίες στη δομική γονιδιωματική, με κύριο στόχο τη δημιουργία προσεγγίσεων υψηλής ταχύτητας για τον προσδιορισμό της δομής. Η κεντρική ιδέα της μεθόδου των μικροσυστοιχιών DNA επιτρέπει την εκτέλεση ολοκληρωμένων βιοχημικών πειραμάτων και πειραμάτων μοριακής βιολογίας.

Ένα από τα σημαντικότερα καθήκοντα της βιοπληροφορικής είναι η δημιουργία συστημάτων λογισμικού για τη διαχείριση των πληροφοριών που μπορούν να επεξηγήσουν αποτελεσματικά κάθε τμήμα μιας αλληλουχίας του γονιδιώματος παρέχοντας πληροφορίες σχετικά με τη λειτουργία του, από τη πρωτεϊνική δομή του προϊόντος του (αν υπάρχει), έως το επίπεδο έκφρασης του γονίδιου σε διαφορετικά στάδια της ζωής ενός οργανισμού. Επίσης, τα συστήματα διαχείρισης πληροφοριών του γονιδιώματος επιτρέπουν στους χρήστες να κάνουν εύκολες συγκρίσεις δια γυμνού οφθαλμού μεταξύ μεγάλων συνόλων δεδομένων. Αναπτύσσονται πολλές νέες εργασίες ενσωμάτωσης δεδομένων, από την σύγκριση δια γυμνού οφθαλμού πολλαπλών γονιδιωμάτων έως την ενσωμάτωση των δεδομένων έκφρασης στα δεδομένα του χάρτη του γονιδιώματος.

Αλληλούχιση Γονιδίων και Γονιδιωμάτων

Μία από τις πρώτες υπολογιστικές προκλήσεις στη διαδικασία αλληλούχισης ενός γονιδίου (ή ενός γονιδιώματος) είναι η ερμηνεία του μοτίβου των θραυσμάτων σε ένα πήκτωμα ηλεκτροφόρησης.

Ανάλυση των Ακατέργαστων Δεδομένων Αλληλουχίας: Basecalling

Η διαδικασία εκχώρησης μιας αλληλουχίας στα ακατέργαστα δεδομένα που προκύπτουν από την αλληλούχιση του DNA ονομάζεται basecalling. Αν αυτή η διαδικασία δεν παράγει τη σωστή αλληλουχία DNA, τότε επηρεάζεται οποιαδήποτε μεταγενέστερη ανάλυση της αλληλουχίας. Όλες οι αλληλουχίες που κατατίθενται σε δημόσιες βάσεις δεδομένων επηρεάζονται από basecalling σφάλματα λόγω αμφιβολιών περί της απόδοσης της συσκευής αλληλούχισης και των αποτελεσμάτων της, ή των δυσλειτουργιών του εξοπλισμού. Η μελέτη των αλληλουχιών των EST (Expressed Sequence Tags) και του γονιδιώματος έχουν τα υψηλότερα ποσοστά σφαλμάτων (1/10 - 1/100 σφάλματα ανά βάση), και ακολουθούν οι ολοκληρωμένες αλληλουχίες από μικρά εργαστήρια (1/100 - 1/1.000 ανά βάση) και οι ολοκληρωμένες αλληλουχίες από κέντρα αλληλούχισης μεγάλων γονιδιωμάτων (1/10.000 - 1/100.000 ανά βάση). Οποιαδήποτε καταχωρημένη αλληλουχία στη GenBank είναι πιθανό να έχει τουλάχιστον ένα σφάλμα. Η βελτίωση της τεχνολογίας της αλληλούχισης, και ειδικότερα η ανίχνευση του σήματος και η διαδιακασία της αλληλούχισης του DNA, εξακολουθεί να αποτελεί αντικείμενο έρευνας.

Υπάρχουν δύο δημοφιλείς μέθοδοι υψηλής απόδοσης για την αλληλούχιση του DNA. Η αλληλούχιση του DNA βασίζεται στην ικανότητα δημιουργίας μιας “σκάλας” από θραύσματα του DNA σε ανάλυση μίας βάσης, και διαχωρισμού των θραυσμάτων DNA με ηλεκτροφόρηση πηκτής. Γενικά, το κατακερματισμένο DNA σημαίνεται με τέσσερις διαφορετικές φθορίζουσες ουσίες-ετικέτες, μία ετικέτα ειδική ανά βάση για κάθε θραύσμα, και “τρέχει” ένα μίγμα των τεσσάρων δειγμάτων σε μία διαδρομή της πηκτής. Σύμφωνα με μια άλλη μέθοδος αλληλούχισης που συνήθως χρησιμοποιείται, κάθε δείγμα “τρέχει” σε μια ξεχωριστή γειτονική διαδρομή. Και στις δύο περιπτώσεις, η πηκτή σαρώνεται με ένα λέιζερ, το οποίο διεγείρει κάθε φθορίζουσα ζώνη που υπάρχει στη πηκτή. Κάθε ένα από αυτά τα πρωτόκολλα έχει τα πλεονεκτήματά του σε διάφορους τύπους πειραμάτων, επομένως χρησιμοποιούνται και τα δύο.

Υπάρχουν διάφορα εμπορικά και μη εμπορικά εργαλεία για αυτοματοποιημένο basecalling (ανάλυση ανά βάση). Ορισμένα από αυτά είναι πλήρως ενσωματωμένα με συγκεκριμένο υλικό αλληλούχισης και τύπους δεδομένων καταχώρησης. Τα περισσότερα από αυτά επιτρέπουν, και στην πραγματικότητα απαιτούν, την επιμέλεια από έναν έμπειρο χρήστη καθώς προσδιορίζεται η αλληλουχία.

Το ακατέργαστο αποτέλεσμα της αλληλούχισης είναι μια καταγραφή των εντάσεων φθορισμού σε κάθε θέση σε μία πηκτή αλληλούχισης. Η Εικόνα 2 δείχνει το παραγόμενο αποτέλεσμα του ανιχνευτή από ένα σύγχρονο πείραμα αλληλούχισης. Η πρόκληση για το αυτοματοποιημένο λογισμικό basecalling είναι να μεταφράσει τις κορυφές φθορισμού σε κώδικα νουκλεοτιδικής αλληλουχίας τεσσάρων γραμμάτων. Καθώς ο διαχωρισμός των ζωνών σε μια πηκτή αλληλούχισης δεν είναι τέλειος, η ποιότητα του διαχωρισμού και το σχήμα των ζωνών επιδεινώνεται σε όλο το μήκος της πηκτής. Οι κορυφές διευρύνονται και αναμιγνύονται, και σε κάποια στιγμή (συνήθως στις 400-500 βάσεις) οι κορυφές καθίστανται αδύνατο να διαχωριστούν. Είναι κατανοητό ότι προκύπτουν σφάλματα του συστήματος, και έτσι αναπτύσσονται οι αλγόριθμοι των υπολογιστών ώστε να τα αντισταθμίζει. Ο βασικός στόχος του λογισμικού basecalling είναι η βελτίωση της ακρίβειας της ανάγνωσης κάθε αλληλουχίας, καθώς και η επέκταση του εύρους των διαδρομών αλληλούχισης, για την διευθέτηση των συγκεχυμένων κορυφών φθορισμού στο τέλος της διαδικασίας.

Εικόνα 2. Το παραγόμενο αποτέλεσμα του ανιχνευτή από ένα πείραμααλληλούχισης

Εικόνα 2. Το παραγόμενο αποτέλεσμα του ανιχνευτή από ένα πείραμα αλληλούχισης

Οι σύγχρονες τεχνολογίες αλληλούχισης αντικαθιστούν τα πηκτώματα με μικροσκοπικά τριχοειδή συστήματα (τριχοειδής ηλεκτροφόρηση), αλλά οι βασικές αρχές της διαδικασίας είναι οι ίδιες με αυτές της αλληλούχισης που βασίζεται σε πηκτή: κατακερματισμός του DNA και διαχωρισμός των μεμονωμένων θραυσμάτων με τη διαδικασία της ηλεκτροφόρησης.

Αλληλούχιση ενός Ολόκληρου Γονιδιώματος

Η αλληλούχιση του γονιδιώματος δεν είναι απλώς μια καλύτερη έκδοση της αλληλούχισης ενός γονιδίου. Το όριο του μήκους της αλληλουχίας είναι περίπου 500 ζεύγη βάσεων. Το μήκος ενός γονιδιώματος μπορεί να κυμαίνεται από δεκάδες χιλιάδες έως δισεκατομμύρια ζεύγη βάσεων. Έτσι, προκειμένου να γίνει αλληλούχιση ενός ολόκληρου γονιδιώματος, το γονιδίωμα πρέπει να χωριστεί σε τμήματα, και στη συνέχεια τα τμήματα της αλληλουχίας πρέπει να επανασυναρμολογηθούν σε μια συνεχή αλληλουχία.

Υπάρχουν δύο δημοφιλείς στρατηγικές για την αλληλούχιση των γονιδιωμάτων: την μέθοδο της παράλληλης αλληλούχισης (shotgun) με τυχαία πέψη και αλληλούχιση των τμημάτων DNA, και την μέθοδο των συνεχών κλώνων (clone contig), τη δημιουργία συστοιχίας DNA κλώνων με μερικώς επικαλυπτόμενα ένθετα τμήματα. Συνδυασμοί αυτών των μεθόδων χρησιμοποιούνται συχνά για την αλληλούχιση μεγαλύτερων γονιδιωμάτων.

Η μέθοδος shotgun

Η αλληλούχιση του DNA με την μέθοδο της «τυφλής» κλωνοποίησης ή κλωνοποίηση τυχαίας προσπέλαση (shotgun) είναι μια αυτοματοποιημένη προσέγγιση για την αλληλούχιση του DNA. Σε αυτή τη μέθοδο, το DNA διασπάται με πέψη σε τυχαία θραύσματα μήκους περίπου 2.000 KB. Τα τμήματα αυτά κλωνοποιούνται σε κατάλληλους φορείς - πλασμίδια (κατασκευή γονιδιωματικής βιβλιοθήκης). Εάν μια αρκετά μεγάλη ποσότητα γονιδιωματικού DNA είναι κατακερματισμένη, το σύνολο των κλώνων εκτείνεται για κάθε ζεύγος βάσεων του γονιδιώματος πολλές φορές. Έπειτα, το άκρο κάθε κλωνοποιημένου DNA τμήματος υπόκειται σε αλληλούχιση, ή σε μερικές περιπτώσεις και τα δύο άκρα. Αν και μόνο 400-500 βάσεις στο άκρο (-α) του τμήματος υπόκεινται σε αλληλούχιση, εάν επιλεχθούν τυχαία αρκετοί κλώνοι από τη βιβλιοθήκη, η ποσότητα του DNA που αλληλουχίθηκε εξακολουθεί να περιλαμβάνει κάθε ζεύγος βάσεων του γονιδιώματος αρκετές φορές. Το τελικό βήμα στην αλληλούχιση αυτή είναι η συναρμολόγηση της αλληλουχίας. Συνήθως, η συναρμολόγηση των αλληλουχιών έχει ως αποτέλεσμα πολλαπλά contigs - σαφώς συναρμολογημένα μήκη αλληλουχίας που δεν αλληλεπικαλύπτονται μεταξύ τους. Τα τελικά βήματα στην αλληλούχιση ενός πλήρους γονιδιώματος με shotgun αλληλούχιση είναι είτε η εύρεση κλώνων που μπορούν να συμπληρώσουν τις περιοχές που λείπουν, είτε η χρήση της μεθόδου της PCR ή άλλες τεχνικές για να ενισχυθεί η αλληλουχία DNA από τα κενά.

Η μέθοδος των συνεχών κλώνων

Η μέθοδος των συνεχών κλώνων (clone contig) βασίζεται επίσης στην shotgun αλληλούχιση, αλλά σε μικρότερη κλίμακα. Αντί να ξεκινήσει με τον κατακερματισμό ολόκληρου του γονιδιώματος σε τυχαία θραύσματα, η μέθοδος των συνεχών κλώνων ξεκινά με την πέψη σε θέσεις περιορισμού, τα τμήματα που προκύπτουν στη συνέχεια μπορούν να κλωνοποιηθούν σε τεχνητούς χρωμοσωμικούς φορείς και να ενισχυθούν. Κάθε ένα από τα κλωνοποιημένα θραύσματα μπορεί να αλληλουχηθεί και να συναρμολογηθεί βάσει της τυποποιημένης μεθόδου shotgun. Όταν το γονιδίωμα διασπάται σε τμήματα περιορισμού, αποικοδομείται μόνο μερικώς. Η ποσότητα του περιοριστικού ενζύμου που εφαρμόζεται στο δείγμα DNA είναι επαρκής για να πέψει μόνο περίπου το 50% των διαθέσιμων θέσεων περιορισμού στο δείγμα. Αυτό σημαίνει ότι ορισμένα τμήματα θα ανοίξουν σε μια συγκεκριμένη περιοχή περιορισμού, ενώ άλλα τμήματα θα κοπούν σε αυτή τη συγκεκριμένη θέση και θα ανοίξουν άλλες θέσεις περιορισμού. Έτσι, η γονιδιωματική βιβλιοθήκη (κλώνων) που θα προκύψει από αυτά τα περιοριστικά θραύσματα θα περιέχει επικαλυπτόμενα τμήματα. Η διαδικασία της συναρμολόγησης ξεκινά με το λεγόμενο Χρωμοσωμικό περπάτημα («βάδισµα»). Βρίσκοντας έναν συγκεκριμένο κλώνο, στη συνέχεια βρίσκοντας τον επόμενο κλώνο που τον επικαλύπτει και μετά τον επόμενο κτλ. Συνήθως, χρησιμοποιείται μια τεχνική υβριδισμού με ανιχνευτή ή η PCR για να βοηθήσει στην αναγνώριση του περιοριστικού θραύσματος που έχει εισαχθεί σε κάθε κλώνο.

Τα γονιδιώματα μπορούν να χαρτογραφηθούν σε διάφορα επίπεδα λεπτομέρειας. Θα μπορούσαν να δημιουργηθούν γενετικοί χάρτες σύνδεσης οι οποίοι κατανέμουν τα γονίδια που δημιουργούν συγκεκριμένα χαρακτηριστικά σε συγκεκριμένους γενετικούς τόπους στο χρωμόσωμα. Έτσι, παρέχουν μια σειρά από εντοπισμένους δείκτες, μερικές φορές πολύ λεπτομερείς ανάλογα με τον οργανισμό, οι οποίοι μπορούν να βοηθήσουν τους ερευνητές να κατανοήσουν τη λειτουργία του γονιδιώματος (και να παράσχουν ένα πλαίσιο για τη κατασκευή ενός πλήρους γενετικού χάρτη). Επίσης, οι φυσικοί χάρτες μπορούν να κατασκευαστούν με διάφορους τρόπους: με την πέψη του DNA με περιοριστικά ένζυμα που κόβουν σε συγκεκριμένες θέσεις, αναπτύσσοντας βιβλιοθήκες διατεταγμένων κλώνων, και με μικροσκοπία φθορισμού των μορίων DNA μονής πέψης περιορισμού, στερεωμένα σε γυάλινο υπόστρωμα. Το βασικό στοιχείο σε κάθε μέθοδο είναι ότι, χρησιμοποιώντας έναν συνδυασμό σημασμένων ανιχνευτών και γνωστών γενετικών δεικτών (στην χαρτογράφηση περιορισμού) ή με τον εντοπισμό επικαλυπτόμενων περιοχών (στη δημιουργία βιβλιοθήκης), τα θραύσματα ενός γονιδιώματος μπορούν να ταξινομηθούν σωστά σε ένα πολύ εξειδικευμένο χάρτη.

Λογισμικό LIMS: Παρακολούθηση αλληλουχιών μικρού μήκους

Η παρακολούθηση των εκατομμυρίων μοναδικών δειγμάτων DNA που μπορεί να απομονωθούν από το γονιδίωμα είναι μία από τις μεγαλύτερες προκλήσεις στον τομέα της τεχνολογίας των πληροφοριών. Τα συστήματα που διαχειρίζονται τα παραγόμενα προϊόντα από την υψηλής απόδοσης αλληλούχιση ονομάζονται Πληροφοριακά Συστήματα Διαχείρισης Εργαστηριακών Δεδομένων (LIMS), και η ανάπτυξη και η συντήρησή τους αποτελούν το μεγαλύτερο μερίδιο της βιοπληροφορικής σε βιομηχανικές εγκαταστάσεις. Άλλες τεχνολογίες υψηλής απόδοσης, όπως οι μικροσυστοιχίες και η χημειοπληροφορική, απαιτούν επίσης την πολύπλοκη υποστήριξη των LIMS.

Συναρμολόγηση αλληλουχίας

Το Basecalling είναι μόνο το πρώτο βήμα στη συγκέντρωση μιας πλήρους αλληλουχίας του γονιδιώματος (Εικόνα 3). Μόλις ληφθούν τα σύντομα θραύσματα της αλληλουχίας, πρέπει να συναρμολογηθούν σε μια πλήρη αλληλουχία που μπορεί να είναι πολλές χιλιάδες φορές το μήκος τους. Το επόμενο βήμα είναι η συναρμολόγηση της αλληλουχίας.

Η αλληλούχιση του DNA χρησιμοποιώντας μια μέθοδο shotgun παρέχει χιλιάδες ή εκατομμύρια αλληλουχίες μικρού μήκους, περίπου τμήματα μήκους 400-500 βάσεων. Τα θραύσματα είναι τυχαία και μπορούν να επικαλύπτονται μερικώς ή πλήρως μεταξύ τους. Λόγω αυτών των αλληλοεπικαλύψεων, κάθε θραύσμα μπορεί να ταυτοποιηθεί με την ταυτότητα αλληλουχίας ως γειτονική με κάποιο αριθμό άλλων θραυσμάτων. Κάθε ένα από αυτά τα θραύσματα επικαλύπτει ακόμη μια άλλη ομάδα θραυσμάτων και ούτω καθεξής. Τέλος, όλα τα θραύσματα πρέπει να συνδεθούν άριστα μαζί σε μία συνεχή αλληλουχία. Ωστόσο, οι επαναλαμβανόμενες αλληλουχίες μπορούν να περιπλέξουν τη διαδικασία της συναρμολόγησης. Εάν ορισμένα θραύσματα είναι μη κλωνοποιημένα και η διαδικασία αλληλούχισης θα αποτύχει, καθώς δημιουργούνται κενά στην αλληλουχία DNA τα οποία περιπλέκουν την αυτοματοποιημένη συναρμολόγηση. Εάν δεν υπάρχει επαρκής πληροφορία σε κάποιο σημείο της αλληλουχίας για να συνεχιστεί η συναρμολόγηση, η αλληλουχία contig που δημιουργείται τελειώνει, και ξεκινά ένα νέο contig.

Εικόνα 3. Η μέθοδος αλληλούχισης shotgun του DNA

Εικόνα 3. Η μέθοδος αλληλούχισης shotgun του DNA

Πρόσβαση σε Πληροφορίες Γονιδιώματος στον Ιστό

Στην GenBank διατίθενται ελλιπείς ή πλήρεις αλληλουχίες DNA από εκατοντάδες γονιδιώματα. Ο συνδυασμός αυτών των αρχείων αλληλουχίας σε μια κατανοητή αναπαράσταση της δομής του γονιδιώματος δεν είναι τόσο εύκολη. Υπάρχουν αρκετές προσπάθειες που βρίσκονται σε εξέλιξη για την ενσωμάτωση της αλληλουχίας DNA με υψηλότερου επιπέδου χάρτες γονιδιωμάτων σε μια μορφή “φιλική” προς το χρήστη. Μέχρι στιγμής, αυτές οι προσπάθειες επικεντρώνονται στο ανθρώπινο γονιδίωμα και σε γονιδιώματα σημαντικών φυτικών και ζωικών μοντέλων.

NCBI Genome Resources

Το NCBI προσφέρει πρόσβαση σε ένα ευρύ φάσμα εργαλείων ανάλυσης του γονιδιώματος στο διαδίκτυο από την ενότητα Genomic Biology της κύριας ιστοσελίδας του. Οι διασυνδέσεις τους είναι φιλικές προς το χρήστη, και η NCBI παρέχει πολλές οδηγίες που εξηγούν πώς να χρησιμοποιούνται τα παρεχόμενα εργαλεία και οι βάσεις δεδομένων.

Μερικά από τα διαθέσιμα γονιδιωματικά εργαλεία είναι:

Πληροφορίες γονιδιώματος (Genome Information)

Οι πληροφορίες γονιδιώματος είναι διαθέσιμες από τη σελίδα Entrez Genomes στο NCBI. Οι λίστες βάσεων δεδομένων είναι διαθέσιμες για την πλήρη βάση δεδομένων ή για συναφείς ομάδες οργανισμών, όπως μικροοργανισμοί, αρχαίοι, βακτηρίδια, ευκαρυωτικά και ιούς. Κάθε είσοδος στη βάση δεδομένων συνδέεται με μια είσοδο στον φυλλομετρητή ταξινόμησης ή την αρχική σελίδα με περαιτέρω συνδέσμους με διαθέσιμες πληροφορίες σχετικά με τον οργανισμό. Αν υπάρχει διαθέσιμος ένας γενετικός χάρτης του οργανισμού, εμφανίζεται στην αρχική σελίδα του οργανισμού ένας σύνδεσμος "Δείτε το γονιδίωμα". Από την αρχική σελίδα, μπορείτε επίσης να κάνετε λήψη αλληλουχιών του γονιδιώματος και των αναφορών.

Πρόγραμμα προβολής χαρτών (Map Viewer)

Ανάλογα με το γονιδίωμα, μπορείτε να έχετε πρόσβαση σε συνδέσμους για να βρείτε χάρτες που δείχνουν γνωστές περιοχές κωδικοποίησης πρωτεϊνών, καταχωρίσεις περιοχών που κωδικοποιούν για πρωτεΐνες και RNA, και άλλες πληροφορίες. Το πρόγραμμα Map Viewer διακρίνει τέσσερα επίπεδα πληροφοριών: την αρχική σελίδα του οργανισμού, την γραφική απεικόνιση του γονιδιώματος, τον λεπτομερή χάρτη για κάθε χρωμόσωμα (σε έναν κύριο χάρτη από τον οποίο ο χρήστης μπορεί να επιλέξει το σημείο που θέλει να κάνει zoom in), και την προβολή της αλληλουχίας, το οποίο παρουσιάζει γραφικά τις επισημειώσεις για τις περιοχές της αλληλουχίας του γονιδιώματος.

Πρόγραμμα εύρεσης ORF (ORF Finder)

Το Open Reading Frame (ORF) Finder είναι ένα εργαλείο για τον εντοπισμό ανοιχτών πλαισίων ανάγνωσης σε μια αλληλουχία DNA εντοπίζοντας τα βασικά και τα εναλλακτικά κωδικώνια έναρξης και λήξης. Ο ORF Finder μεταφράζει την αλληλουχία χρησιμοποιώντας πρότυπο ή γενετικό κώδικα που καθορίζεται από τον χρήστη. Στο μη κωδικοποιόν DNA, συχνά εντοπίζονται κωδικόνια λήξης. Οι πληροφορίες που προκύπτουν από τον ORF Finder μπορούν να δώσουν συμβουλές σχετικά με το ακριβές πλαίσιο ανάγνωσης για μια αλληλουχία DNA και σχετικά με το πού ξεκινούν οι κωδικοποιούσες περιοχές και πού σταματούν. Για πολλά γονιδιώματα που υπάρχουν στη βάση δεδομένων Entrez Genomes, το ORF Finder είναι διαθέσιμο ως ολοκληρωμένο εργαλείο από την προβολή του χάρτη του γονιδιώματος.

HomoloGene

Το HomoloGene είναι ένα αυτοματοποιημένο σύστημα για την κατασκευή πιθανών ομάδων ομολογίας από πλήρη σύνολα γονιδίων μιας ευρείας γκάμας ευκαρυωτικών ειδών. Τα ορθόλογα ζεύγη αναγνωρίζονται είτε από τις αναφορές της βιβλιογραφίας είτε από τον υπολογισμό της ομοιότητας. Στη βάση δεδομένων HomoloGene μπορεί να πραγματοποιηθεί αναζήτηση χρησιμοποιώντας σύμβολα γονιδίων, ονόματα γονιδίων, αριθμούς πρόσβασης GenBank, και άλλα χαρακτηριστικά.

Ομάδες ορθόλογων (Clusters of Orthologous Groups, COG)

Το COG είναι μια βάση δεδομένων για ορθόλογες πρωτεϊνικές ομάδες. Αυτή η βάση δεδομένων αναπτύχθηκε με τη σύγκριση πρωτεϊνικών αλληλουχιών σε 97 γονιδιώματα. Οι καταχωρίσεις στο COG αντιπροσωπεύουν τις λειτουργίες του γονιδιώματος που διατηρούνται σε όλη την ιστορία της εξέλιξης. Στη βάση δεδομένων COG μπορεί να γίνει αναζήτηση βάσει της κατηγορίας λειτουργιών, φυλογενετικού προτύπου και μιας σειράς άλλων ιδιοτήτων.

Επισηµείωση γονιδιώµατος

Η επισημείωση του γονιδιώματος στην πράξη είναι η υπερσύνδεση του περιεχομένου μεταξύ πολλαπλών βάσεων δεδομένων - αλληλουχίας, δομής και λειτουργικής γονιδιωματικής, που είναι πλήρως συνδεδεμένες μεταξύ τους σε ένα συστήματος αναζήτησης. Είναι μια δύσκολη διαδικασία επειδή υπάρχει ένας τεράστιος αριθμός διαφορετικών πληροφοριών που συνδέονται με κάθε γονίδιο του γονιδιώματος, και βασίζεται γενικά σε σχεσιακές βάσεις δεδομένων για την ενσωμάτωση πληροφοριών της αλληλουχίας του γονιδιώματος με άλλα δεδομένα.

Σύγκριση γονιδιώματος

Η σύγκριση κατά ζεύγη ή η πολλαπλή σύγκριση των γονιδιωμάτων είναι το εργαλείο που μπορεί να χρησιμοποιηθεί σε πολλές διαφορετικές μελέτες, όπως κατά την εύρεση απαντήσεων σε βασικά ερωτήματα της εξελικτικής βιολογίας (γενετικοί πολυμορφισμοί) ή σε πολύ συγκεκριμένα κλινικά ερωτήματα (τροποποιήσεις στον φαινότυπο).

Η σύγκριση ολόκληρων των γονιδιωμάτων, αντί να συγκρίνουμε μόνο τα γονίδια ένα κάθε φορά, μπορεί να βοηθήσει στον καθορισμό των περιοχών ομοιότητας με το μη χαρακτηρισμένο DNA ή ακόμα και το υποτιθέμενο πλεονάζον DNA. Η σύγκριση του γονιδιώματος θα βοηθήσει επίσης στη επισημείωση του γονιδιώματος. Οι πρωτότυπες συγκρίσεις του γονιδιώματος επιτρέπουν την αιτιολόγηση της αλληλουχίας των επιπρόσθετων γονιδιωμάτων, και είναι χρήσιμες τόσο σε επίπεδο κατασκευής του χάρτη όσο και απευθείας σε επίπεδο αλληλουχίας.

PipMaker

Το PipMaker είναι ένα εργαλείο που υπολογίζει τις στοιχίσεις παρόμοιων περιοχών σε δύο αλληλουχίες DNA. Είναι χρήσιμο εργαλείο για την ταυτοποίηση μεγάλων μοτίβων ομοιότητας σε μεγαλύτερες αλληλουχίες. Η διαδικασία χρήσης του PipMaker είναι σχετικά απλή. Ξεκινώντας με δύο αρχεία αλληλουχίας σε μορφή FASTA, δημιουργείτε πρώτα ένα σύνολο οδηγιών για την κάλυψη των επαναλήψεων της αλληλουχίας (χρησιμοποιώντας το διακομιστή RepeatMasker). Αυτό μειώνει τον αριθμό των περιοχών που δεν φέρουν σημαντική πληροφορία, στη σύγκριση της αλληλουχίας. Οι πληροφορίες που προκύπτουν, καθώς και ένα απλό αρχείο που περιέχει έναν αριθμητικό κατάλογο των γνωστών θέσεων των γονιδίων, υποβάλλονται στον κεντρικό υπολογιστή PipMaker στο Πολιτειακό Πανεπιστήμιο της Πενσυλβάνια και τα αποτελέσματα αυτά αποστέλλονται μέσω ηλεκτρονικού ταχυδρομείου σε εσάς.

MUMmer

Ένα άλλο πρόγραμμα εξαιρετικά γρήγορης στοίχισης των μεγάλης κλίμακας αλληλουχιών DNA και πρωτεϊνών είναι το MUMmer. Η πρώτη εφαρμογή του προγράμματος ήταν μια λεπτομερής σύγκριση γονιδιωμάτων δύο στελεχών του M. tuberculosis. Το MUMmer μπορεί να συγκρίνει αλληλουχίες μήκους εκατομμυρίων ζευγών βάσεων, και να παράγει πολύχρωμες απεικονίσεις των όμοιων περιοχών. Το MUMmer βασίζεται σε έναν αλγόριθμο που ονομάζεται δένδρο επιθεμάτων (suffix tree), το οποίο ουσιαστικά καθιστά εύκολο το σύστημα να χειρίζεται γρήγορα έναν μεγάλο αριθμό συγκρίσεων κατά ζεύγη. Το MUMmer μπορεί επίσης να στοιχίσει ατελή γονιδιώματα. Μπορεί εύκολα να χειριστεί 100 ή 1000 contigs από την αλληλούχιση shotgun και να τα στοιχίσει με μια άλλη ομάδα contigs ή ένα γονιδίωμα χρησιμοποιώντας το πρόγραμμα NUCmer που περιλαμβάνεται στο σύστημα. Εάν τα είδη είναι πολύ διαφορετικά για την στοίχιση της αλληλουχίας του DNA ώστε να ανιχνευθεί ομοιότητα, τότε το πρόγραμμα PROmer μπορεί να παράγει στοιχίσεις βασισμένες στις μεταφράσεις των έξι πλαισίων και των δύο αλληλουχιών εισόδου.

Λειτουργική γονιδιωματική

Η χρήση μεθόδων υψηλής ταχύτητας για τον προσδιορισμό της αλληλουχίας άλλαξε τον τρόπο με τον οποίο μελετάμε τις αλληλουχίες DNA που κωδικοποιούν πρωτεΐνες. Τώρα καθίσταται εφικτή η προβολή ολόκληρης της αλληλουχίας του DNA ενός χρωμοσώματος ως μια ενιαία οντότητα, και η εξέταση του τρόπου με τον οποίο τα μέρη του συνεργάζονται για να αποδώσουν την πολυπλοκότητα του οργανισμού στο σύνολό του.

Οι λειτουργίες του γονιδιώματος χωρίζονται σε μερικές προφανείς κατηγορίες: μεταβολισμός, ρύθμιση, σηματοδότηση, και κατασκευή. Τα μεταβολικά μονοπάτια μετατρέπουν τη χημική ενέργεια που προέρχεται από περιβαλλοντικές πηγές σε χρήσιμη ενέργεια για το κύτταρο. Τα ρυθμιστικά μονοπάτια είναι βιοχημικοί μηχανισμοί που ελέγχουν τη λειτουργία του γενωμικού DNA: όταν εκφράζεται ή όχι. Η γονιδιωματική ρύθμιση περιλαμβάνει όχι μόνο τα γονίδια που εκφράζονται αλλά και τα δομικά, και αλληλουχίες σήματος στο DNA όπου μπορούν να προσδεθούν σε ρυθμιστικές πρωτεΐνες. Τα σηματοδοτικά μονοπάτια ελέγχουν τις ροές των χημικών ουσιών από ένα διαμέρισμα του κυττάρου στο άλλο. Έχουν μελετηθεί πολλά ρυθμιστικά συστήματα για τον έλεγχο της μεταγραφής του DNA. Η χαρτογράφηση αυτών των μεταβολικών, ρυθμιστικών και σηματοδοτικών συστημάτων στην αλληλουχία του γονιδιώματος είναι ο στόχος της λειτουργικής γονιδιωματικής.

Ανάλυση της Γονιδιακής Έκφρασης βάσει αλληλουχίας

Εκτός από την αλληλουχία του γονιδιώματος, το GenBank περιέχει πολλά άλλα είδη αλληλουχίας DNA. Τα δεδομένα ετικέτας εκφρασμένης αλληλουχίας (expressed sequence tag, EST) για έναν οργανισμό μπορούν να είναι ένα εξαιρετικά χρήσιμο σημείο εκκίνησης για την ανάλυση της γονιδιακής έκφρασης. Οι ESTs είναι μερικές αλληλουχίες cDNA κλώνων του κυτταρικού mRNA. Τα επίπεδα mRNA ανταποκρίνονται στις αλλαγές μέσα στο κύτταρο ή στο περιβάλλον του. Τα επίπεδα mRNA εξαρτώνται από τον ιστό, και επίσης αλλάζουν κατά τη διάρκεια του κύκλου ζωής του οργανισμού. Η ποσοτικοποίηση του mRNA ή του cDNA αποτελεί έναν καλό τρόπο ελέγχου της λειτουργίας του γονιδίωματος υπό συγκεκριμένες συνθήκες.

Η NCBI προσφέρει μια βάση δεδομένων που ονομάζεται dbEST, η οποία παρέχει πρόσβαση σε αρκετές χιλιάδες βιβλιοθήκες EST. Αρκετές από αυτές είναι βιβλιοθήκες EST από άνθρωπο, αλλά υπάρχουν και βιβλιοθήκες από δεκάδες άλλους οργανισμούς.

DNA Μικροσυστοιχίες

Πρόσφατα, η νέα τεχνολογία επέτρεψε στους ερευνητές να διερευνήσουν πιο γρήγορα τα πρότυπα έκφρασης ολόκληρων των γονιδιωμάτων. Μια μικροσυστοιχία (ή, γονιδιακό ή γενωμικό "τσιπ") είναι ένα μικρή γυάλινη επιφάνεια η οποία είναι καλυμμένη με 20.000 ή περισσότερες ειδικές θέσεις, όπου κάθε μία περιέχει ένα διαφορετικό ολιγονουκλεοτίδιο. Επίσης, το cDNA μπορεί να προσκολληθεί στη επιφάνεια για να λειτουργήσουν ως ανιχνευτές. Άλλα μέσα, όπως οι λεπτές μεμβράνες, μπορούν να χρησιμοποιηθούν στη θέση των πλακιδίων. Το σημαντικό στοιχείο στο συγεκριμένο πείραμα είναι ότι κάθε θραύσμα του DNA είναι ακινητοποιημένο, και κάθε αντίδραση που έχει ως αποτέλεσμα μια αλλαγή στο σήμα των μικροσυστοιχιών μπορεί να αποδοθεί με ακρίβεια σε μια συγκεκριμένη αλληλουχία DNA.

Οι μικροσυστοιχίες δεν διαφέρουν εννοιολογικά από τα παραδοσιακά πειράματα υβριδισμού όπως τα Southern Blots ή Northern Blots. Στην παραδοσιακή αποτύπωση, ακινητοποιείται το δείγμα της πρωτεΐνης. Στα πειράματα μικροσυστοιχιών, ο ανιχνευτής ακινητοποιείται, και είναι πολύ μεγαλύτερη η ποσότητα των πληροφοριών που μπορεί να συλλεχθεί σε ένα πείραμα. Η Εικόνα 4 δείχνει μόνο ένα τμήμα μιας σάρωσης μικροσυστοιχίας.

Εικόνα 4. Σάρωση μικροσυστοιχίας

Εικόνα 4. Σάρωση μικροσυστοιχίας

Πρόσφατα, η τεχνολογία των μικροσυστοιχιών χρησιμοποιείται συνήθως για πειράματα αλληλούχισης του DNA. Για παράδειγμα, σε δοκιμασίες για την ανίχνευση πολυμορφισμών. Μια άλλη εξέλιξη είναι η χρήση μικροσυστοιχιών για ανάλυση της γονιδιακής έκφρασης. Όταν εκφράζεται ένα γονίδιο, παράγεται ένα μετάγραφο (mRNA). Εάν τοποθετηθούν στην μικροσυστοιχία ολιγομερή DNA που είναι συμπληρωματικά με τα υπό μελέτη γονίδια, το mRNA ή το cDNA μπορεί να υβριδοποιηθεί με το τσιπ, παρέχοντας μια ταχεία δοκιμασία για τον προσδιορισμό της έκφρασης ή μη έκφρασης αυτών των γονίδιων. Πειράματα όπως αυτά έχουν πραγματοποιηθεί σε ζυμομύκητες για να ελεχθούν οι διαφορές στα πρότυπα έκφρασης του ολικού γονιδιώματος σε απόκριση σε αλλαγές του περιβάλλοντος όπως στη συγκέντρωση των σακχάρων. Τα πειράματα μικροσυστοιχιών μπορούν να παρέχουν πληροφορίες σχετικά με τη συμπεριφορά όλων των γονιδίων ενός οργανισμού ως απάντηση στις περιβαλλοντικές αλλαγές.

Προκλήσεις της Βιοπληροφορικής στο Σχεδιασμό και Ανάλυση των Μικροσυστοιχιών

Η βιοπληροφορική παίζει πολλαπλούς ρόλους στα πειράματα των μικροσυστοιχιών. Στην πραγματικότητα, είναι δύσκολο να θεωρηθούν οι μικροσυστοιχίες χρήσιμες χωρίς τη συμμετοχή των ηλεκτρονικών υπολογιστών και των βάσεων δεδομένων. Από το σχεδιασμό των τσιπ για συγκεκριμένους σκοπούς, στην ποσοτικοποίηση των σημάτων, στην εξαγωγή ομάδων γονιδίων με προφίλ έκφρασης που σχετίζονται, η ανάλυση των μικροσυστοιχιών είναι μια διαδικασία που είναι δύσκολη, αν όχι αδύνατη, να πραγματοποιηθεί χωρίς τη χρήση ειδικού λογισμικού βιοπληροφορικής.

Είναι σε εξέλιξη πολλές εργασίες για τη σύνδεση των δεδομένων έκφρασης με συναφείς αλληλουχίες και επισημειώσεις. Η μεγαλύτερη βάση δεδομένων μικροσυστοιχιών είναι η ArrayExpress του EMBL-EBI. Το Εθνικό Ίδρυμα Ερευνών για το Ανθρώπινο Γονιδιώμα (NHGRI) προσφέρει αυτήν την περίοδο μια δοκιμαστική έκδοση ενός συστήματος διαχείρισης δεδομένων συστοιχιών που περιλαμβάνει τόσο εργαλεία ανάλυσης όσο και σχεσιακή υποστήριξη της βάσης δεδομένων.

Σχεδιασμός πειραμάτων συστοιχιών

Ένα βασικό στοιχείο των πειραμάτων μικροσυστοιχιών είναι ο σχεδιασμός των τσιπ. Ο σχεδιασμός των τσιπ είναι μια διαδικασία που μπορεί να διαρκέσει μήνες. Προκειμένου τα αποτελέσματα της μικροσυστοιχίας να είναι ξεκάθαρα και σαφή, κάθε DNA ανιχνευτής πρέπει να είναι αρκετά μοναδικός ώστε μόνο ένα ειδικό γονίδιο-στόχος να μπορεί να υβριδοποιείται με αυτόν. Διαφορετικά, η ποσότητα σήματος που ανιχνεύεται σε κάθε σημείο είναι ποσοτικά εσφαλμένη.

Ανάλυση των σαρωμένων εικόνων των μικροσυστοιχιών

Μόλις ολοκληρωθεί το πείραμα συστοιχίας, θα προκύψουν πολλά και πολύ μεγάλα αρχεία TIFF που περιέχουν σαρωμένες εικόνες των συστοιχιών. Το πρότυπο για τα ελεύθερα εργαλεία ανάλυσης των μικροσυστοιχιών είναι τα πακέτα προγραμμάτων που αναπτύσσονται στο Stanford. Ένα πακέτο, το ScanAlyze, είναι το εργαλείο ανάλυσης της εικόνας, που θεωρείται καλό και χρησιμοποιείται ευρέως. Το πρόγραμμα αυτό υποστηρίζει αρχεία TIFF, καθώς και τη μορφή SCN Stanford.

Υπάρχουν πολλά άλλα λογισμικά για την ανάλυση των δεδομένων των μικροσυστοιχιών, όπως:

Το λογισμικό GenomeStudio σας δίνει τη δυνατότητα να απεικονίσετε και να αναλύσετε τα δεδομένα μικροσυστοιχιών που παράγονται στις πλατφόρμες Illumina. Το πακέτο λογισμικού αποτελείται από διακριτές ενότητες της εφαρμογής που σας επιτρέπουν να αποκτήσετε μια ολοκληρωμένη εικόνα του γονιδιώματος, της γονιδιακής έκφρασης και της ρύθμισης των γονιδίων.

Το TM4 Microarray Software Suite είναι ένα εργαλείο ανοιχτού κώδικα για τη διαχείριση και αναφορά δεδομένων μικροσυστοιχιών, την ανάλυση εικόνας, την κανονικοποίηση και τον έλεγχο της γραμμής διοχέτευσης, καθώς και την εξόρυξη και την απεικόνιση δεδομένων.

Το MAIA είναι ένα πακέτο λογισμικού για την αυτόματη επεξεργασία των εικόνων ενός και δύο χρωμάτων, που παράγονται σε τεχνολογίες μικροσυστοιχίας cDNA, CGH ή πρωτεϊνών.

Το AIM (Σύστημα αυτόματης επεξεργασίας εικόνας για μικροσυστοιχίες) παρέχει μια μέθοδο για τη μη βαθμονομημένη μικροσυστοιχία και την ποσοτική ανάλυση της εικόνας. Το AIM είναι ένας αλγόριθμο δημιουργίας συστοιχιών γρήγορης επίθησης, που λειτουργεί πολύ καλά ακόμη και σε χειρότερες περιπτώσεις. Αυτό το σύστημα λειτουργεί ανεξάρτητα όπως και τα εργαλεία γραμμής εντολών.

Το Koadarray είναι ένα πλήρως αυτόματο λογισμικό ανάλυσης εικόνων συστοιχίας, το οποίο μπορεί να επεξεργαστεί εικόνες ενός ή πολλαπλών συστοιχιών.

Ομαδοποίηση προφίλ έκφρασης

Η πιο δημοφιλής στρατηγική για την ανάλυση των δεδομένων μικροσυστοιχιών είναι η ομαδοποίηση των προφίλ έκφρασης. Ένα προφίλ έκφρασης μπορεί να απεικονιστεί ως γραφική παράσταση που περιγράφει την αλλαγή στην έκφραση σε ένα σημείο σε ένα πλέγμα μικροσυστοιχιών κατά τη διάρκεια του πειράματος. Η πορεία του πειράματος αλλάζει με τις συνθήκες, οποιεσδήποτε μεταβολές στη συγκέντρωση των θρεπτικών ουσιών στο μέσο στο οποίο αναπτύσσονται τα κύτταρα προτού υβριδοποιηθεί το DNA τους στη συστοιχία, εως τα στάδια του κυτταρικού κύκλου.

Οι διαφορετικές μέθοδοι ομαδοποίησης, όπως η ιεραρχική ομαδοποίηση ή οι SOMs (χάρτες αυτο-οργάνωσης), μπορούν να λειτουργήσουν καλύτερα σε διαφορετικές καταστάσεις, αλλά ο γενικός στόχος καθεμίας από αυτές τις μεθόδους είναι ο ίδιος. Εάν δύο γονίδια αλλάζουν τα επίπεδα έκφρασής τους με τον ίδιο τρόπο ως απάντηση σε μια αλλαγή στο περιβάλλον, μπορεί να θεωρηθεί ότι αυτά τα γονίδια σχετίζονται. Μπορούν να μοιράζονται κάτι απλό όσο ένας υποκινητής, ή πιο πιθανό να ελέγχονται από το ίδιο πολύπλοκο ρυθμιστικό μονοπάτι. Η αυτοματοποιημένη ομαδοποίηση των προφίλ έκφρασης αναζητά όμοια χαρακτηριστικά, αλλά δεν δείχνει απαραίτητα τις αιτίες αυτών των αλλαγών.

Πρωτεομική

Η πρωτεομική αναφέρεται σε τεχνικές που μελετούν ταυτόχρονα ολόκληρο το σύνολο των πρωτεϊνών ενός κυττάρου. Ενώ βελτιώνονται συνεχώς οι μέθοδοι καθαρισμού και διαχωρισμού των πρωτεϊνών, και μειώνεται ο χρόνος ολοκλήρωσης των πρωτεϊνικών δομών που προσδιορίζονται με NMR και κρυσταλλογραφία ακτίνων Χ, δεν υπάρχει ακόμη κανένας τρόπος για την ταχεία κρυστάλλωση ολόκληρου του πρωτεϊνικού περιεχομένου ενός οργανισμού και ο προσδιορισμός της κάθε δομής. Η τεχνολογική πρόοδος στη βιοχημεία που απαιτεί περισσότερη υποστήριξη από την πληροφορική είναι η διαδικασία ακινητοποιημένης διαβάθμισης 2D-PAGE και ο επακόλουθος χαρακτηρισμός των διαχωρισμένων πρωτεϊνικών προϊόντων με φασματομετρία μάζας.

Πειραματικές προσεγγίσεις στην πρωτεομική

Το πρώτο βήμα στην κατανόηση του πώς το γονιδίωμα καθορίζει το φαινότυπο είναι μόνο η γνωστοποίηση του πότε και σε ποια επίπεδα εκφράζονται τα γονίδια. Ενώ τα επίπεδα mRNA συσχετίζονται με τη συγκέντρωση της πρωτεΐνης στο κύτταρο, οι πρωτεΐνες υποβάλλονται σε μετα-μεταφραστικές τροποποιήσεις που δεν μπορούν να ανιχνευθούν με ένα πείραμα υβριδισμού. Τα πειραματικά εργαλεία για τον προσδιορισμό της συγκέντρωσης και της δραστικότητας της πρωτεΐνης στο κύτταρο είναι το κρίσιμο επόμενο βήμα της διαδικασίας.

Μια άλλη τεχνολογία υψηλής απόδοσης που αναδύεται ως εργαλείο στη λειτουργική γονιδιωματική είναι η ηλεκτροφόρηση δύο διαστάσεων (2D gel electrophoresis). Η ηλεκτροφόρηση δύο διαστάσεων μπορεί να χρησιμοποιηθεί για το διαχωρισμό μιγμάτων πρωτεϊνών που περιέχουν χιλιάδες συστατικά. Η πρώτη διάσταση του πειράματος είναι ο διαχωρισμός των συστατικών ενός διαλύματος κατά μήκος μιας βαθμίδας pH (ισοηλεκτρική εστίαση). Η δεύτερη διάσταση είναι ο διαχωρισμός των συστατικών ορθογώνια με βάση το μοριακό βάρος. Ο διαχωρισμός σε αυτές τις δύο διαστάσεις μπορεί να διαχωρίσει ακόμη και ένα περίπλοκο μείγμα συστατικών. Η Εικόνα 5 δείχνει ένα παράδειγμα εικόνας 2D-PAGE από Ε. coli. Το πείραμα της 2D-PAGE διαχωρίζει πρωτεΐνες από ένα μεικτό δείγμα έτσι ώστε να μπορούν να ταυτοποιηθούν μεμονωμένες πρωτεΐνες. Κάθε σημείο στο χάρτη αντιπροσωπεύει μια διαφορετική πρωτεΐνη.

Εικόνα 5. Χάρτης διαχωρισμού 2D-PAGE από E. coli

Εικόνα 5. Χάρτης διαχωρισμού 2D-PAGE από E. coli

Η χρήση της ηλεκτροφόρησης δύο διαστάσεων επιτρέπει τον πολύ ακριβή διαχωρισμό των πρωτεϊνών, με αποτέλεσμα τις πρωτυποποιημένες συστοιχίες δεδομένων υψηλής πυκνότητας. Επομένως, μπορούν να υποβληθούν σε αυτοματοποιημένη ανάλυση εικόνας και ποσοτικοποίησης, και να χρησιμοποιηθούν για ακριβείς συγκριτικές μελέτες. Η άλλη εξέλιξη που έχει θέσει την τεχνολογία ηλεκτροφόρησης 2D στην πρώτη γραμμή των σύγχρονων μεθόδων μοριακής βιολογίας είναι η δυνατότητα της χημικής ανάλυσης κάθε κηλίδας στο πήκτωμα χρησιμοποιώντας φασματομετρία μάζας. Αυτό επιτρέπει το μετρήσιμο βιοχημικό φαινόμενο - η ποσότητα πρωτεΐνης που βρίσκεται σε μια συγκεκριμένη θέση στη πηκτή - να συνδέεται άμεσα με την αλληλουχία της πρωτεΐνης που βρίσκεται σε αυτό το σημείο.

Προκλήσεις της Πληροφορικής στην Ανάλυση 2D-PAGE

Η τρόπος ανάλυσης για τις εικόνες πηκτής από 2D-PAGE είναι ουσιαστικά αρκετά όμοιος με εκείνον για τις μικροσυστοιχίες. Το πρώτο βήμα είναι η ανάλυση μιας εικόνας, στην οποία εντοπίζονται οι θέσεις των κηλίδων στο πήκτωμα και διαχωρίζονται τα όρια μεταξύ των διαφορετικών θέσεων. Το μοριακό βάρος και το ισοηλεκτρικό σημείο (PI) για κάθε πρωτεΐνη στο πήκτωμα μπορούν να εκτιμηθούν σύμφωνα με τη θέση τους στο πήκτωμα.

Στη συνέχεια, οι θέσεις εντοπίζονται, και οι πληροφορίες αλληλουχίας χρησιμοποιούνται για να γίνει η σύνδεση μεταξύ μιας συγκεκριμένης κηλίδας και της αλληλουχίας των γονιδίων της. Στην πρωτεομική ανάλυση, οι ακινητοποιημένες πρωτεΐνες μπορούν είτε να αλληλουχιθούν in situ είτε να απομακρυνθούν οι πρωτεΐνες από το πήκτωμα, να γίνει έκλουση, και να αναλυθούν χρησιμοποιώντας μεθόδους φασματομετρίας μάζας, όπως φασματομετρία μάζας με ιονισμό ηλεκτροψεκασμού (ESI-MS) ή φασματομετρία μάζας ιονισμός εκρόφησης με λέιζερ υποβοηθούμενος από υπόστρωμα (MALDI).

Εργαλεία για την Πρωτεομική Ανάλυση

Αρκετά ελεύθερα προγράμματα για την πρωτεομική ανάλυση είναι διαθέσιμα στο διαδίκτυο. Τα περισσότερα από αυτά μπορούν να είναι προσβάσιμα μέσω της εξαιρετικής πρωτεομικής βάσης δεδομένων το Expert Protein Analysis System (ExPASy). Το ExPASy είναι το Swiss Institute of Bioinformatics Resource Portal που παρέχει πρόσβαση σε επιστημονικές βάσεις δεδομένων και εργαλεία λογισμικού (π.χ. βάσεις δεδομένων) σε διάφορους τομείς των βιοεπιστημών, συμπεριλαμβανομένων της πρωτεομικής, της γονιδιωματικής, της φυλογένεσης, της βιολογίας συστημάτων, της γενετικής του πληθυσμού, της μεταγραφωμικής κλπ.

Βάσεις δεδομένων Βιοχημικών Μονοπατιών

Η έκφραση γονιδίων και πρωτεϊνών είναι μόνο δύο στάδια στη μετάφραση του γενετικού κώδικα σε φαινότυπο. Όταν τα γονίδια εκφράζονται και μεταφράζονται σε πρωτεΐνες, τα προϊόντα τους συμμετέχουν σε πολύπλοκες βιοχημικές αλληλεπιδράσεις που ονομάζονται μονοπάτια, όπως φαίνονται στην Εικόνα 6. Κάθε μονοπάτι μπορεί να παρέχει πρόδρομες χημικές ενώσεις σε πολλά άλλα μονοπάτια, που σημαίνει ότι κάθε πρωτεΐνη συνδέεται όχι μόνο με τα προηγούμενα και τα επόμενα βιοχημικά βήματα σε ένα μόνο μονοπάτι, αλλά ενδεχομένως και με πολλά άλλα μονοπάτια. Η περίπλοκη διασύνδεση των μεταβολικών μονοπατιών είναι πολύ πιο δύσκολο να αναπαρασταθεί και να μελετηθεί σε σύγκριση με τις γραμμικές αλληλουχίες των γονιδίων και των γονιδιωμάτων.

Εικόνα 6. Ένα πολύπλοκο μεταβολικό μονοπάτι

Εικόνα 6. Ένα πολύπλοκο μεταβολικό μονοπάτι

Ορισμένες υπηρεσίες βασισμένες στον ιστό προσφέρουν πρόσβαση σε πληροφορίες σχετικά με τα μεταβολικά μονοπάτια.

KEGG

Η πιο γνωστή βάση δεδομένων για τα μεταβολικά μονοπάτια στο Διαδίκτυο είναι η Kyoto Encyclopedia of Genes and Genomes (KEGG). Η KEGG παρέχει συλλογή χαρτών μεταβολικών μονοπατιών, αντί για κείμενο μόνο, και μπορεί να είναι ευκολότερο να χρησιμοποιηθεί από τον χρήστη. Η KEGG παρέχει επίσης λίστες των αριθμών EC και των αντίστοιχων ενζύμων τους, κατανεμημένα ανά επίπεδο, και πολλών χρήσιμων συνδέσεων σε ιστοσελίδες που περιγράφουν λεπτομερώς την ονοματολογία ενζύμων και προσδετών. Η βάση δεδομένων LIGAND, που σχετίζεται με την KEGG, είναι μια χρήσιμη βάση δεδομένων για την ταυτοποίηση μικρών μορίων που εμπλέκονται σε βιοχημικά μονοπάτια. Στην KEGG μπορεί να αναζητηθεί η ομολογία αλληλουχιών, λέξεις-κλειδιά, και χημικές ουσίες. Επίσης, μπορείτε να εισάγετε τους κωδικούς αναγνώρισης LIGAND δύο μικρών μορίων και να βρείτε όλα τα πιθανά μεταβολικά μονοπάτια που τις συνδέουν.

PathDB

Η PathDB είναι ένας άλλος τύπος βάσης δεδομένων των μεταβολικών μονοπατιών. Παρόλο που περιέχει περίπου τις ίδιες πληροφορίες με την KEGG – χαρακτηρισμός των ενώσεων και των μεταβολικών πρωτεϊνών, και πληροφορίες σχετικά με τα βήματα που συνδέουν αυτές τις οντότητες - χειρίζεται τις πληροφορίες με πολύ πιο ευέλικτο τρόπο από τις άλλες βάσεις δεδομένων. Αντί να περιορίσετε τις αναζητήσεις σε τυχαία μεταβολικά μονοπάτια και να περιγράψετε μονοπάτια με προκαθορισμένες εικόνες, η PathDB σας επιτρέπει να βρείτε οποιαδήποτε ομάδα συνδεδεμένων αντιδράσεων που συνδέουν το σημείο Α με το σημείο Β ή την ένωση Α με την ένωση Β. Η PathDB περιέχει, εκτός από τα συνηθισμένα εργαλεία αναζήτησης, μια διασύνδεση της απεικόνισης μονοπατιού που σας επιτρέπει να ελέγξετε οποιοδήποτε επιλεγμένο μονοπάτι και να εμφανίσετε διαφορετικές αναπαραστάσεις του μονοπατιού.

Funding

Disclaimer

The European Commission support for the production of this publication does not constitute endorsement of the contents which reflects the views only of the authors, and the Commission cannot be held responsi-ble for any use which may be made of the information contained therein.