T-coffee

T-coffee
Γενικά
ΔημιουργοίCédric Notredame, Centro de Regulacio Genomica (CRG)
ΕίδοςΛογισμικό βιοπληρορικής
Διανομή
Έκδοση12.00 (11 Δεκέμβριος 2018)[1]
ΛειτουργικάGNU/Linux, macOS
Ανάπτυξη
Γραμμένο σεC
Άδεια χρήσηςΓενική Άδεια Δημόσιας Χρήσης GNU
Σύνδεσμοι
Επίσημος ιστότοπος
http://www.tcoffee.org
Αποθετήριο κώδικα
https://github.com/cbcrg/tcoffee

Το T-Coffee (Tree-based Consistency Objective Function For alignment Evaluation) είναι ένα πρόγραμμα που χρησιμοποιείται για πολλαπλή στοίχιση ακολουθιών και βασίζεται σε μια προοδευτική μέθοδο στοίχισης των ακολουθιών. [2] Αρχικά πραγματοποιεί όλες τις κατα ζεύγη στοιχίσεις και τα αποτελέσματα συνδυάζονται σε μια αρχική βιβλιοθήκη. Στη συνέχεια σε ένα βήμα επέκτασης της βιβλιοθήκης, καθορίζεται πώς τα ζεύγη καταλοίπων στοιχίζονται σε σχέση με τα άλλα κατάλοιπα. Τέτοιες τριπλέτες χρησιμοποιούνται για να βρεθεί πόσο καλά οι ακολουθίες στοιχίζονται δεδομένων των υπολοίπων (σε αντίθεση με τον έλεχγο δύο ακολουθιών απομονωμένα). Τέλος κατασκευάζεται η τελική στοίχιση, προδευτικά με βάση τις πληροφορίες της βιβλιοθήκης. Το Τ-Coffee μπορεί επίσης να συνδυάσει προηγούμενες πολλαπλές στοιχίσεις ακολουθιών και οι τελευταίες εκδόσεις του μπορούν να ενσωματόσουν και δομικές πληροφορίες από αρχεία PDB (3D-Coffee). Χρησιμοποιεί προηγμένες μεθόδους για να αξιολογήσει την ποιότητα των στοιχίσεων και πάρεχει επιπλέον την δυνατότητα να χρησιμοποιηθεί και για εύρεση μοτίβων (Mocca). Η μορφή των στοιχίσεων που παράγει κανονικά είναι aln (Clustal), αλλά μπορεί επίσης να παράγει πολλαπλές στοιχίσεις σε μορφή PIR, MSF, και FASTA. Το Τ-Coffee υποστηρίζει, επίσης, τις πιο διαδεδομένες μορφές αρχείων εισόδου (FASTA, PIR).

Σύγκριση με άλλες μεθόδους πολλαπλής στοίχισης

[Επεξεργασία | επεξεργασία κώδικα]

Ενώ το από προεπιλογή αρχείο εξόδου του T-Coffee είναι τύπου Clustal, είναι αρκετά διαφορετικό εντούτοις από το αρχεíο εξόδου του ClustalW/X, με αποτέλεσμα πολλά προγράμματα που υποστηρίζουν τη μορφή αρχείου Clustal να αδυνατούν να το διαβάσουν. Παρολαυτά το ClustalX μπορεί να υποστηρίξει τη μορφή των αρχείων που παράγει το T-Coffee, οπότε μια πιθανή λύση σε αυτό το πρόβλημα είναι να εισάγουμε τα αρχεία που παράγει το T-Coffee στο ClustalX και στη συνέχεια να τα μορφοποιήσουμε. Μια άλλη πιθανή λύση είναι να "ζητήσουμε" από το T-Coffee να παράγει αρχεία εξόδου τύπου Clustalw χρησιμοποιώντας την επιλογή "-output=clustalw_aln".

Μια σημαντική ειδική λειτουργία του T-Coffee είναι η ικανότητά του να συνδυάζει διάφορες μεθόδους και διαφορετικούς τύπους δεδομένων. Στην τελευταία έκδοση, το T-Coffee μπορεί να συνδυάζει πρωτεϊνικές ακολουθίες μαζί με δομές, αλλά και RNA ακολουθίες με δομές. Μπορεί επίσης να τρέξει και να συνδυάσει τα αποτελέσματα των στοιχίσεων των πιο διαδεδομένων μεθόδων ακολουθιών και δομικών στοιχίσεων.

Το T-Coffee διαθέτει επιπλέον μια προηγμένη πλατφόρμα μορφοποίησης των ακολουθιών που ονομάζεται seq_reformat.

M-Coffee
μια ειδική λειτουργία του T-Coffee που δίνει τη δυνατότητα στο χρήστη να συνδυάσει το αποτέλεσμα των πιο διαδεδομένων μεθόδων πολλαπλής στοίχισης (Muscle, ClustalW, Mafft, ProbCons, κτλ.). Οι τελικές συνδυασμένες στοιχίσεις που προκύπτουν είναι καλύτερες από τις αρχικές στοιχίσεις που δίνει η κάθε μια μέθοδος ξεχωριστά. Το κυριότερο είναι όμως ότι δείχνει στο χρήστη τις περιοχές στη πολλαπλή στοίχιση που οι διαφορετικές μέθοδοι συμφωνούν. Συνήθως περιοχές με μεγάλο ποσοστό συμφωνίας είναι περιοχές που στοιχίζονται πολύ καλά.
Expresso and 3D-Coffee
πρόκειται για ειδικές λειτουργίες του T-Coffee που δίνουν τη δυνατότητα στο χρήστη να συνδυάσει σε μια πολλαπλή στοίχιση ακολουθίες με δομές. Οι στοιχίσεις που βασίζονται στη δομή μπορούν να πραγματοποιηθούν κάνοντας χρήση των πιο διαδεδομένων μεθόδων δομικών στοιχίσεων οπώς το TMalign, το Mustang, και το sap.
R-Coffee
μια ειδική λειτουργία του T-Coffee που δίνει τη δυνατότητα στο χρήστη να κάνει στοίχιση RNA ακολουθιών χρησιμοποιώντας ταυτόχρονα δευτεροταγής δομικές πληροφορίες.
PSI-Coffee
κάνει στοίχιση πρωτεϊνών με μακρινή συγγένεια με βάση την ομολογία (αργό αλλά ακριβές)[3][4]
TM-Coffee
κάνει στοίχιση διαμεμβρανικών πρωτεϊνών με βάση την ομολογία[5]
Pro-Coffee
κάνει στοίχιση σε ομόλογες περιόχες υποκινητών [6]
Accurate
αυτόματα συνδυάζει τα πιο ακριβή μοντέλα για DNA, RNA και Πρωτεΐνες (experimental!).
Combine
συνδιάζει δύο (ή περισσότερες) πολλαπλές στοιχίσεις σε μία.[3][2]
  1. «Release 12.00». 11 Δεκέμβριος 2018. Ανακτήθηκε στις 1 Φεβρουάριος 2019. 
  2. 2,0 2,1 Notredame C, Higgins DG, Heringa J (2000-09-08). «T-Coffee: A novel method for fast and accurate multiple sequence alignment». J Mol Biol. 302 (1): 205–217. doi:10.1006/jmbi.2000.4042. PMID 10964570. 
  3. 3,0 3,1 Di Tommaso P, Moretti S, Xenarios I, Orobitg M, Montanyola A, Chang JM, Taly JF, Notredame C (Jul 2011). «T-Coffee: a web server for the multiple sequence alignment of protein and RNA sequences using structural information and homology extension». Nucleic Acids Res. 39 (Web Server issue): W13–7. doi:10.1093/nar/gkr245. PMID 21558174. 
  4. Kemena C, Notredame C (2009-10-01). «Upcoming challenges for multiple sequence alignment methods in the high-throughput era». Bioinformatics 25 (19): 2455–65. doi:10.1093/bioinformatics/btp452. PMID 19648142. 
  5. Chang JM, Di Tommaso P, Taly JF, Notredame C (2012-03-28). «Accurate multiple sequence alignment of transmembrane proteins with PSI-Coffee». BMC Bioinformatics 13: S1. doi:10.1186/1471-2105-13-S4-S1. PMID 22536955. 
  6. Erb I, González-Vallinas JR, Bussotti G, Blanco E, Eyras E, Notredame C (Apr 2012). «Use of ChIP-Seq data for the design of a multiple promoter-alignment method». Nucleic Acids Res. 40 (7): e52. doi:10.1093/nar/gkr1292. PMID 22230796. 

Εξωτερικοί σύνδεσμοι

[Επεξεργασία | επεξεργασία κώδικα]