Clustal

Clustal
Desenvolvedor Gibson T. (EMBL), Thompson J. (CNRS), Higgins D. (UCD)
Versão estável 2.1 (17 de novembro de 2010; há 13 anos)
Escrito em C
Sistema operacional UNIX, Linux, Mac, MS-Windows
Gênero(s) Bioinformática
Licença livre para usuários acadêmicos
Página oficial Clustal

Clustal é um programa de computador para alinhamento múltiplo de sequências amplamente usado.[1] Sua versão mais recente é a 2.1.[2] Existem duas variações principais:

  • ClustalW: interface de linha de comandos
  • ClustalX: Esta versão possui uma interface gráfica de usuário.[3] Ele está disponível para Windows, Mac OS e Unix / Linux.

Este programa está dsponível a partir do sítio página oficial do Clustal ou do sítio Servidor ftp do European Bioinformatics Institute.

Entrada/Saída

[editar | editar código-fonte]
Alinhamento múltiplo de 27 sequências da proteína hemaglutinina da gripe aviária (vírus H9N2), colorado segundo a conservação de resíduos (mais escuro quanto maior conservação, acima). O alinhamento foi produzido usando-se o ClustalW.

Este programa aceita uma grande variedade de formatos de entrada. Incluindo NBRF/PIR, FASTA, EMBL/Swissprot, Clustal, GCC/MSF, GCG9 RSF, e GDE.

O formato de saída pode ser um ou vários dos seguintes: Clustal, NBRF/PIR, GCG/MSF, PHYLIP, GDE, or NEXUS.

Alinhamento múltiplo de sequências

[editar | editar código-fonte]

Há três etapas principais:

  1. Fazer um alinhamento de seqüências
  2. Criar uma árvore filogenética (ou usar uma árvore definida-por-usuário)
  3. Usar a árvore filogenética para realizar um alinhamento múltiplo

As três opções são feitas automaticamente quando você seleciona "Fazer Alinhamento completo" ("Do Complete Alignment"). Outras opções são "Fazer alinhamento da árvore guia" ("Do Alignment from guide tree") e "Produza somente a árvore guia" ("Produce guide tree only").

Os usuários podem alinhar as seqüências usando a configuração padrão, mas ocasionalmente pode ser útil personalizar com os seus próprios parâmetros.

Os principais parâmetros são a penalidade de lacuna aberta (gap opening penalty) e a penalidade por extensão de lacuna (gap extension penalty).

Ligações externas

[editar | editar código-fonte]

Referências

  1. Chenna R, Sugawara H, Koike T, Lopez R, Gibson TJ, Higgins DG, Thompson JD (2003). «Multiple sequence alignment with the Clustal series of programs». Nucleic Acids Res. 31 (13). p. 3497–3500. PMC 168907Acessível livremente. PMID 12824352. doi:10.1093/nar/gkg500 
  2. Larkin MA, Blackshields G, Brown NP, Chenna R, McGettigan PA, McWilliam H, Valentin F, Wallace IM, Wilm A, Lopez R, Thompson JD, Gibson TJ, Higgins DG (2007). «ClustalW and ClustalX version 2». Bioinformatics. 23 (21). p. 2947–2948. PMID 17846036. doi:10.1093/bioinformatics/btm404 
  3. Thompson JD, Gibson TJ, Plewniak F, Jeanmougin F, Higgins DG (1997). «The CLUSTAL_X windows interface: flexible strategies for multiple sequence alignment aided by quality analysis tools». Nucleic Acids Research. 25 (24). p. 4876–4882. PMC 147148Acessível livremente. PMID 9396791. doi:10.1093/nar/25.24.4876