Análises taxonômicas
INTRO
Tabela de conteúdo |
Análises taxonômicas com o MEGAN
Primeiramente temos de obter os arquivos de taxonomia. Isto pode ser feito através do RDP (preferencial para sequências 16S) ou do BLAST (para sequências 18S ou funcionais).
Através do RDP
Como mencionado acima, se o arquivo de entrada for sequencias de 16S então o melhor caminho é alinhar pelo RDP.
De forma local:
- RDP Classifier
- Navegue até a pasta do RDP classifier e:
java -Xmx1g -jar rdp_classifier-2.3.jar -q A07.fasta -o A07out.txt -f fixrank
- RDP Multiclassifer
- Navegue até a pasta do RDP multiclassifier e:
java -Xmx1g -jar multiclassifier.jar --assign_outfile=A07.class --hier_outfile=A07.hier --format=fixRank A07.fasta
No entanto ao utilizar qualquer versão local do RDP é necessário formataro arquivo de saída:
Desta forma, o arquivo de saída:
gi|156447538|gb|EU074232.1| Bacteria domain 1.0 "Actinobacteria" phylum 1.0 Actinobacteria class 1.0 Actinomycetales orde0.41r 0.99 Propionibacteriaceae family 0.66 Friedmanniella genus 0.42 gi|156447537|gb|EU074231.1| Bacteria domain 1.0 "Actinobacteria" phylum 1.0 Actinobacteria class 1.0 Actinomycetales order 1.0 Propionibacteriaceae family 0.79 Friedmanniella genus
Deve ser formatdo para 'percentuais' e ';', assim:
gi|156447538|gb|EU074232.1|; ; Bacteria; 100%; "Actinobacteria"; 100%; Actinobacteria; 100%; Actinomycetales; 99%; Propionibacteriaceae; 66%; Friedmanniella; gi|156447537|gb|EU074231.1|; ; Bacteria; 100%; "Actinobacteria"; 100%; Actinobacteria; 100%; Actinomycetales; 100%; Propionibacteriaceae; 79%; Friedmanniella;
Este arquivo em percentual é que será importado pelo MEGAN.
Ao realizar a classificação pelo site do RDP (ver abaixo) o arquivo final já sairá em %.
O Maurício Cantão, LNCC, escreu um script em PERL bastante útil, para a reformatação dos arquivos de classificação produzidos pelo RDP classifier local (rdp2megan.pl).
Com o PERL instalado basta abrir um console e executar
rdp2megan.pl arquivo.rdpout
No servidor online
No site do RDP faça login e submeta as sequências desejadas.
Após o alinhamento clique no sinal + e vá em 'Classifier', indique as sequências selecionadas e espere.
Quando aparecerem os resultados, clique em [show assignment detail] e depois em "download as text file".
ATENÇÃO!
No momento há grandes diferenças entre os alinhamentos LOCAL (Standalone) e ONLINE do RDP Classifier. Recomendo (por enquanto) a utlização do método ONLINE por resultar em classificações mais detalhadas.