Análises taxonômicas
(→No servidor online) |
(→No servidor online) |
||
Linha 61: | Linha 61: | ||
No momento '''há grandes diferenças'' entre os alinhamentos '''LOCAL''' (Standalone) e '''ONLINE do RDP Classifier'''. Recomendo (por enquanto) a utlização do método ONLINE por resultar em classificações mais detalhadas. | No momento '''há grandes diferenças'' entre os alinhamentos '''LOCAL''' (Standalone) e '''ONLINE do RDP Classifier'''. Recomendo (por enquanto) a utlização do método ONLINE por resultar em classificações mais detalhadas. | ||
− | [[Arquivo:4.png Diferenças entre versões do RDP classifier]] | + | |
+ | [[Arquivo:4.png|center|thumb|400px|Diferenças entre versões do RDP classifier]] |
Edição de 10h44min de 2 de setembro de 2011
INTRO
Tabela de conteúdo |
Análises taxonômicas com o MEGAN
Primeiramente temos de obter os arquivos de taxonomia. Isto pode ser feito através do RDP (preferencial para sequências 16S) ou do BLAST (para sequências 18S ou funcionais).
Através do RDP
Como mencionado acima, se o arquivo de entrada for sequencias de 16S então o melhor caminho é alinhar pelo RDP.
De forma local:
- RDP Classifier
- Navegue até a pasta do RDP classifier e:
java -Xmx1g -jar rdp_classifier-2.3.jar -q A07.fasta -o A07out.txt -f fixrank
- RDP Multiclassifer
- Navegue até a pasta do RDP multiclassifier e:
java -Xmx1g -jar multiclassifier.jar --assign_outfile=A07.class --hier_outfile=A07.hier --format=fixRank A07.fasta
No entanto ao utilizar qualquer versão local do RDP é necessário formataro arquivo de saída:
Desta forma, o arquivo de saída:
gi|156447538|gb|EU074232.1| Bacteria domain 1.0 "Actinobacteria" phylum 1.0 Actinobacteria class 1.0 Actinomycetales orde0.41r 0.99 Propionibacteriaceae family 0.66 Friedmanniella genus 0.42 gi|156447537|gb|EU074231.1| Bacteria domain 1.0 "Actinobacteria" phylum 1.0 Actinobacteria class 1.0 Actinomycetales order 1.0 Propionibacteriaceae family 0.79 Friedmanniella genus
Deve ser formatdo para percentuais e ";", assim:
gi|156447538|gb|EU074232.1|; ; Bacteria; 100%; "Actinobacteria"; 100%; Actinobacteria; 100%; Actinomycetales; 99%; Propionibacteriaceae; 66%; Friedmanniella; gi|156447537|gb|EU074231.1|; ; Bacteria; 100%; "Actinobacteria"; 100%; Actinobacteria; 100%; Actinomycetales; 100%; Propionibacteriaceae; 79%; Friedmanniella;
Este arquivo em percentual é que será importado pelo MEGAN.
- Ao realizar a classificação pelo site do RDP (ver abaixo) o arquivo final já sairá em %.
O Maurício Cantão, LNCC, escreu um script em PERL bastante útil, para a reformatação dos arquivos de classificação produzidos pelo RDP classifier local (rdp2megan.pl).
Com o PERL instalado basta abrir um console e executar
rdp2megan.pl arquivo.rdpout
No servidor online
No site do RDP faça login e submeta as sequências desejadas.
Após o alinhamento clique no sinal + e vá em Classifier, indique as sequências selecionadas e espere.
Quando aparecerem os resultados, clique em [show assignment detail] e depois em "download as text file".
ATENÇÃO!
No momento há grandes diferenças entre os alinhamentos LOCAL' (Standalone) e ONLINE do RDP Classifier. Recomendo (por enquanto) a utlização do método ONLINE por resultar em classificações mais detalhadas.