Preparando o ambiente de trabalho

De Lembiotech Wiki
(Diferença entre revisões)
Ir para: navegação, pesquisa
(Cygwin)
 
(52 edições intermediárias de um usuário não apresentadas)
Linha 1: Linha 1:
{{#css:
+
[[Categoria:Bioinformática]]
#content {
+
line-height: 1.5em;
+
}
+
#content a {
+
text-decoration: none;
+
color: #333;
+
background: #ffff22;
+
padding: 1px 6px 1px 6px;
+
margin: 4px;
+
}
+
#content a:hover {
+
color: #fff;
+
background: #aa0000;
+
text-decoration: underline;
+
}
+
#content a:visited {
+
color: #fff;
+
background: #aabbff;
+
}
+
#content a:active {
+
color: #fff;
+
background: #000;
+
}
+
#content h1 a,#content h2 a,#content h3 a,#content h4 a,#content h5 a,#content h1 a:visited,#content h2 a:visited, #content h3 a:visited,#content h4 a:visited,#content h5 a:visited {
+
color: #fff;
+
text-decoration: none;
+
background: none;
+
padding: 1px 6px 1px 6px;
+
margin: 4px;
+
}
+
#content h1 {
+
margin: 20px 0px 20px 0px;
+
border-bottom: 2px solid #444;
+
text-transform: uppercase;
+
background-color: #333;
+
color: #fff;
+
padding: 0 0 0 50px;
+
font: 36pt Georgia,"Times New Roman",Times,serif;
+
}
+
#content h2 {
+
margin: 20px 0px 20px 0px;
+
border-bottom: 1px solid #666;
+
border-top: 1px solid #666;
+
background-color: #fff;
+
padding: 0 0 0 50px;
+
color: #111;
+
font: 26pt Georgia,"Times New Roman",Times,serif;
+
}
+
#content h3 {
+
margin: 12px -50px 12px -50px;
+
color: #eee;
+
background-color: #111;
+
padding: 0 0 0 25px;
+
font: 16pt Georgia,"Times New Roman",Times,serif;
+
}
+
#content h4 {
+
margin: 12px -50px 12px -10px;
+
padding: 0 0 0 10px;
+
color: #fff;
+
background-color: #666;
+
font: 16pt Georgia,"Times New Roman",Times,serif;
+
}
+
#content h5 {
+
margin: 12px 50px 12px 50px;
+
padding: 0 0 0 30px;
+
color: #fff;
+
font-size: 11pt;
+
background-color: #aaa;
+
font: 14pt Georgia,"Times New Roman",Times,serif;
+
}
+
#content h6 {
+
font: 11pt Courier New;
+
margin: 10px 0 10px 70px;
+
font-size: 11pt;
+
}
+
#content p {
+
}
+
#content img {
+
border: 1px solid #eee;
+
padding: 5px;
+
}
+
}}
+
Como iremos utilizar bastante linhas de comando e arquivos de texto existem ferramentas mais confortáveis do que o command e o notepad do windows.
+
  
Uma delas, chamada Console, substitui o cmd.exe e a outra, Notepad++, o notepad.exe
+
Como iremos utilizar bastante linhas de comando e arquivos de texto existem ferramentas mais confortáveis do que o ''command'' e o ''notepad'' do windows.
 +
 
 +
Uma delas, chamada [http://sourceforge.net/projects/console/ Console], substitui o cmd.exe e a outra, [http://notepad-plus-plus.org/ Notepad++], o notepad.exe
  
 
Após instaladas, recomendo que você as fixe na barra de tarefas (botão direito no ícone do programa) para facilitar o acesso.
 
Após instaladas, recomendo que você as fixe na barra de tarefas (botão direito no ícone do programa) para facilitar o acesso.
  
 
==Configurações recomendadas==
 
==Configurações recomendadas==
Primeiramente é necessário definir onde estarão armazenados os programas e scripts que serão utilizados. Se você planeja utilizar o blast localmente é interessante criar o diretório 'C:\blast'
+
Primeiramente é necessário definir onde estarão armazenados os programas e scripts que serão utilizados.
  
 +
Utilize caminhos curtos ''(ex: C:\blast ; D:\bioinfo)'', uma vez que teremos que digitá-los frequentemente.
  
 
Abaixo um exemplo de estrutura dos diretórios
 
Abaixo um exemplo de estrutura dos diretórios
 +
 +
[[Arquivo:10.png|center|thumb|400px|Estrutura de diretórios]]
  
 
Como você pode ver, neste diretório também estão diversos outros programas: RDP classifier, Mothur, DOTUR e alguns scripts em PERL.
 
Como você pode ver, neste diretório também estão diversos outros programas: RDP classifier, Mothur, DOTUR e alguns scripts em PERL.
Linha 98: Linha 20:
 
Nesta mesma pasta também encontram-se os arquivos de dados utilizados por todos os programas, unificados dentro de 'mydata', a fim de evitar a duplicação desnecessária de um mesmo arquivo diversas vezes.
 
Nesta mesma pasta também encontram-se os arquivos de dados utilizados por todos os programas, unificados dentro de 'mydata', a fim de evitar a duplicação desnecessária de um mesmo arquivo diversas vezes.
  
Console Ao abrir o programa vá em 'Edit> Settings...'
+
==Console==
No primeiro item (coluna a esquerda) 'console' , em 'Startup dir:' defina o diretório de trabalho escolhido acima (ex.: C:\blast\)
+
Ao abrir o programa vá em ''"Edit> Settings..."''
 +
No primeiro item (coluna a esquerda) ''"console"'' , em ''"Startup dir:"'' defina o diretório de trabalho escolhido acima (''ex.: C:\blast\'')
  
Recomendo que você dê uma olhada em 'Appearance' e em 'Appearance>more' e configure o programa da forma que mais lhe agrade. Abaixo um exemplo:
+
Recomendo que você dê uma olhada em ''"Appearance"'' e em ''"Appearance>more"'' e configure o programa da forma que mais lhe agrade. Abaixo um exemplo:
  
 +
[[Arquivo:2.png|center|thumb|400px|Configuração do Console]]
 +
 +
[[Arquivo:3.png|center|thumb|400px|Configuração do Console]]
  
 
Agora que o programa está configurado, seguem alguns comandos básicos para windows:
 
Agora que o programa está configurado, seguem alguns comandos básicos para windows:
  
    cd = altera o diretório atual
+
'''cd = altera o diretório atual'''
 +
<pre>
 +
    cd c:\windows
 +
</pre>
 +
'''dir = lista os arquivos dentro do diretório atual'''
 +
<pre>
 +
    dir
 +
</pre>
 +
'''mkdir = cria um diretório'''
 +
<pre>
 +
    mkdir teste
 +
    mkdir c:\criar-diretorio\chamado\teste
 +
</pre>
 +
'''copy = copia um arquivo'''
 +
<pre>
 +
    copy dados.txt dados-copia.txt
  
cd c:\windows
+
    copy dados.txt c:\criar-diretorio\chamado\teste\dados-copia.txt
 +
</pre>
  
    dir = lista os arquivos dentro do diretório atual
 
  
dir
+
<pre>
 
+
cd .. = retorna o diretório um nível acima
    mkdir = cria um diretório
+
 
+
mkdir teste
+
mkdir c:\criar-diretorio\chamado\teste
+
 
+
    copy = copia um arquivo
+
 
+
copy dados.txt dados2.txt
+
copy dados.txt c:\criar-diretorio\chamado\teste\dados-copia.txt
+
 
+
    cd .. = retorna o diretório um nível acima
+
 
         assim, se você estiver em c\:windows
 
         assim, se você estiver em c\:windows
 
             o comando cd ..
 
             o comando cd ..
 
                 retornará ao diretório c:\
 
                 retornará ao diretório c:\
     os '..' podem ser utilizados para abreviar o retorno a diretórios extensos, por exemplo:
+
 
 +
     Os ".." podem ser utilizados para abreviar o retorno a diretórios extensos, por exemplo:
 
         Caso possua a seguuinte estrutura de diretórios:
 
         Caso possua a seguuinte estrutura de diretórios:
 
             C:\ANALISES
 
             C:\ANALISES
 
             C:\ANALISES\TESTE_DIR
 
             C:\ANALISES\TESTE_DIR
 
             C:\ANALISES\DADOS_DIR
 
             C:\ANALISES\DADOS_DIR
        Ao executar o programa TESTE.EXE estando dentro da pasta TESTE_DIR para a análise dos dados, DADOS.TXT, que estão em um diretório superior DADOS_DIR, então temos:  
+
</pre>
 +
 
 +
 
 +
<pre>
 +
Ao executar o programa TESTE.EXE estando dentro da pasta TESTE_DIR para a análise dos dados,
 +
DADOS.TXT, que estão em um diretório superior DADOS_DIR, então temos:  
 
             C:\ANALISES\TESTE_DIR>teste.exe c:\analises\dados_dir\dados.txt
 
             C:\ANALISES\TESTE_DIR>teste.exe c:\analises\dados_dir\dados.txt
        Isto é a mesma coisa de executar:
+
    Isto é a mesma coisa de executar:
 
             C:\ANALISES\TESTE_DIR>teste.exe ..\dados_dir\dados.txt
 
             C:\ANALISES\TESTE_DIR>teste.exe ..\dados_dir\dados.txt
 +
</pre>
  
 +
Para mais comandos consulte a [http://en.wikipedia.org/wiki/List_of_MS-DOS_commands interweb] :D
  
Para mais comandos consulte a interweb :D
 
 
==Notepad++==
 
==Notepad++==
O Notepad++ possui inúmeras funcionalidades, é altamente configurável e possui vários plugins e extensões.
+
O '''Notepad++''' possui inúmeras funcionalidades, é altamente configurável e possui vários plugins e extensões.
  
No entanto, por enquanto pelo menos, indico apenas que você vá em 'View' e selecione 'Word wrap', e que o associe como aplicativo padrão de seus arquivos de texto.
+
No entanto, por enquanto pelo menos, indico apenas que você vá em ''"View"'' e selecione ''"Word wrap"'', e que o associe como aplicativo padrão de seus arquivos de texto.
  
Caso não queira realizar a associação, basta clicar com o botão direito em *qualquer* arquivo e escolher a opção 'Edit with Notepad++'.
+
Caso não queira realizar a associação, basta clicar com o botão direito em '''*qualquer*''' arquivo e escolher a opção ''"Edit with Notepad++"''.
  
Recomendo fortemente que você brinque com as configurações e procure plugins e tutoriais sobre o que é possivel fazer com este editor de texto.
 
 
==PERL==
 
==PERL==
A linguagem de programação PERL, devido às características intrínsecas da linguagem (tal como, sensibilidade a caracteres repetidos e/ou repetitivos).  
+
A linguagem de programação [http://en.wikipedia.org/wiki/Perl PERL], devido às características intrínsecas da linguagem (tal como, sensibilidade a caracteres repetidos e/ou repetitivos), geralmente é utilizada para análise de sequências.  
Uma abordagem biológica ao PERL é o BIOPERL; desenvolvido especialmente para análises de bioinformática.
+
 
A instalação dos pacotes PERL permitirão a execução de scripts que possibilitam a automatização de diversas tarefas.
+
Uma abordagem biológica ao PERL é o [http://www.bioperl.org/wiki/Main_Page BIOPERL]; desenvolvido especialmente para análises de bioinformática.
Parainstalar o BioPerl siga as instruções da wiki (instale o ActivePerl e depois selecione as dependências desejadas).
+
 
 +
A instalação dos pacotes PERL permitirão a execução de scripts que possibilitam a automatização de diversas tarefas. Inclusive a atualização dos banco de dados do NCBI (nr, nt..) necessários para o blast instalado localmente.
 +
 
 +
Para instalar o BioPerl siga as [http://www.bioperl.org/wiki/Installing_Bioperl_on_Windows instruções da wiki]
 +
(instale o ActivePerl e depois selecione as dependências requeridas). Para testar basta digitar
 +
<pre>
 +
perl -v
 +
</pre>
 +
no console e um texto informativo da versão instalada deve ser exibido.
 +
 
 +
==Cygwin==
 +
 
 +
watch is available in Cygwin, in the '''procps''' package as listed here (this info can be found via the package search on the website, here). I don't think this package is installed by the default cygwin setup, but it is one I usually select on new installs in order to have the watch command available.
 +
 
 +
 
 +
My Cygwin installation does nothing when I type "clear", it say it does not know this command or something. It is quite basic operation to be unavailable. Oh well, that's just life, nothing that a little googling couldn't help.
 +
 
 +
This blog's post clears up things for me : I need to install '''ncurses''' package.
 +
 
 +
 
 +
get file
 +
totalcount=$(grep -c "^>" D:\\blast\\reads-Archaea-1.fasta); completed=$(grep -c "^Query=" D:\\blast\\reads-Archaea.blastOut) ; percent=100*$completed/$totalcount ; echo $percent | bc; sleep 5
 +
 
 +
watch -n 5 ./get

Edição atual tal como 14h44min de 6 de fevereiro de 2012


Como iremos utilizar bastante linhas de comando e arquivos de texto existem ferramentas mais confortáveis do que o command e o notepad do windows.

Uma delas, chamada Console, substitui o cmd.exe e a outra, Notepad++, o notepad.exe

Após instaladas, recomendo que você as fixe na barra de tarefas (botão direito no ícone do programa) para facilitar o acesso.

Tabela de conteúdo

Configurações recomendadas

Primeiramente é necessário definir onde estarão armazenados os programas e scripts que serão utilizados.

Utilize caminhos curtos (ex: C:\blast ; D:\bioinfo), uma vez que teremos que digitá-los frequentemente.

Abaixo um exemplo de estrutura dos diretórios

Estrutura de diretórios

Como você pode ver, neste diretório também estão diversos outros programas: RDP classifier, Mothur, DOTUR e alguns scripts em PERL.

Nesta mesma pasta também encontram-se os arquivos de dados utilizados por todos os programas, unificados dentro de 'mydata', a fim de evitar a duplicação desnecessária de um mesmo arquivo diversas vezes.

Console

Ao abrir o programa vá em "Edit> Settings..." No primeiro item (coluna a esquerda) "console" , em "Startup dir:" defina o diretório de trabalho escolhido acima (ex.: C:\blast\)

Recomendo que você dê uma olhada em "Appearance" e em "Appearance>more" e configure o programa da forma que mais lhe agrade. Abaixo um exemplo:

Erro ao criar miniatura: Arquivo aparentemente inexistente: /srv/www/cc/lembiotech/wiki/images/f/fb/2.png
Configuração do Console
Erro ao criar miniatura: Arquivo aparentemente inexistente: /srv/www/cc/lembiotech/wiki/images/1/10/3.png
Configuração do Console

Agora que o programa está configurado, seguem alguns comandos básicos para windows:

cd = altera o diretório atual

     cd c:\windows

dir = lista os arquivos dentro do diretório atual

     dir

mkdir = cria um diretório

     mkdir teste
     mkdir c:\criar-diretorio\chamado\teste

copy = copia um arquivo

    copy dados.txt dados-copia.txt

    copy dados.txt c:\criar-diretorio\chamado\teste\dados-copia.txt


cd .. = retorna o diretório um nível acima
        assim, se você estiver em c\:windows
            o comando cd ..
                retornará ao diretório c:\
  
    Os ".." podem ser utilizados para abreviar o retorno a diretórios extensos, por exemplo:
        Caso possua a seguuinte estrutura de diretórios:
            C:\ANALISES
            C:\ANALISES\TESTE_DIR
            C:\ANALISES\DADOS_DIR


Ao executar o programa TESTE.EXE estando dentro da pasta TESTE_DIR para a análise dos dados,
DADOS.TXT, que estão em um diretório superior DADOS_DIR, então temos: 
            C:\ANALISES\TESTE_DIR>teste.exe c:\analises\dados_dir\dados.txt
    Isto é a mesma coisa de executar:
            C:\ANALISES\TESTE_DIR>teste.exe ..\dados_dir\dados.txt

Para mais comandos consulte a interweb :D

Notepad++

O Notepad++ possui inúmeras funcionalidades, é altamente configurável e possui vários plugins e extensões.

No entanto, por enquanto pelo menos, indico apenas que você vá em "View" e selecione "Word wrap", e que o associe como aplicativo padrão de seus arquivos de texto.

Caso não queira realizar a associação, basta clicar com o botão direito em *qualquer* arquivo e escolher a opção "Edit with Notepad++".

PERL

A linguagem de programação PERL, devido às características intrínsecas da linguagem (tal como, sensibilidade a caracteres repetidos e/ou repetitivos), geralmente é utilizada para análise de sequências.

Uma abordagem biológica ao PERL é o BIOPERL; desenvolvido especialmente para análises de bioinformática.

A instalação dos pacotes PERL permitirão a execução de scripts que possibilitam a automatização de diversas tarefas. Inclusive a atualização dos banco de dados do NCBI (nr, nt..) necessários para o blast instalado localmente.

Para instalar o BioPerl siga as instruções da wiki (instale o ActivePerl e depois selecione as dependências requeridas). Para testar basta digitar

perl -v

no console e um texto informativo da versão instalada deve ser exibido.

Cygwin

watch is available in Cygwin, in the procps package as listed here (this info can be found via the package search on the website, here). I don't think this package is installed by the default cygwin setup, but it is one I usually select on new installs in order to have the watch command available.


My Cygwin installation does nothing when I type "clear", it say it does not know this command or something. It is quite basic operation to be unavailable. Oh well, that's just life, nothing that a little googling couldn't help.

This blog's post clears up things for me : I need to install ncurses package.


get file totalcount=$(grep -c "^>" D:\\blast\\reads-Archaea-1.fasta); completed=$(grep -c "^Query=" D:\\blast\\reads-Archaea.blastOut) ; percent=100*$completed/$totalcount ; echo $percent | bc; sleep 5

watch -n 5 ./get

Ferramentas pessoais
Espaços nominais
Variantes
Ações
Navegação
Ferramentas