Jellyfish script

- fevereiro 23, 2013

Eu precisei criar um histograma dos k-mers para diferentes tamanhos. O jellyfish surpreende em performance e facilidade de uso. Mas mesmo assim, precisamos de vários passos. Segue um script para facilitar o uso dele. O script precisa de dois parâmetros: o nome do arquivo fasta/fastq e o prefixo do arquivo de resultados.

Ex: run.sh reads.fasta jf_kmer_

#!/bin/bash

for kmerSize in {13..29..2}
do
   echo "kmer size $kmerSize - creating kmer-map..."
   jellyfish count -m $kmerSize -o output -c 16 -s 500000000 -t 60 $1
   arq_out=`ls -1 output* | wc -l`
   banco=out_$kmerSize
   if [ $arq_out -gt 1 ]; then
      echo "merging"
      jellyfish merge -o $banco output\*
      rm -rf output*
      sleep 5
   else
      echo "renaming..."
      auxFileName=`ls -1 output*`
      mv $auxFileName $banco
   fi
   echo "build histogram"
   jellyfish histo -o $2parcial$kmerSize $banco
   echo "export stats"
   arqStat=$2parcial$kmerSize
   arqStat=$arqStat".stat"
   jellyfish stats -o $arqStat $banco
done

Link para o jellyfish

Pesquisar este blog

Dieval Guizelini

Jellyfish script

Comentários

Postar um comentário

Postagens mais visitadas deste blog

Conversão do encode do MariaDB para atender o moodle 3.8

O GBParsy é uma biblioteca para realizar o parser de arquivos GenBank para o Python