Jellyfish script


Eu precisei criar um histograma dos k-mers para diferentes tamanhos. O jellyfish surpreende em performance e facilidade de uso. Mas mesmo assim, precisamos de vários passos. Segue um script para facilitar o uso dele. O script precisa de dois parâmetros: o nome do arquivo fasta/fastq e o prefixo do arquivo de resultados.

Ex: run.sh reads.fasta jf_kmer_
#!/bin/bash
for kmerSize in {13..29..2} do    echo "kmer size $kmerSize - creating kmer-map..."    jellyfish count -m $kmerSize -o output -c 16 -s 500000000 -t 60 $1    arq_out=`ls -1 output* | wc -l`    banco=out_$kmerSize    if [ $arq_out -gt 1 ]; then       echo "merging"       jellyfish merge -o $banco output\*       rm -rf output*       sleep 5    else       echo "renaming..."       auxFileName=`ls -1 output*`       mv $auxFileName $banco    fi    echo "build histogram"    jellyfish histo -o $2parcial$kmerSize $banco    echo "export stats"    arqStat=$2parcial$kmerSize    arqStat=$arqStat".stat"    jellyfish stats -o $arqStat $banco done
Link para o jellyfish

Comentários

Postagens mais visitadas deste blog

Conversão do encode do MariaDB para atender o moodle 3.8

O GBParsy é uma biblioteca para realizar o parser de arquivos GenBank para o Python