2108 Hakyung TUXEDO

From Crop Genomics Lab.
Revision as of 04:19, 19 July 2018 by Khg940711 (Talk | contribs)

Jump to: navigation, search

Contents

Index Building

tophat2는 fasta file을 그대로 사용하기 보다는 index를 만들어 파일 사용을 용이하게 한다. 이를 위해 첫 턱시도 파이프라인인 tophat을 사용하기 앞서 bowtie2-build index를 사용한다. command 는 다음과 같으며, output directory name은 웬만하면 referece.fa 와 같은 이름으로 해주는 것이 나중에 헷갈리지 않고 좋다.

bowtie2에 대한 자세한 설명은 링크 참조.

bowtie2-build <reference.fa> <output dir name>

Tophat

tophat은 read들을 mapping 하는 과정이다. 각 sample들을 각각 mapping해주며, pair-end 의 경우 아래와 같은 command를 입력해주면 된다. output은 -o 뒤에 지정해준 이름으로 폴더 안에 저장되며, accepted.bam이 앞으로 사용해야할 bam file이다. ref_index에는 위에 bowtie2-build index에서 지정해주었던 이름을 적으면 된다. -p 는 사용할 thread의 갯수인데, htop을 사용하여 서버 상태를 보고 정할 것. bowtie2 index를 사용했을 경우, tophat2만 되던데... 244에서만 그런건지 원래 그런건지 잘 모르겠음. ㅠ <\s>

tophat2 -p 2 -o <*> -G <anotation.gff3> <ref_index> <*_1.fastq.gz> <*_2.fastq.gz>

cufflinks

cufflinks -o <*_cufflinks> -G <annotation.gff3> <*/accepted_hits.bam>

HTseq-count

python -m HTSeq.scripts.count -t exon -f bam ./{}_sorted.bam ../Gmax_275_Wm82.a2.v1.gene.gtf  > {}_HTSeq.txt