Difference between revisions of "2108 Hakyung TUXEDO"
From Crop Genomics Lab.
Line 1: | Line 1: | ||
==Index Building== | ==Index Building== | ||
− | tophat2는 fasta file을 그대로 사용하기 보다는 '''index를 만들어 파일 사용을 용이하게 한다.''' 이를 위해 첫 턱시도 파이프라인인 tophat을 사용하기 앞서 bowtie2-build index를 사용한다. command 는 다음과 같으며, output directory name은 웬만하면 referece.fa 와 같은 이름으로 해주는 것이 나중에 헷갈리지 않고 좋다. | + | tophat2는 fasta file을 그대로 사용하기 보다는 '''index를 만들어 파일 사용을 용이하게 한다.''' 이를 위해 첫 턱시도 파이프라인인 tophat을 사용하기 앞서 bowtie2-build index를 사용한다. command 는 다음과 같으며, output directory name은 웬만하면 referece.fa 와 같은 이름으로 해주는 것이 나중에 헷갈리지 않고 좋다. |
[http://bowtie-bio.sourceforge.net/bowtie2/manual.shtml bowtie2]에 대한 자세한 설명은 링크 참조. | [http://bowtie-bio.sourceforge.net/bowtie2/manual.shtml bowtie2]에 대한 자세한 설명은 링크 참조. | ||
Line 8: | Line 8: | ||
==Tophat== | ==Tophat== | ||
tophat은 read들을 '''mapping 하는 과정이다.''' | tophat은 read들을 '''mapping 하는 과정이다.''' | ||
− | 각 sample들을 각각 mapping해주며, pair-end 의 경우 아래와 같은 command를 입력해주면 된다. output은 -o 뒤에 지정해준 이름으로 폴더 안에 저장되며, accepted.bam이 앞으로 사용해야할 bam file이다. ref_index에는 위에 bowtie2-build index에서 지정해주었던 이름을 적으면 된다. -p 는 사용할 thread의 갯수인데, htop을 사용하여 서버 상태를 보고 정할 것. | + | 각 sample들을 각각 mapping해주며, pair-end 의 경우 아래와 같은 command를 입력해주면 된다. output은 -o 뒤에 지정해준 이름으로 폴더 안에 저장되며, accepted.bam이 앞으로 사용해야할 bam file이다. ref_index에는 위에 bowtie2-build index에서 지정해주었던 이름을 적으면 된다. -p 는 사용할 thread의 갯수인데, htop을 사용하여 서버 상태를 보고 정할 것. <s>bowtie2 index를 사용했을 경우, tophat2만 되던데... 244에서만 그런건지 원래 그런건지 잘 모르겠음. ㅠ |
− | + | <\s> | |
tophat2 -p 2 -o <*> -G <anotation.gff3> <ref_index> <*_1.fastq.gz> <*_2.fastq.gz> | tophat2 -p 2 -o <*> -G <anotation.gff3> <ref_index> <*_1.fastq.gz> <*_2.fastq.gz> | ||
==cufflinks== | ==cufflinks== | ||
+ | |||
cufflinks -o <*_cufflinks> -G <annotation.gff3> <*/accepted_hits.bam> | cufflinks -o <*_cufflinks> -G <annotation.gff3> <*/accepted_hits.bam> | ||
==HTseq-count== | ==HTseq-count== | ||
+ | python -m HTSeq.scripts.count -t exon -f bam ./{}_sorted.bam ../Gmax_275_Wm82.a2.v1.gene.gtf > {}_HTSeq.txt |
Revision as of 04:19, 19 July 2018
Contents |
Index Building
tophat2는 fasta file을 그대로 사용하기 보다는 index를 만들어 파일 사용을 용이하게 한다. 이를 위해 첫 턱시도 파이프라인인 tophat을 사용하기 앞서 bowtie2-build index를 사용한다. command 는 다음과 같으며, output directory name은 웬만하면 referece.fa 와 같은 이름으로 해주는 것이 나중에 헷갈리지 않고 좋다.
bowtie2에 대한 자세한 설명은 링크 참조.
bowtie2-build <reference.fa> <output dir name>
Tophat
tophat은 read들을 mapping 하는 과정이다.
각 sample들을 각각 mapping해주며, pair-end 의 경우 아래와 같은 command를 입력해주면 된다. output은 -o 뒤에 지정해준 이름으로 폴더 안에 저장되며, accepted.bam이 앞으로 사용해야할 bam file이다. ref_index에는 위에 bowtie2-build index에서 지정해주었던 이름을 적으면 된다. -p 는 사용할 thread의 갯수인데, htop을 사용하여 서버 상태를 보고 정할 것. bowtie2 index를 사용했을 경우, tophat2만 되던데... 244에서만 그런건지 원래 그런건지 잘 모르겠음. ㅠ
<\s>
tophat2 -p 2 -o <*> -G <anotation.gff3> <ref_index> <*_1.fastq.gz> <*_2.fastq.gz>
cufflinks
cufflinks -o <*_cufflinks> -G <annotation.gff3> <*/accepted_hits.bam>
HTseq-count
python -m HTSeq.scripts.count -t exon -f bam ./{}_sorted.bam ../Gmax_275_Wm82.a2.v1.gene.gtf > {}_HTSeq.txt