Revio seq

From Crop Genomics Lab.
Jump to: navigation, search

bioconda 깔았음

barsh 에 export 추가했음, path 설정안돼있으면 source ~/.barsh

minimap2 로 mapping Gmax ver2 fa indexing 한 후

 minimap2 -x map-pb -t 10 -a /data/ref/Gmax/assembly/Gmax_275_v2.0.fa SS2-2.hifi_reads.fastq | samtools sort -o SS2-2_hifi_re.bam --write-index

-a 옵션 넣어줘야 sam/bam

 java -jar ./picard.jar AddOrReplaceReadGroups I=taegwang_hifi_re.bam O=taekwang_hifi_rg.bam RGLB=libtaekwang RGPL=pacbio RGPU=unit1 RGSM=Taekwang

뒤에 GATK 할때 자꾸 에러남 (--sample-name) , sample name 미리 지정

 samtools index SS2-2_hifi_rg.bam

~_hifi_rg.bam.bai 생김

 ./gatk-4.5.0.0/gatk --java-options "-Xmx4g" HaplotypeCaller     -R /data/ref/Gmax/assembly/Gmax_275_v2.0.fa -I taekwang_hifi_rg.bam -O taekwang.g.vcf.gz -ERC GVCF --sample-name Taekwang
 ./gatk-4.5.0.0/gatk CombineGVCFs -R /data/ref/Gmax/assembly/Gmax_275_v2.0.fa --variant taekwang.g.vcf.gz --variant SS2-2.g.vcf.gz -O TS_revio.g.vcf.gz

vcf 합치기... 앞 단계에서 한번에 둘다 하는 옵션도 있다하는데, 그것보다 따로 해서 합치는 게 더 낫다함. 왜인지는 이해 못했음 ^^


assembly도....

 ./hifiasm/hifiasm -o SS2-2_hifi.asm -t 16 --primary SS2-2.hifi_reads.fastq