Revio seq
From Crop Genomics Lab.
bioconda 깔았음
barsh 에 export 추가했음, path 설정안돼있으면 source ~/.barsh
minimap2 로 mapping Gmax ver2 fa indexing 한 후
minimap2 -x map-pb -t 10 -a /data/ref/Gmax/assembly/Gmax_275_v2.0.fa SS2-2.hifi_reads.fastq | samtools sort -o SS2-2_hifi_re.bam --write-index
-a 옵션 넣어줘야 sam/bam
java -jar ./picard.jar AddOrReplaceReadGroups I=taegwang_hifi_re.bam O=taekwang_hifi_rg.bam RGLB=libtaekwang RGPL=pacbio RGPU=unit1 RGSM=Taekwang
뒤에 GATK 할때 자꾸 에러남 (--sample-name) , sample name 미리 지정
samtools index SS2-2_hifi_rg.bam
~_hifi_rg.bam.bai 생김
./gatk-4.5.0.0/gatk --java-options "-Xmx4g" HaplotypeCaller -R /data/ref/Gmax/assembly/Gmax_275_v2.0.fa -I taekwang_hifi_rg.bam -O taekwang.g.vcf.gz -ERC GVCF --sample-name Taekwang
./gatk-4.5.0.0/gatk CombineGVCFs -R /data/ref/Gmax/assembly/Gmax_275_v2.0.fa --variant taekwang.g.vcf.gz --variant SS2-2.g.vcf.gz -O TS_revio.g.vcf.gz
vcf 합치기... 앞 단계에서 한번에 둘다 하는 옵션도 있다하는데, 그것보다 따로 해서 합치는 게 더 낫다함. 왜인지는 이해 못했음 ^^
assembly도....
./hifiasm/hifiasm -o SS2-2_hifi.asm -t 16 --primary SS2-2.hifi_reads.fastq