CB population genetic map

From Crop Genomics Lab.
Revision as of 05:16, 18 June 2020 by KangHeum Cho (Talk | contribs)

Jump to: navigation, search

WD: 244:/hayasen/chojam/new_GBS


하위 디렉토리:


1) GBS --> /alima9002/YMY/UV/GBS

태영이형이 윤박사님 데이터 분석한 폴더

176 line들 중 138라인만 .bam.sorted.bam 형태로 되어 있고,

나머지 38라인과 모,부본은 .cat.fq.trimmed 형태로 되어 있다.


2) UV --> /NGS/NGS/GlycineMax/DNA/UV

윤박사님이 DNA추출 후 얻은 GBS raw data

분석은 barcode removal까지 된 .fq_trimmed 형식으로 된 파일들을 사용한다.


3) assembly --> /alima9002/ref/Gmax/assembly

Gmax275 genome sequence

분석 과정:

1) the_38_lines.list는 모종의 이유로 정상적인 분석에서 제외된 38라인과 모,부본을 담고 있다

이번 분석에서는 일단 이 라인들을 제외하지 않고, 다시 reference에 mapping을 하여 bamfile을 생성했다.

예시:

bwa mem (-t 4) Gmax_275_v2.0.fa 6_barcode.lane7_UV77.fq_trimmed > UV77.bam
samtools sort -o UV77.bam.sorted.bam UV77.bam


2) 그렇게 총 176 + 모부본의 bam.sorted.bam 파일이 생성되고, mpileup을 진행한다.

(원래는 samtools mpileup을 썼던 것 같은데 이제는 bcftools mpileup을 사용하나보다)

command:

bcftools mpileup -b bam_list -Ou -f Gmax_275_v2.0.fa | bcftools call -Ov -mv -o UV.chojam.variant.vcf
samtools mpileup -f Gmax_275_v2.0.fa -v -t DP,AD,ADF,ADR,SP,INFO/AD,INFO/ADF,INFO/ADR -u -b bam_list | bcftools call -Ov -mv -o UV.chojam.variant.vcf

samtools mpileup의 -t 옵션은 bcftools mpileup의 -a (annotate) 옵션으로 치환가능하다.

*options: 
-Ou: 중간단계에서 textual 형태로 쓰지 않고, uncompressed binary 형태로 가지고 있어라
-Ov: vcf 형태의 파일을 만들어라
-v: variant만 calling해라
-m: -c 옵션이 예전 mpileup 옵션이었다면, -m은 아마도 업그레이드 된 형태일 듯


3) 생성된 vcf 파일 filtering - 일단은 depth, quality에 대해서만 진행

command:

vcftools --vcf UV.chojam.variant.vcf --out UV.chojam.d3.q30 --remove-indels --minDP 3 --minQ 30 --recode