Difference between revisions of "2018 Hakyung July Lab note"

From Crop Genomics Lab.
Jump to: navigation, search
(HT-seq, edgeR 처리 후 한 파일에 리스트 형태로 저장)
(HT-seq, edgeR 처리 후 한 파일에 리스트 형태로 저장)
Line 12: Line 12:
 
         for Cline in Clines :
 
         for Cline in Clines :
 
                 Cgene_name = Cline.split('"')[1]
 
                 Cgene_name = Cline.split('"')[1]
                 ClogFC = float(Cline.split(' ')[1]) #logFC value
+
                 ClogFC = float(Cline.split(' ')[1]) '''#logFC value'''
 
                 if Cgene_name == gene_name :
 
                 if Cgene_name == gene_name :
 
                         if ClogFC < -1 :
 
                         if ClogFC < -1 :
                                 dic[1] = dic[1]+1 # SS2-2 > TG 이면 1
+
                                 dic[1] = dic[1]+1 '''# SS2-2 > TG 이면 1'''
 
                         elif ClogFC > 1 :
 
                         elif ClogFC > 1 :
                                 dic[1] = dic[1]+2 # TG < SS2-2 이면 2, dic = [genename,2,0,0,0]
+
                                 dic[1] = dic[1]+2 '''# TG < SS2-2 이면 2, dic = [genename,2,0,0,0]'''
 
                         else : pass
 
                         else : pass
 
                 else : pass
 
                 else : pass
 
         Cfile.close()   
 
         Cfile.close()   
         Sfile = open("/data2/haggui/RNA/edgeR/DEG_edgeR/DEG_SS2-2.txt","r") #SS2-2가 drought 때 어떻게 변하는지
+
         Sfile = open("/data2/haggui/RNA/edgeR/DEG_edgeR/DEG_SS2-2.txt","r") '''#SS2-2가 drought 때 어떻게 변하는지'''
 
         Slines = Sfile.readlines()
 
         Slines = Sfile.readlines()
 
         for Sline in Slines :
 
         for Sline in Slines :
Line 28: Line 28:
 
                 if Sgene_name == gene_name :
 
                 if Sgene_name == gene_name :
 
                         if SlogFC > 1 :
 
                         if SlogFC > 1 :
                                 dic[2] = dic[2]+1 # up-regulation이면 1
+
                                 dic[2] = dic[2]+1 '''#up-regulation이면 1'''
 
                         elif SlogFC < -1 :  
 
                         elif SlogFC < -1 :  
                                 dic[2] = dic[2]+2 # down-regulation이면 2
+
                                 dic[2] = dic[2]+2 '''#down-regulation이면 2, dic = [genename,2,2,0,0]'''
 
                         else : pass
 
                         else : pass
 
                 else : pass
 
                 else : pass
 
         Sfile.close()
 
         Sfile.close()
         Tfile = open("/data2/haggui/RNA/edgeR/DEG_edgeR/DEG_TG.txt","r")
+
         Tfile = open("/data2/haggui/RNA/edgeR/DEG_edgeR/DEG_TG.txt","r") '''#태광의 변화'''
 
         Tlines = Tfile.readlines()
 
         Tlines = Tfile.readlines()
 
         for Tline in Tlines :
 
         for Tline in Tlines :
Line 40: Line 40:
 
                 TlogFC = float(Tline.split(' ')[1])
 
                 TlogFC = float(Tline.split(' ')[1])
 
                 if Tgene_name == gene_name :
 
                 if Tgene_name == gene_name :
                         if TlogFC > 1 :
+
                         if TlogFC > 1 : '''#up-regulation이면 1'''
 
                                 dic[3] = dic[3]+1  
 
                                 dic[3] = dic[3]+1  
                         elif TlogFC < -1 :
+
                         elif TlogFC < -1 : '''#down-regulation이면 2, dic = [genename,2,2,2,0]'''
 
                                 dic[3] = dic[3]+2
 
                                 dic[3] = dic[3]+2
 
                         else : pass
 
                         else : pass
 
                 else : pass
 
                 else : pass
 
         Tfile.close()
 
         Tfile.close()
         Dfile = open("/data2/haggui/RNA/edgeR/DEG_edgeR/DEG_drought.txt","r")
+
         Dfile = open("/data2/haggui/RNA/edgeR/DEG_edgeR/DEG_drought.txt","r") '''#drought상태에서의 expression level'''
 
         Dlines = Dfile.readlines()
 
         Dlines = Dfile.readlines()
 
         for Dline in Dlines :
 
         for Dline in Dlines :
Line 53: Line 53:
 
                 DlogFC = float(Dline.split(' ')[1])
 
                 DlogFC = float(Dline.split(' ')[1])
 
                 if Dgene_name == gene_name :
 
                 if Dgene_name == gene_name :
                         if DlogFC < -1 :
+
                         if DlogFC < -1 : '''#SS2-2 > TG 이면 1 '''
 
                                 dic[4] = dic[4]+1
 
                                 dic[4] = dic[4]+1
                         elif DlogFC > 1:
+
                         elif DlogFC > 1: '''#TG > SS2-2 이면 2, dic = [genename,2,2,2,2]'''
 
                                 dic[4] = dic[4]+2
 
                                 dic[4] = dic[4]+2
 
                         else : pass
 
                         else : pass
 
                 else : pass
 
                 else : pass
 
         Dfile.close()
 
         Dfile.close()
         list.append(dic)
+
         list.append(dic) '''#list =[[genename,0,0,1,0],[genename2,0,1,1,0] ...]'''
f = open('exp_list.txt','w')
+
f = open('exp_list.txt','w')  
import pickle
+
import pickle '''# 어떤 형태로든 저장해줌, 원래는 새 파일에 쓰면 무조건 string 형태, (리스트 모양의 스트링), 하지만 피클을 사용하면 리스트를 리스트로 저장할 수 있다.'''
pickle.dump(list,f)
+
pickle.dump(list,f) '''#리스트를 f변수로 저장된 파일에 써라'''
 
f.close()
 
f.close()

Revision as of 01:48, 24 July 2018

HT-seq, edgeR 처리 후 한 파일에 리스트 형태로 저장

file = open ("/data2/haggui/RNA/edgeR/raw_edgeR/control.counts.edgeR","r")
lines = file.readlines()
list = []
for line in lines :
       gene_name = line.split('"')[1]  #"gene name" 으로 되어 있는 것 가져오기
       dic = [0,0,0,0,0]
       dic[0] = (gene_name) #dic = [genename,0,0,0,0]
       Cfile = open("/data2/haggui/RNA/edgeR/DEG_edgeR/DEG_control.txt","r") #control 상태에서의 DEG 정보
       Clines = Cfile.readlines()
       for Cline in Clines :
               Cgene_name = Cline.split('"')[1]
               ClogFC = float(Cline.split(' ')[1]) #logFC value
               if Cgene_name == gene_name :
                       if ClogFC < -1 :
                               dic[1] = dic[1]+1 # SS2-2 > TG 이면 1
                       elif ClogFC > 1 :
                               dic[1] = dic[1]+2 # TG < SS2-2 이면 2, dic = [genename,2,0,0,0]
                       else : pass
               else : pass
       Cfile.close()   
       Sfile = open("/data2/haggui/RNA/edgeR/DEG_edgeR/DEG_SS2-2.txt","r") #SS2-2가 drought 때 어떻게 변하는지
       Slines = Sfile.readlines()
       for Sline in Slines :
               Sgene_name = Sline.split('"')[1]
               SlogFC = float(Sline.split(' ')[1])
               if Sgene_name == gene_name :
                       if SlogFC > 1 :
                               dic[2] = dic[2]+1 #up-regulation이면 1
                       elif SlogFC < -1 : 
                               dic[2] = dic[2]+2 #down-regulation이면 2, dic = [genename,2,2,0,0]
                       else : pass
               else : pass
       Sfile.close()
       Tfile = open("/data2/haggui/RNA/edgeR/DEG_edgeR/DEG_TG.txt","r") #태광의 변화
       Tlines = Tfile.readlines()
       for Tline in Tlines :
               Tgene_name = Tline.split('"')[1]
               TlogFC = float(Tline.split(' ')[1])
               if Tgene_name == gene_name :
                       if TlogFC > 1 : #up-regulation이면 1
                               dic[3] = dic[3]+1 
                       elif TlogFC < -1 : #down-regulation이면 2, dic = [genename,2,2,2,0]
                               dic[3] = dic[3]+2
                       else : pass
               else : pass
       Tfile.close()
       Dfile = open("/data2/haggui/RNA/edgeR/DEG_edgeR/DEG_drought.txt","r") #drought상태에서의 expression level
       Dlines = Dfile.readlines()
       for Dline in Dlines :
               Dgene_name = Dline.split('"')[1]
               DlogFC = float(Dline.split(' ')[1])
               if Dgene_name == gene_name :
                       if DlogFC < -1 : #SS2-2 > TG 이면 1 
                               dic[4] = dic[4]+1
                       elif DlogFC > 1: #TG > SS2-2 이면 2, dic = [genename,2,2,2,2]
                               dic[4] = dic[4]+2
                       else : pass
               else : pass
       Dfile.close()
       list.append(dic) #list =[[genename,0,0,1,0],[genename2,0,1,1,0] ...]

f = open('exp_list.txt','w') import pickle # 어떤 형태로든 저장해줌, 원래는 새 파일에 쓰면 무조건 string 형태, (리스트 모양의 스트링), 하지만 피클을 사용하면 리스트를 리스트로 저장할 수 있다. pickle.dump(list,f) #리스트를 f변수로 저장된 파일에 써라 f.close()