2018 Hakyung June Lab note

From Crop Genomics Lab.
Jump to: navigation, search

Contents

logout 후 새로 들어가기

exit

ssh khg940711@147.46.250.193(244)

비밀번호 입력

내 폴더 찾아가기

cd /data2/haggui

cd /hayasen/haggui

'XXX' 폴더 만들기

mkdir XXX

RNA 폴더로 들어가기

cd RNA/ (왜 뒤에 /붙여야하는 지는 모르겠음)

웹에서 다운로드

wget 주소

새 창에서 작업 (컴퓨터 전원 끄더라도 지속)

그냥 screen : 새 screen 형성, but 이름 알아보기 힘듦.

screen -S XXX

'XXX'이름 설정하기

screen -r XXX

XXX 이름이 포함된 screen 불러오기

shell command

sh XX.sh

XX 이름의 shell command 실행

cp XX.py XX.sh

XX이름의 파이썬 파일을 쉘로

list 활용하기

같은 작업을 반복해야할 경우 list를 만들어 놓고 parallel을 쓰면 순서대로 반복 시킬 수 있음.

ls /data2/haggui/RNA/*.fastq.gz | tr '_' '\(백슬래쉬)t'

tr 은 바꾸기. _를 탭으로 바꿔라

ls /data2/haggui/RNA/*.fastq.gz | tr '_' '\t' | cut -f 1,2,3

탭으로 바꾼 후에 1,2,3 번째 탭(?) 블록(?) 까지만 남겨둬라

ls /data2/haggui/RNA/*.fastq.gz | tr '_' '\t' | cut -f 1,2,3 | tr '\t' '_'

다시 탭을 _로 바꿔라

ls /data2/haggui/RNA/*.fastq.gz | tr '_' '\t' | cut -f 1,2,3 | tr '\t' '_' | sort -u

중복되는 이름들을 없애라

ls /data2/haggui/RNA/*.fastq.gz | tr '_' '\t' | cut -f 1,2,3 | tr '\t' '_' | sort -u > list

-> 경로를 포함한 이름 리스트들이 생김

(나중에는 한번에 해도 됨-- 마지막 것만)

parallel --gnu -j 2 (2개씩 돌리기, cpu 상황에 따라서 j 뒤에 갯수 다르게 설정)

뒤에 ""안에 shell command {}포함해서 넣어주기

cat list | parallel --gnu -j 2 "tophat -o {} -G /data2/haggui/Gmax_275_Wm82.a2.v1.gene.gff3 /data2/haggui/Gmax_275_v2.0.fa {}_1.fastq.gz {}_2.fastq.gz"

리스트 들이 순서대로 {}에 중복되어 들어감

  • cpu 상황을 htop 혹은 top으로 확인하기

basic shell commands

https://www-xray.ast.cam.ac.uk/~jss/lecture/computing/notes/out/commands_basic/

얼마나 남았나 확인

ps -u khg940711

내 아이디로 돌아가고 있는 작업들 모두 확인

or

pidof 작업이름

몇분? 남았는지 보여주기 ps -p PID숫자 -o etime

cufflinks 쓰기

/alima9002/program/cufflinks-2.2.1.Linux_x86_64/cufflinks