hse22_hw1

Работа на сервере

Создаём символические ссылки на файлы с помощью команд:

ln -s /usr/share/data-minor-bioinf/assembly/oil_R1.fastq
ln -s /usr/share/data-minor-bioinf/assembly/oil_R2.fastq
ln -s /usr/share/data-minor-bioinf/assembly/oilMP_S4_L001_R1_001.fastq
ln -s /usr/share/data-minor-bioinf/assembly/oilMP_S4_L001_R2_001.fastq

Создаём папки fastc и multiqc:

mkdir fastqc, multiqc

Производим выбор случайных чтений с randomseed = 721:

seqtk sample -721 oil_R1.fastq 5000000 > sub1.fastq
seqtk sample -721 oil_R2.fastq 5000000 > sub2.fastq
seqtk sample -721 oilMP_S4_L001_R1_001.fastq 1500000 > matepairs_1.fastq
seqtk sample -721 oilMP_S4_L001_R2_001.fastq 1500000 > matepairs_2.fastq

Производим оценку чтений fastQC и multiQC:

ls sub* | xargs -P 2 -tI{} fastqc -o fastqc {}
ls matepairs* | xargs -P 2 -tI{} fastqc -o fastqc {}
multiqc -o multiqc/ fastqc/

Подрезаем файлы чтения по качеству:

platanus_trim sub*
platanus_internal_trim matepairs* matepairs*

Удаляем ненужные файлы:

rm *.fastq

Производим оценку чтения уже подрезанных файлов и сохраняем их в отдельной папке:

mkdir cut_trimmed
ls sub*.trimmed | xargs -P 2 -tI{} fastqc -o cut_trimmed/ {}
ls matepairs*.*trimmed | xargs -P 2 -tI{} fastqc -o cut_trimmed/ {}

Запускаем анализ multiQC для полученых оценок подрезанных файлов из cut_trimmed:

mkdir cut_trimmed_multiqc
multiqc -o cut_trimmed_multiqc/ cut_trimmed/

Собираем контиги из подрезанных чтений:

platanus assemble -f sub*.trimmed

Собираем скаффолды из контигов и подрезанных чтений:

time platanus scaffold -c out_contig.fa -IP1 *.trimmed -OP2 *.int_trimmed

Собираем скаффолды с меньшим кол-вом пропусков:

time platanus gap_close -c out_scaffold.fa -IP1 *.trimmed -OP2 *.int_trimmed

Скачиваем файлы с сервера на локальный компьютер:

scp -i dir/ssh -P X mtomarov@IP:/home/mtomarov/my_file dir

Name		Name	Last commit message	Last commit date
Latest commit History 19 Commits
data		data
src		src
.gitignore		.gitignore
README.md		README.md

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

Repository files navigation

hse22_hw1

Работа на сервере

Анализ контигов и скаффолдов

Ссылка на Google Collab

Анализ контигов

Анализ скаффолдов

About

Releases

Packages

Languages

mt-omarov/hse22_hw1

Folders and files

Latest commit

History

Repository files navigation

hse22_hw1

Работа на сервере

Анализ контигов и скаффолдов

Ссылка на Google Collab

Анализ контигов

Анализ скаффолдов

About

Resources

Stars

Watchers

Forks

Releases

Packages 0

Languages

Packages