Nextflow переименовывает штрих-коды и объединяет считывания в штрих-кодах

Мой текущий рабочий каталог имеет следующие подкаталоги

Мой Баш-скрипт

Всем привет

Я скомпилировал приведенный выше сценарий Bash для выполнения следующих задач:

  • переименуйте подкаталоги (barcode01-12), взяв информацию из metadata.csv
  • объединить отдельные чтения в подкаталоге и переместить их вверх в $PWD
  • затем я использую эти объединенные чтения (по одному на штрих-код) для моего сценария Nextflow ниже:

Запрос:

Как я могу получить вышеуказанные задачи предварительной обработки (переименование и объединение) или сценарий Bash, добавленный в начало моего следующего сценария Nextflow?

Привет, пожалуйста, опубликуйте фактический код вместо скриншотов кода.

Pallie 12.10.2022 12:38
Стоит ли изучать PHP в 2023-2024 годах?
Стоит ли изучать PHP в 2023-2024 годах?
Привет всем, сегодня я хочу высказать свои соображения по поводу вопроса, который я уже много раз получал в своем сообществе: "Стоит ли изучать PHP в...
Поведение ключевого слова "this" в стрелочной функции в сравнении с нормальной функцией
Поведение ключевого слова "this" в стрелочной функции в сравнении с нормальной функцией
В JavaScript одним из самых запутанных понятий является поведение ключевого слова "this" в стрелочной и обычной функциях.
Приемы CSS-макетирования - floats и Flexbox
Приемы CSS-макетирования - floats и Flexbox
Здравствуйте, друзья-студенты! Готовы совершенствовать свои навыки веб-дизайна? Сегодня в нашем путешествии мы рассмотрим приемы CSS-верстки - в...
Тестирование функциональных ngrx-эффектов в Angular 16 с помощью Jest
В системе управления состояниями ngrx, совместимой с Angular 16, появились функциональные эффекты. Это здорово и делает код определенно легче для...
Концепция локализации и ее применение в приложениях React ⚡️
Концепция локализации и ее применение в приложениях React ⚡️
Локализация - это процесс адаптации приложения к различным языкам и культурным требованиям. Это позволяет пользователям получить опыт, соответствующий...
Пользовательский скаляр GraphQL
Пользовательский скаляр GraphQL
Листовые узлы системы типов GraphQL называются скалярами. Достигнув скалярного типа, невозможно спуститься дальше по иерархии типов. Скалярный тип...
1
1
63
1
Перейти к ответу Данный вопрос помечен как решенный

Ответы 1

Ответ принят как подходящий

По моему опыту, файлы FASTQ могут быть довольно большими. Не зная слишком много специфики, я бы рекомендовал перенести конкатенацию (и переименование) в отдельный процесс. Таким образом, вся «работа» может выполняться внутри рабочего каталога Nextflow. Вот решение, использующее новый DSL 2 . Он использует оператор splitCsv для анализа метаданных и идентификации файлов FASTQ. Затем коллекцию можно передать в наш процесс concat_reads. Чтобы обрабатывать необязательные gzip-файлы, вы можете попробовать следующее:

params.metadata = './metadata.csv'
params.outdir = './results'
process concat_reads {

    tag { sample_name }

    publishDir "${params.outdir}/concat_reads", mode: 'copy'

    input:
    tuple val(sample_name), path(fastq_files)

    output:
    tuple val(sample_name), path("${sample_name}.${extn}")

    script:
    if ( fastq_files.every { it.name.endsWith('.fastq.gz') } )
        extn = 'fastq.gz'
    else if ( fastq_files.every { it.name.endsWith('.fastq') } )
        extn = 'fastq'
    else
        error "Concatentation of mixed filetypes is unsupported"

    """
    cat ${fastq_files} > "${sample_name}.${extn}"
    """
}
process pomoxis {

    tag { sample_name }

    publishDir "${params.outdir}/pomoxis", mode: 'copy'

    cpus 18

    input:
    tuple val(sample_name), path(fastq)

    """
    mini_assemble \\
        -t ${task.cpus} \\
        -i "${fastq}" \\
        -o results \\
        -p "${sample_name}"
    """
}
workflow {

    fastq_extns = [ '.fastq', '.fastq.gz' ]

    Channel.fromPath( params.metadata )
        | splitCsv()
        | map { dir, sample_name ->

            all_files = file(dir).listFiles()

            fastq_files = all_files.findAll { fn ->
                fastq_extns.find { fn.name.endsWith( it ) }
            }

            tuple( sample_name, fastq_files )
        }
        | concat_reads
        | pomoxis
}

Спасибо, Стив. Ваши предложения работали для меня.

Asad Prodhan 13.10.2022 08:58

Другие вопросы по теме