Primeros pasos¶

Traducción asistida por IA - más información y sugerencias

Iniciar un entorno de capacitación¶

Para usar el entorno preconfigurado que proporcionamos en GitHub Codespaces, haga clic en el botón "Open in GitHub Codespaces" a continuación. Para otras opciones, consulte Opciones de entorno.

Recomendamos abrir el entorno de capacitación en una nueva pestaña o ventana del navegador (use clic derecho, ctrl-clic o cmd-clic según su equipo) para que pueda leer mientras se carga el entorno. Necesitará mantener estas instrucciones abiertas en paralelo para trabajar en el curso.

Conceptos básicos del entorno¶

Este entorno de capacitación contiene todo el software, código y datos necesarios para trabajar en este curso de capacitación, por lo que no necesita instalar nada usted mismo.

El codespace está configurado con una interfaz VSCode, que incluye un explorador de archivos, un editor de código y un terminal shell. Todas las instrucciones dadas durante el curso (por ejemplo, 'abra el archivo', 'edite el código' o 'ejecute este comando') se refieren a esas tres partes de la interfaz VSCode a menos que se especifique lo contrario.

Si está trabajando en este curso por su cuenta, por favor familiarícese con los conceptos básicos del entorno para más detalles.

Requisitos de versión¶

Esta capacitación está diseñada para Nextflow 25.10.2 o posterior con el analizador de sintaxis v2 HABILITADO. Si está usando un entorno local o personalizado, por favor asegúrese de estar usando la configuración correcta como se documenta aquí.

Prepárese para trabajar¶

Una vez que su codespace esté en ejecución, hay dos cosas que debe hacer antes de sumergirse en la capacitación: establecer su directorio de trabajo para este curso específico y revisar los materiales proporcionados.

Establecer el directorio de trabajo¶

Por defecto, el codespace se abre con el directorio de trabajo establecido en la raíz de todos los cursos de capacitación, pero para este curso, trabajaremos en el directorio nf4-science/rnaseq/.

Cambie de directorio ahora ejecutando este comando en el terminal:

cd nf4-science/rnaseq/

Puede configurar VSCode para enfocarse en este directorio, de modo que solo los archivos relevantes se muestren en la barra lateral del explorador de archivos:

code .

Consejo

Si por cualquier razón sale de este directorio (por ejemplo, su codespace entra en suspensión), siempre puede usar la ruta completa para regresar, asumiendo que está ejecutando esto dentro del entorno de capacitación de GitHub Codespaces:

cd /workspaces/training/nf4-science/rnaseq

Ahora echemos un vistazo al contenido.

Explorar los materiales proporcionados¶

Puede explorar el contenido de este directorio usando el explorador de archivos en el lado izquierdo del espacio de trabajo de capacitación. Alternativamente, puede usar el comando tree.

A lo largo del curso, usamos la salida de tree para representar la estructura y contenido del directorio en una forma legible, a veces con modificaciones menores para mayor claridad.

Aquí generamos una tabla de contenidos hasta el tercer nivel:

tree . -L 3

Contenido del directorio

.
├── data
│   ├── genome.fa
│   ├── paired-end.csv
│   ├── reads
│   │   ├── ENCSR000COQ1_1.fastq.gz
│   │   ├── ENCSR000COQ1_2.fastq.gz
│   │   ├── ENCSR000COQ2_1.fastq.gz
│   │   ├── ENCSR000COQ2_2.fastq.gz
│   │   ├── ENCSR000COR1_1.fastq.gz
│   │   ├── ENCSR000COR1_2.fastq.gz
│   │   ├── ENCSR000COR2_1.fastq.gz
│   │   ├── ENCSR000COR2_2.fastq.gz
│   │   ├── ENCSR000CPO1_1.fastq.gz
│   │   ├── ENCSR000CPO1_2.fastq.gz
│   │   ├── ENCSR000CPO2_1.fastq.gz
│   │   └── ENCSR000CPO2_2.fastq.gz
│   └── single-end.csv
├── nextflow.config
├── rnaseq.nf
└── solutions
    ├── modules
    │   ├── fastqc.nf
    │   ├── fastqc_pe.nf
    │   ├── hisat2_align.nf
    │   ├── hisat2_align_pe.nf
    │   ├── multiqc.nf
    │   ├── trim_galore.nf
    │   └── trim_galore_pe.nf
    ├── rnaseq-2.1.nf
    ├── rnaseq-2.2.nf
    ├── rnaseq-2.3.nf
    ├── rnaseq-3.1.nf
    ├── rnaseq-3.2.nf
    └── rnaseq_pe-3.3.nf

Haga clic en el cuadro de color para expandir la sección y ver su contenido. Usamos secciones plegables como esta para mostrar la salida esperada de comandos, así como el contenido de directorios y archivos de manera concisa.

El archivo rnaseq.nf es un esquema para un script de workflow que construirá a medida que avanza en el curso.
El directorio modules contiene esquemas para módulos de proceso que completará durante el curso.
El archivo nextflow.config es un archivo de configuración que establece propiedades mínimas del entorno. Puede ignorarlo por ahora.
El directorio data contiene datos de entrada y recursos relacionados, descritos más adelante en el curso.
El directorio solutions contiene los scripts de workflow y módulos completados que resultan de cada paso del curso. Están destinados a ser usados como referencia para verificar su trabajo y solucionar cualquier problema. La solución de la Parte 2 puede usarse como punto de partida para la Parte 3.

Lista de verificación de preparación¶

¿Cree que está listo para comenzar?

Entiendo el objetivo de este curso y sus requisitos previos
Mi entorno está funcionando
He establecido mi directorio de trabajo apropiadamente

Si puede marcar todas las casillas, está listo para comenzar.

Para continuar a Parte 1: Descripción general del método, haga clic en la flecha en la esquina inferior derecha de esta página.