#!/usr/bin/env bash
#<><><><><><><><><><><><><><><><><><><>
# SCRIPT MPI PARA EL CLUSTER BIOINFO
#<><><><><><><><><><><><><><><><><><><>
#----------------------------------------------------------
# DIRECTIVAS PARA SLURM
#----------------------------------------------------------
#SBATCH --job-name=scriptMPI # (Nombre de ID del trabajo)
#SBATCH --partition=CLUSTER # (especifica grupo de nodos)
#SBATCH --nodes=2 # (cantidad de nodos)
#SBATCH --ntasks=20 # (cantidad de CPUs, ≤ 20)
#SBATCH --mem=60G # (mínima RAM a usar, ≤ 128G)
#SBATCH --time=02:00:00 # (tiempo de ejecución)
#SBATCH --output=slurm.%j.out # (standard out)
#SBATCH --error=slurm.%j.err # (standard error)
#----------------------------------------------------------
# CARGAR MODULES Y/O ENVIRONMENTS
#----------------------------------------------------------
module purge # (Limpiar cargas previas)
source activate ray # (cargar ensamblador ray)
#----------------------------------------------------------
# VARIABLES PARA SIMPLIFICAR EL CÓDIGO
#----------------------------------------------------------
WORKDIR="$HOME"
# K-mer que elegí para ensamblar
kmer=21;
# Carpeta donde tengo los FASTQs
DATA="/share/databases/rawdata/demo/metagenome/sample";
# Nombre de la muestra, ID de las reads.
SAMPLE_ID="CSM5FZ4M";
# Carpeta para guardar el output
RESULTS="$WORKDIR/myRayResults";
# Crear carpeta output sino existe
mkdir -p $RESULTS;
#----------------------------------------------------------
# COMANDOS DE BASH
#----------------------------------------------------------
time \
mpiexec -n $SLURM_NTASKS \
Ray -k $kmer \
-detect-sequence-files $DATA \
-o $RESULTS/$SAMPLE_ID_$kmer