0034 913 367 113 gi.gfforestal@upm.es

SOFTWARE

ddRADseq (double digested Restriction site Associated DNA sequencing) es una técnica de secuenciación masiva (Next Generation Sequencing, NGS) que genera lecturas a partir de miles de loci delimitados por sitios de restricción. Para que un estudio basado en ddRADseq sea estadísticamente riguroso y económicamente viable, es necesario realizar una fase preliminar de diseño que tenga en cuenta la selección de las enzimas de restricción adecuadas, particularidades del genoma de la especie de estudio, posibles modificaciones en el protocolo a utilizar para la construcción de librerías génicas, así como la cobertura necesaria para minimizar la pérdida de datos y las potenciales fuentes de error que puedan afectar. Hemos desarrollado ddRADseqTools, un software que ayuda en el diseño de experimentos basados en ddRADseq mediante (i) la generación in silico de fragmentos de doble digestión; (ii) la construcción de librerías de ddRADseq utilizando adaptadores con uno o dos índices y DBRs (degenerate base regions) para cuantificar duplicados por PCR (Polymerase Chain Reaction); y (iii) la ejecución de las etapas iniciales del pre-procesado bioinformático de lecturas. ddRADseqTools genera lecturas SE (single-ended) o PE (paired-ended) que pueden presentar mutaciones puntuales de tipo SNP (Single Nucleotide Polymorphism) o indel (inserción/deleción de nucleótidos), y simula el efecto producido por la presencia de duplicados de PCR o la pérdida de alelos por presencia de mutaciones. ddRADseqTools ha sido validado mediante pruebas específicas para un correcto funcionamiento, con un rendimiento eficiente en términos de tiempo de ejecución, y puede ser ejecutado en ordenadores con una configuración de CPU y RAM estándar.

SIMHYB es un programa desarrollado en Java para la simulación de poblaciones mixtas e híbridas. El programa está destinado al análisis del efecto de los diferentes parámetros demográficos y adaptativos sobre la evolución de estas poblaciones. El tamaño de las poblaciones de cada especie, el número de clases intermedias específicas, la fertilidad entre ellas (considerando la dirección) y el fitness de cada clase pueden ser definidos por el usuario. La heredabilidad de dicho fitness y el efecto del envejecimiento también son parámetros tenidos en cuenta. El software genera individuos de pedigree conocido permitiendo su trazabilidad a través de las generaciones. SIMHYB produce un archivo de salida fácilmente convertible en una entrada para el programa STRUCTURE (Pritchard JK, Stephens M, Donnely P (2000) Inference of population structure using multilocus genotype data. Genetics 155: 945-959), uno de los programas más populares para el análisis bayesiano de poblaciones.