Publicación diaria (automatizada) de las variantes en México usando datos de GISAID.
- Tablas en la carpeta
tablas
- Gráficas en la carpeta
images
Nota Si usas los datos debes citar a GISAID (ver referencias)
Para analizar en R
los datos más actuales de esta publicación instala el paquete covidmx
:
library(covidmx)
variantes <- descarga_datos_variantes_GISAID()
Nota Si usas los datos del paquete debes citar a GISAID (ver referencias) así como el paquete
covidmx
.
Los datos necesitas obtenerlos de GISAID yendo a Downloads > Variant Surveillance
.
Alternativamente puedes usar el scrapper download_gisaid.py
con tu password y tu usuario. No es un producto oficial y úsalo bajo tu riesgo pues desconozco si va en contra de los términos y condiciones de GISAID.
Para Linux puedes usar crontab
para automatizar la descarga de la base de datos. Sugerencia:
- Crea tu crontab parecido a este:
57 14 * * * export DISPLAY=:0 && /bin/sh /home/rodrigo/VariantesCovid/orchestrate.sh > /dev/null 2>&1
donde tu número de display se obtiene haciendo
env | grep 'DISPLAY'
- Guarda tus credenciales en
gisaid_user_password.txt
donde el primer renglón es tu usuario y el segundo tu password:
usuario
password
- Cambia los paths en el
orchestrate.sh
y vulélvelo ejecutable conchmod +x orchestrate.sh
.
Algunas de las variantes que no fueron asignadas a un linaje uso pangolin
para asignarlas. Para ello el ciclo se vuelve más complejo pues hay que descargar los FASTA
de GISAID. El diagrama es así
flowchart TD;
a[<code>download_gisaid.py</code><br>Descarga los datos<br>de GISAID]-->b[<code>analisis_variantes.R</code><br>Identifica los datos<br>de variantes faltantes];
b-->c[<code>download_fasta.py</code><br>Descarga los FASTA que<br> no han sido asignados<br> en GISAID];
c-->d[<code>get_pangolin.sh</code><br>Corre <code>pangolin</code> para <br> clasificar el FASTA];
d-->b;
b-->e[<code>analisis_variantes.R</code><br>Genera el reporte<br>diario de variantes];
- Copia este repositorio en tu computadora
git clone [email protected]:RodrigoZepeda/VariantesCovid.git
- Usando
conda
instala los ambientes en los archivosyml
(son dos distintos):
conda env create -f environment.yml
conda env create -f pangolin_environment.yml
Khare, S., et al (2021) GISAID’s Role in Pandemic Response. China CDC Weekly, 3(49): 1049-1051. doi:10.46234/ccdcw2021.255 PMCID: 8668406
Elbe, S. and Buckland-Merrett, G. (2017) Data, disease and diplomacy: GISAID’s innovative contribution to global health. Global Challenges, 1:33-46. doi:10.1002/gch2.1018 PMCID: 31565258
Shu, Y. and McCauley, J. (2017) GISAID: from vision to reality. EuroSurveillance, 22(13) doi:10.2807/1560-7917.ES.2017.22.13.30494 PMCID: PMC5388101