From e6fdd013b7a3453f968f77221f48597f86855689 Mon Sep 17 00:00:00 2001 From: Israel Figueroa Date: Fri, 6 Dec 2024 22:53:03 -0300 Subject: [PATCH] fix --- README.md | 6 +++--- 1 file changed, 3 insertions(+), 3 deletions(-) diff --git a/README.md b/README.md index 744da09..7946b92 100644 --- a/README.md +++ b/README.md @@ -26,7 +26,7 @@ python train.py ## Estructura del pipeline -La función `load_data` lee el archivo `MODY_data.xlsx` que contiene la base de datos pre, procesada. En caso que no exista debe poseer un archivo de base de datos `HC.xlsx` para generarlo. +La función `load_data` lee el archivo `MODY_data.xlsx` que contiene la base de datos pre-procesada. En caso que no exista debe poseer un archivo de base de datos `HC.xlsx` para generarlo. ```python df_mody1, df_mody2, df_mody3, df_mody5 = load_data() @@ -35,7 +35,7 @@ df_mody1, df_mody2, df_mody3, df_mody5 = load_data() Esto devuelve 4 dataframes cada uno conteniendo el dataset completo. Luego creamos un Objeto `BinaryTuner` que contiene las abstracciones para generar los 10 dataset y probar los 10 estrategias de aprendizaje automático. Recibe multiples parametros, siendo el primero el nombre de la columna objetivo, numero de semillas o vector con semillas y proporción del conjunto de pruebas. ``` -mody2 = BinaryTuner(dms2, 'MODY2_label', seeds=[231964], drop_ratio=0.2) +mody2 = BinaryTuner(df_mody2, 'MODY2_label', seeds=[231964], drop_ratio=0.2) ``` Esto crea un directorio llamado como la columna objetivo que contiene los registros, modelos e imagenes que se generen en adelante. Esto presenta una restricción si se quiere hacer pruebas con otros dataset con una columna objetivo que tnga el mismo nombre. Se debe tener cuidado verificar que el directorio no existe antes de comenzar un entrenamiento desde cero. @@ -55,4 +55,4 @@ Se generan las graficas SHAP para el modelo/dataset/semilla indicadas. mody2.wrap_and_save() ``` -metodo auxiliar. Crea un zip comprimido con el contenido del directorio asociado. El archivo contiene un timestamp para evitar colisiones en subsecuentes ejecuciones. +metodo auxiliar. Crea un zip comprimido con el contenido del directorio asociado. El archivo contiene un timestamp para evitar colisiones en subsecuentes ejecuciones.