Compare commits
2 Commits
e6fdd013b7
...
23118d9dd3
Author | SHA1 | Date |
---|---|---|
|
23118d9dd3 | |
|
4d76b255ba |
|
@ -7,7 +7,7 @@ La siguiente tiene los codigos en python para entrenar modelos y el dataset ya p
|
|||
Se requiere `conda` para generar el ambiente con las dependencias:
|
||||
|
||||
```
|
||||
conda create -n mody python=3.10 scikit-learn imbalanced-learn xlsxwriter openpyxl pandas xgboost progressbar2 conda-forge::shap ray-tune tensorflow-gpu keras tensorboard conda-forge::keras-tuner matplotlib
|
||||
conda create -n modyx python=3.10 scikit-learn imbalanced-learn xlsxwriter openpyxl pandas xgboost enlighten conda-forge::shap ray-tune tensorflow-gpu keras tensorboard conda-forge::keras-tuner matplotlib
|
||||
```
|
||||
|
||||
Luego de que instale el ambiente debería dejas las instrucciones para activarlo
|
||||
|
@ -32,7 +32,7 @@ La función `load_data` lee el archivo `MODY_data.xlsx` que contiene la base de
|
|||
df_mody1, df_mody2, df_mody3, df_mody5 = load_data()
|
||||
```
|
||||
|
||||
Esto devuelve 4 dataframes cada uno conteniendo el dataset completo. Luego creamos un Objeto `BinaryTuner` que contiene las abstracciones para generar los 10 dataset y probar los 10 estrategias de aprendizaje automático. Recibe multiples parametros, siendo el primero el nombre de la columna objetivo, numero de semillas o vector con semillas y proporción del conjunto de pruebas.
|
||||
Esto devuelve 4 dataframes cada uno conteniendo el dataset completo. Luego creamos un Objeto `BinaryTuner` que contiene las abstracciones para generar los 10 dataset y probar los 10 estrategias de aprendizaje automático. Recibe multiples parametros, siendo el primero el nombre de la columna objetivo, numero de semillas(`n_seeds`) o vector con semillas(`seeds`) y proporción del conjunto de pruebas.
|
||||
|
||||
```
|
||||
mody2 = BinaryTuner(df_mody2, 'MODY2_label', seeds=[231964], drop_ratio=0.2)
|
||||
|
@ -49,7 +49,7 @@ Entrena todos los modelos, para todos los conjuntos de prueba.
|
|||
mody2.explain_model('GaussianNB', 'fulldataset-oversampled-mice', 231964)
|
||||
```
|
||||
|
||||
Se generan las graficas SHAP para el modelo/dataset/semilla indicadas.
|
||||
Se generan las graficas SHAP para el modelo/dataset/semilla indicadas. Una lista completa de nombres de modelo, datasets y semillas se encuentran en los archivos dentro del directorio.
|
||||
|
||||
```python
|
||||
mody2.wrap_and_save()
|
||||
|
|
Loading…
Reference in New Issue