Question

0

315

Vistas

Usando sklearn cross_val_score y kfolds para ajustar y ayudar a predecir el modelo

Estoy tratando de entender el uso de la validación cruzada de kfolds del módulo sklearn python.

Entiendo el flujo básico:

instanciar un modelo, por ejemplo model = LogisticRegression()
ajustando el modelo, por ejemplo model.fit(xtrain, ytrain)
predicción, por ejemplo model.predict(ytest)
utilice, por ejemplo, la puntuación de val cruzada para probar la precisión del modelo ajustado.

Donde estoy confundido es usar sklearn kfolds con puntaje de val cruzado. Según tengo entendido, la función cross_val_score se ajustará al modelo y predecirá en los kfolds, lo que le dará una puntuación de precisión para cada pliegue.

por ejemplo, usando un código como este:

 kf = KFold(n=data.shape[0], n_folds=5, shuffle=True, random_state=8) lr = linear_model.LogisticRegression() accuracies = cross_val_score(lr, X_train,y_train, scoring='accuracy', cv = kf)

Entonces, si tengo un conjunto de datos con datos de entrenamiento y prueba, y uso la función cross_val_score con kfolds para determinar la precisión del algoritmo en mis datos de entrenamiento para cada pliegue, ¿el model ahora está ajustado y listo para la predicción en los datos de prueba? Entonces, en el caso anterior usando lr.predict

over 3 years ago · Santiago Trujillo

1 Respuestas

Responde la pregunta

0

Responde la pregunta

Encuentra empleos remotos

Accepted Answer · 2022-05-27T14:31:58.523Z

No, el modelo no está ajustado. Mirando el código fuente de cross_val_score :

 scores=parallel(delayed(_fit_and_score)(clone(estimator),X,y,scorer, train,test,verbose,None,fit_params)

Como puede ver, cross_val_score clona el estimador antes de ajustarle los datos de entrenamiento de plegado. cross_val_score le dará una serie de puntuaciones que puede analizar para saber cómo se desempeña el estimador para diferentes pliegues de los datos para verificar si se ajusta demasiado a los datos o no. Puedes saber más al respecto aquí

Debe ajustar todos los datos de entrenamiento al estimador una vez que esté satisfecho con los resultados de cross_val_score , antes de poder usarlos para predecir los datos de prueba.

0

315

Usando sklearn cross_val_score y kfolds para ajustar y ayudar a predecir el modelo

1 Respuestas

0

Encuentra empleos remotos

Andres GPT