Procédé élément de maintien en python

voix
0

Comment faire 6: 4 holdout en python? J'ai essayé le code suivant:

X_train, X_test, y_train, y_test =  train_test_split(X,y, training_size=0.6, test_size=0.4)

Mais pas sûr que ce soit juste ou non.

Créé 09/10/2019 à 12:55
source utilisateur
Dans d'autres langues...                            


1 réponses

voix
2

Reportez - vous à la documentation train_test_splitde scikit-learn.

Pour définir à la fois la taille de la formation et de l'ensemble de test , vous devez passer train_size(pas training_sizecomme dans votre code) et test_size.

Pour utiliser 60% de vos données pour la formation et 40% pour les tests, vous pouvez utiliser ceci:

import numpy as np
from sklearn.model_selection import train_test_split

X = np.random.rand(100, 2)
y = range(100)

X_train, X_test, y_train, y_test = train_test_split(X, y, train_size=0.6, test_size=0.4)

Vous pouvez confirmer que pour les 100 points de données utilisés dans cet exemple, vous obtenez une taille de jeu de train de 60 et une taille de jeu de test de 40:

print(len(X_train), len(X_test))
print(len(y_train), len(y_test))
> 60 40
> 60 40
Créé 09/10/2019 à 13:53
source utilisateur

Cookies help us deliver our services. By using our services, you agree to our use of cookies. Learn more