Disons que j'ai effectué trois types de méthodes de régression sur des données simulées (ensembles de données multiples), de sorte que j'ai un MSE pour chacune des méthodes correspondant à chaque jeu de données. Quelques exemples de données (df) pourrait ressembler à ceci:Comparaison de valeurs à trois, nombre de 'succès'
df
simulation mse_test1 mse_test2 mse_test3
1 60 80 10
2 80 20 50
3 10 90 100
4 70 50 10
Ce que je voudrais accomplir est de comparer chacune des 3 valeurs MSE pour une simulation donnée afin de déterminer le plus bas MSE (par exemple pour la première ligne (simulation 1), je voudrais vérifier que le test3 a le MSE le plus bas). Je voudrais faire cette comparaison pour toutes mes simulations, où si une méthode (test) a le MSE le plus bas, elle recevra un 1, tandis que d'autres méthodes/tests recevront des zéros. En fin de compte, je voudrais stocker les résultats de cette comparaison (en df_result
afin que je puisse trouver la méthode (test) avec la plus grande somme de 1. Par exemple, en utilisant nos données d'exemple, les résultats aimeraient comme ceci:.
df_result:
mse_test1 mse_test2 mse_test3
1 1 2
Ie, la deuxième méthode/test a le plus faible MSE pour le plus grand nombre de simulations
Merci pour les conseils
Je voudrais aussi pour atteindre les mêmes résultats! , mais pour les données enregistrées dans une liste comme suit ws:
sample_results
[[1]]
mse_test1[[1]]
60
mse_test1[[2]]
80
mse_test1[[3]]
10
mse_test1[[4]]
70
[[2]]
mse_test2[[1]]
80
mse_test2[[2]]
20
mse_test2[[3]]
90
mse_test2[[4]]
50
[[3]]
mse_test3[[1]]
10
mse_test3[[2]]
50
mse_test3[[3]]
100
mse_test3[[4]]
10
Merci pour les conseils. Et si j'avais mes résultats dans une liste? I.e .: mse_test1 serait une liste dans une liste avec les 4 valeurs mse. – lecreprays
Ensuite, je vous suggère de poster un exemple reproductible de vos données. – Sotos
Merci, j'ai ajouté un exemple. – lecreprays