0

Je suis assez nouveau pour les statistiques et tring pour obtenir ma tête autour de ce qui est le meilleur moyen et comment analyser les données de performance contre les données météorologiques. Mon hypothèse est que les données de performance sont affectées par les données météorologiques et je veux le prouver.Performance vs météo Analyse de régression

J'ai essayé de tracer les données de performance quotidiennes & meanemp données sur un nuage de points pour faire une analyse de régression et il semble étrange. Je pense que cela est dû à des valeurs négatives dans les données météorologiques.

Scatter plot

Voici toutes les informations météo qui est disponible pour moi:
brouillard, la pluie, la neige, la grêle, le tonnerre, la tornade, meantempm, meantempi, meandewptm, meandewpti, meanpressurem, meanpressurei, meanwindspdm, meanwindspdi , meanwdird, meanvism, meanvisi, humidité, maxtempm, maxtempi, mintempm, mintempi, maxhumidité, minhumidité, maxdewptm, maxdewpti, mindewptm, mindewpti, maxpressurem, maxpressurei, minpressurem, minpressurei, maxwspdm, maxwspdi, minwspdm, minwspdi, maxvism, maxvisi, minvism , minvisi, gdegreedays, heatingdegreedays, coolingdegreedays

Pourriez-vous Vous me conseillez sur quelle est la meilleure façon d'analyser ces données et obtenir un résultat significatif s'il vous plaît?

Merci

Répondre

0

Lorsque vous effectuez une régression linéaire sur les données représentées dans votre question, vous devriez obtenir une pente de près de zéro, ce qui signifie qu'il n'y a pas de relation linéaire dans les données. Une approche assez simple consiste donc à faire une régression linéaire de toutes les données disponibles, en recherchant toute pente autre que zéro (positive ou négative). Il existe de meilleures techniques statistiques, mais cela peut être informatif et facilement automatisé.

+0

Merci James, quelles autres techniques statistiques recommanderiez-vous? Je suis surtout intéressé par la température, donc si les données actuelles ne montrent rien, je pense que l'hypothèse n'est pas correcte. – mrzoogle

+0

La présence de la pluie et la présence du tonnerre ne sont pas indépendants les uns des autres. J'ai fait un certain travail dans la régression multiple, où plusieurs variables indépendantes sont régressées par rapport à une seule variable dépendante, mais rien avec ce degré d'interdépendance complexe. Si vous effectuez une régression multiple par rapport à toutes les variables, mon intuition est que la matrice de covariance résultante montrerait que la plupart des facteurs ont une covariance relativement grande - c'est-à-dire qu'ils ne varient pas indépendamment les uns des autres. Cela vaut la peine de le faire par souci d'exhaustivité et de certitude statistique. –