J'essaie d'analyser un ensemble de données dans R où j'ai des ventes d'articles au fil du temps et je veux comprendre l'impact des variables catégoriques sur la quantité vendue.R - Analyser l'impact des variables catégorielles sur la variable continue
library("data.table")
qty <- c(100,10000,100,200,150,9000)
flavour <- c("Mint","Herb","Mint","Mint","Herb","Fruit")
category <- c("Multiple","Multiple","White","Multiple","Other","White")
sales_data <- data.frame(qty,flavour,category)
str(sales_data)
'data.frame': 6 obs. of 3 variables:
$ qty : num 100 10000 100 200 150 9000
$ flavour : Factor w/ 3 levels "Fruit","Herb",..: 3 2 3 3 2 1
$ category: Factor w/ 3 levels "Multiple","Other",..: 1 1 3 1 2 3
J'ai regardé multipleregressions et régressions linéaires simples, mais je sens que je pourrais être sur la mauvaise voie. Ma compréhension est que je peux utiliser une régression linéaire simple pour déterminer une relation entre 2 variables continues. Je peux voir qu'il existe un moyen d'utiliser des régressions multiples pour comprendre la relation entre les variables catégorielles et continues, mais les exemples que j'ai trouvés semblent s'arrêter aux valeurs binaires. Est-ce que quelqu'un fume ou pas par exemple? Étant donné que j'ai plusieurs valeurs pour chaque variable catégorique, la régression multiple est-elle la bonne façon de procéder ou est-ce que je suis complètement sorti de la piste?
Mon jeu de données actuel comporte environ 10 variables catégorielles, dont certaines se rapportent à l'emplacement, d'autres à des marques.
Toute aide serait grandement appréciée. Et excuses si c'est au mauvais endroit ou j'ai manqué quelque chose d'évident - j'apprends des stats et R en même temps si confus rapidement
Vous devez rechercher des données catégorielles de modélisation. La plupart des manuels/cours en ligne pour les modèles linéaires généralisés vous en parleront, et c'est trivial à faire en R (il suffit de coller votre variable sur le RHS de la formule). – Spacedman
Vous indiquez «ventes d'articles dans le temps», quelle variable de votre exemple change avec le temps? – vincentmajor
Merci @ Spacedman, je me suis perdu dans les termes de recherche à utiliser - descendu de nombreux trous de lapin. Je vais le chercher, merci. – user7863288