2010-12-08 9 views

Répondre

9

Vous semblez mal comprendre à quoi sert le package Formula. Les formules multi-parties peuvent être utilisées pour signifier tout ce que vous voulez que l'utilisateur/développeur veuille dire. La formule fournit le sucre syntaxique autour de la notation de formule plus flexible fournie par le paquet. Les formules multiparties ne signifient rien tant que vous n'avez pas traité la formule pour convertir la représentation symbolique en matrices de modèle ou similaires.

L'exemple que vous citez dans votre "Réponse" de suivi est y ~ x1 + X2 | z1 +z2 + z3. Ceci est pour un modèle de variables instrumentales ajusté par OLS en deux étapes. La partie après le | (z1 +z2 + z3) est ensuite interprétée par la fonction ivcoef() comme IVs, tandis que la partie à gauche du | (x1 + x2) est interprétée comme covariables de régression. ivcoef() construit deux matrices de modèle à partir de ces parties de l'ERS de la formule pour lui permettre de s'adapter à l'OLS en deux étapes. Formule fournit le code pour gérer et manipuler ces formules multipart, il ne spécifie pas quels modèles statistiques ils sont utilisés pour représenter.

Un autre exemple est la fonction hurdle() dans le package pscl, qui utilise la fonctionnalité Formule. Dans ces modèles, la même formule y ~ x1 + X2 | z1 +z2 + z3 serait interprétée différemment; à savoir le bit z1 +z2 + z3 serait utilisé pour l'obstacle zéro (la partie binomiale du modèle obstacle), tandis que le x1 + X2 serait interprété et utilisé pour la partie de comptage du modèle obstacle. Mon point est, la formule peut être interprétée comme vous le souhaitez si vous construisez le logiciel. Si vous êtes l'utilisateur, vous devez comprendre le modèle en cours d'adaptation avant de pouvoir interpréter la formule multipart en termes de modèle statistique. En tant que tel, il n'y a pas de réponse à votre Q; il n'y a pas un signifiant en termes mathématiques pour une formule multipart.

+0

+1: propre comme toujours. –