0

J'exploite actuellement un projet spécifique pour mon université. Ce que je vais faire dans le projet est la construction d'un modèle de vente croisée avec l'extraction de règles d'association. En conséquence, j'ai des tonnes de règles mais je ne suis pas sûr de savoir comment les classer ce qui serait le meilleur.Règle de l'association minière (Confiance et Relève)

Quelle option serait mieux si

Option 1: Confidence=20% Lift= 5

Option 2: Confidence = 50% Lift = 2

Je sais que la confiance est importante, mais je l'ai entendu Lift est très important. Est-ce que je devrais sacrifier une certaine confiance pour plus d'ascenseur ou maintenir l'équilibre?

+0

Umm. Bien que la question soit intéressante (et je ne connais pas la solution), le site traite de problèmes de codage, pas de science. Mais si/quand les gens trouvent une solution, j'aimerais en savoir plus. Trouvé ceci: http://analyticstrainings.com/?p=151 – pinegulf

Répondre

0

cela dépend de ce que l'objectif est de l'extraction de règles d'association est:

.: par exemple

- 100.000 transactions' database 

- 2.000 tranasctions contain {(a, b)} 

- 800 transactions contain {(a, b, c)} 

soutien de itemset {(a, b, c)}: (800/100.000) * 100 = 0,8%. La prise en charge d'un ensemble d'éléments indique la fréquence à laquelle une transaction aléatoire de la base de données contient les éléments du jeu d'éléments.


confiance de la règle d'association {(a, b)} -> {(c)}: (800/2000) * 100 = 40%. La confiance d'une règle d'association indique à quelle fréquence une transaction aléatoire de la base de données contenant le conséquent d'une règle d'association contient également l'ancedent des règles d'association.


ascenseur d'association règle {(a, b)} -> {(c)}: 40/((5.000/100.000) * 100) = 8.

la portance est le rapport de la confiance à la confiance attendue d'une règle d'association. la confiance de la règle de l'association est de 40%. La confiance attendue dans ce contexte signifie que si {(a, b)} se produit dans une transaction que cela n'augmente pas, la probabilité de réalisation de cette transaction est égale à {(c)}.

par exemple. si {(c)} se produit dans 5.000 transactions de la base de données, le niveau de confiance attendu est (100.000/5.000) * 100 = 5%.

Une valeur de relèvement d'une règle d'association qui est supérieure à 1 indique que la règle d'association est utile. une valeur de levée inférieure ou égale à 1 indique que la règle d'association n'est pas utile. dans ce cas, c'est comme si l'antécédent et le conséquent de la règle d'association sont indépendants l'un de l'autre. l'utilité de l'indication de la règle d'association que si une transaction contient ({a, b}) qu'elle associe alors ({c}) n'est pas plus utile alors que ({a, b}) accole ({c}) par hasard.

par exemple. Si toutes les 100 000 transactions de la base de données contiennent {(c)}, la valeur attendue de {(c)} est (100.000/100.000) * 100 = 100%. l'ascenseur est 40/100 = 0,4. c'est moins que 1.par conséquent, la règle d'association {(a, b)} -> {(c)} n'est pas utile. {(c)} est dans chaque transaction. s'il y a {(a, b)} dans une transaction, il y a {(c)} dans les deux cas. pas d'utilisation d'une association.


ici le cercle se ferme: cela dépend du but de l'extraction de règle d'association. Si le but est de créer des règles d'association très fortes, la confiance doit être très élevée. Si le but est de créer des règles d'associa- tion très utiles, l'ascenseur doit être très élevé.