2010-09-15 4 views
4

Je ne fais cela qu'à des fins d'apprentissage. Je n'ai aucune intention d'inverser les méthodes de IMDB.Comment calculeriez-vous le classement des films IMDB?

Je me suis demandé si j'étais propriétaire d'IMDB ou d'un site Web semblable. Comment pourrais-je calculer la note de film?

Tout ce que je peux penser est moyen pondéré (qui n'est moyenne arithmétique)

Pour données de films fournies ci-dessous calcul serait

(38591 * 10 + 27994 * 9 + 32732 * 8 + 17864 * 7 + 7361 * 6 + 2965 * 5 + 1562 * 4 + 1073 * 3 + 891 * 2 + 3401 * 1)/134434 = 8,17055953

alt text


Ma cote 8.17055953 ne correspond pas à la classification IMDB (= moyenne pondérée). Donc ma conclusion est qu'il me manque quelque chose ici ou mon score n'est pas un score idéal. Je suis peut-être manquer beaucoup de choses.

  1. Quel est le problème avec mon score? Pourquoi n'est-ce pas idéal?
  2. Si vous deviez calculer. Comment l'auriez-vous fait?
+1

: Tout le monde est griffes * pas * poser des questions sur le mécanisme de classement pour le Top/Bottom liste. Cette question concerne la façon dont IMDb transforme la moyenne arithmétique en moyenne pondérée. Prenez "Manos: Les Mains du Destin" - Moyenne non pondérée 2.1, moyenne pondérée 1.5. (Ou "Le Parrain", un autre exemple de bourrage de ballot.) –

Répondre

4

Première place: votre calcul (qui est un un moyen pondéré, ou simplement la moyenne) a une faute de frappe: vous avez 19562 « 4 » évaluations, mais vous devriez avoir 1562. Corriger ceci donne ~ 8.17, ce qui équivaut à la moyenne arithmétique d'IMDB.

Ensuite, si vous voulez une pondérée moyenne, vous avez besoin de quelque chose à peser avec! Donc si par exemple les utilisateurs ont une «réputation» ou similaire (même juste une durée de temps enregistrée), vous pouvez l'utiliser comme un multiplicateur pour le poids de leur notation. À la fin, divisez par la somme des poids plutôt que le nombre total de votes, et vous avez une moyenne pondérée.

Un facteur d'échelle de quelque sorte pour le poids serait probablement nécessaire - par exemple si SO a fait quelque chose comme ça, il pourrait être un peu injuste pour l'avis de Jon Skeet à porter deux cent mille fois le poids d'un nouvellement avis de l'utilisateur enregistré :)

+0

putain la faute de frappe !! – claws

7

Pas exactement sur le sujet, mais utile pour vous:

How the ranking is calculated.

espoir qui aide

P. S. cela est confirmé sur cette page:

IMDB Chart

+0

J'ai trouvé la page Wikipedia un peu difficile à digérer (pas un actuaire), mais quelque chose au bas de la page IMDB - en bas de la page Top 250, la "vraie estimation bayésienne" et la même formule que Wikipedia. . J'ai trouvé cette page un peu plus facile à lire: http://wiki.answers.com/Q/What_does_true_Bayesian_estimate_mean_in_connection_with_the_IMDb_Top_250_ratings –

+0

C'est un article moins verbeux et beaucoup plus compréhensible, merci pour le lien :) – Dave

Questions connexes