2010-04-07 9 views
2

Je n'arrive pas à déterminer comment définir un prix maximum estimé pour une collection d'enregistrements.Comment définir un filtre pour un prix maximum estimé

Ce que je veux éviter est d'utiliser simplement SQL MAX, car peut-être il y a des enregistrements avec des prix exorbitants.

Par exemple, dans la catégorie des OLX (http://www.olx.com/computers-hardware-cat-240) le filtre pour le prix maximal est estimately fixé à 1400 $, mais le tri par prix « ordinateurs matériel », les premiers éléments sont au-dessus 10 000 $

Peut-être ils ont calculé la moyenne et ensuite estimé un prix maximum ... qu'en pensez-vous?

Répondre

3

Si vous supposiez normale (gaussienne) sur les prix que vous pourrait estimer le maximum en utilisant cette formule

avg(price) + 3*stddev(price)

Si le distribiution est en effet gaussienne environ 95% des échantillons devrait être contenue dans [avg - 3 * stddev; avg + 3 * stddev]

+0

Existe-t-il un moyen de trouver un maximum contenant 90% des échantillons, au lieu de 95%? Je demande cela parce que s'il y a 2 ou 3 prix exorbitants, le maximum estimé sera trop élevé ... J'ai essayé de remplacer 3 * par 2 *, et je pense que c'est plus proche de ce que je cherche pour ... –

+0

le 3 est juste la valeur habituelle, vous pouvez le modifier pour répondre à vos besoins, comme je l'ai dit, cela dépend de la distribution des échantillons. Évidemment, vous pouvez simplement supprimer les valeurs aberrantes manuellement, mais je suppose que ce n'est pas le point. – pablochan

0

alors qu'est-ce que vous demandez? les ordinateurs font exactement ce qu'on leur demande de faire. Regardez dans les fonctions statistiques - la distribution médiane, etc. (http://en.wikipedia.org/wiki/Median)

+1

Un peu condescendant, vous ne pensez pas? –

Questions connexes