J'ai une trame de données df
avec quelques stats web de base selon leur indice de vues (PVs):Pandas: cadre de données de filtre basé sur la condition percentile
URL PVs
1 1500
2 1200
3 900
4 700
:
100 25
Je suis en train de filtrer et compter le nombre d'URL qui contribuent percentile différent des pages vues (PVs). Dites, je veux savoir combien et quelle URL une fois apporté 90% de PV (ou 10%).
I calculé centiles:
df.quantile(np.linspace(.1, 1, 9, 0))
Et je sais que je peux itérer des lignes comme celle-ci (donc je peux les résumer):
for index, row in df.iterrows():
print row['PVs']
Mais je ne peux pas comprendre comment arrêter quand un certain seuil est atteint. Appréciera votre aide!
Je vais probablement utiliser les réponses pour des tâches légèrement différentes, mais cette réponse était exactement ce que je avais besoin. Merci comme d'habitude! – aviss
Glad peut vous aider! Et merci. – jezrael