2017-06-30 6 views
2
df[['gc_lat', 'gc_lng']] = df[['gc_lat', 'gc_lng']].apply(pd.to_numeric, errors='ignore') 
df_realty[['lat', 'lng']] = df_realty[['lat', 'lng']].apply(pd.to_numeric, errors='ignore') 
for index, row in df.iterrows(): 
     gc_lat = float(df.get_value(index,'gc_lat')) 
     gc_lng = float(df.get_value(index, 'gc_lng')) 
     latmax = gc_lat + 1/110.574*radius_km 
     latmin = gc_lat - 1/110.574*radius_km 
     longmax = gc_lng + 1/111.320*radius_km*cos(df.get_value(index,'gc_lat')) 
     longmin = gc_lng - 1/111.320*radius_km*cos(df.get_value(index,'gc_lat')) 
     print(latmax, latmin, longmax, longmin) 
     print (gc_lat) 
     print (gc_lng) 
     print (df_realty.shape) 
     subset = df_realty.loc[(df_realty['lat']<latmax) & (df_realty['lat']>latmin) & (df_realty['lng']>longmin) & (df_realty['lng'] <longmax)] 
     print (subset.shape) 
     print ('subset selected!') 

impressionsPandas df.loc comparer flotteurs-condition ne fonctionne jamais

59.12412758664786 59.03369041335215 37.88659685779323 37.960157142206775 
59.078909 
37.923377 
(290584, 3) 
(0, 3) 
subset selected! 

Je suis en train de diviser dataframe à des sous-ensembles, mais la condition que je mets dans df.loc ne fonctionne jamais!

Les données de df_realty sont OK, déjà testées.

Il semble que je dois EXPLICT un certain type jette, mais je l'ai déjà fait un (pd.to_numeric)

Toutes les suggestions?

+1

'longmax' finit par être plus petite que' longmin'. Je ne peux pas dire où est l'erreur, cependant. –

+0

Pouvez-vous poster un extrait de df_realty? Je pense que 'groupby()' pourrait être le chemin à parcourir. – NickBraunagel

+0

Essayez la méthode query() avec: subset = df_realty.query ("lat <@latmax & lat> @latmin & lng> @longmin $ lng <@longmax") sinon essayez de transformer le sous-ensemble en un tableau croisé dynamique -> sous-ensemble = pd.pivot_table (df_realty) https://pandas.pydata.org/pandas-docs/stable/generated/pandas.pivot_table.html – 2Obe

Répondre

1

trouvé une solution

Le problème était que le longmax est devenu parfois plus petit que longmin car cos retourne parfois une marge négative.

abs puting() devant cosinus résolu le problème