2017-09-06 1 views
0

Il existe plusieurs façons d'obtenir le nombre de lignes pour une trame de données pandas.(Python/Pandas) Le nombre de lignes est similaire au nombre de lignes dans les pandas.

Ma question est; puis-je obtenir le nombre réel de lignes en connaissant simplement le nombre de lignes d'un fichier? Et sinon, quelle est la façon dont je peux trouver le nombre de lignes sans avoir à charger la trame de données?

Voici une situation où j'ai pu obtenir le même nombre de lignes et de lignes.

... 
s1 = len(df.index) # get the row count. 

with open(filename) as f: # open a file and count the lines, actual line count is 6377 
    for i, l in enumerate(f): 
     pass 
s2 = i + 1 # row count 
s2 = s2 - 2 # line count -2 

Sortie:

s1 = {int} 6375 
s2 = {int} 6375 
+0

Pour répondre à votre question, vous devez simplement ouvrir votre fichier et regarder son contenu. Dans le cas de csv, par exemple, la première ligne signifie en-tête, et d'autres pour les données réelles, donc dans ce cas 'row count = line_count -1' – Grigoriy

Répondre

1

Pas nécessairement. Par exemple, le fichier pourrait avoir des en-têtes, auquel cas il aurait une ligne de plus que la trame de données. Selon la façon dont la trame de données est lue dans le fichier, il existe d'autres façons de faire en sorte que les Pandas ignorent les lignes du fichier (vous pouvez par exemple ignorer les lignes de commentaires).