2010-09-15 5 views
1

J'ai vu un certain nombre de messages ici qui décrivent comment analyser les tableaux HTML en utilisant le package XML. Cela dit, j'ai mon code pour fonctionner, sauf que ma première ligne de données est lue comme mes noms de colonnes.Lire le tableau HTML dans R - Dépannage

Mon code est tiré de la answser à this link

Comment puis-je contourner cela?

Un grand merci,

Brock

Répondre

3

De la documentation du paquet XML pour "readHTMLTable":

header: either a logical value indicating whether the table has 
      column labels, e.g. the first row or a ‘thead’, or 
      alternatively a character vector giving the names to use for 
      the resulting columns. 

Il faut donc lancer la même commande, mais en passant header=FALSE devrait faire ce que vous voulez. Si vous avez un vecteur de noms de colonnes que vous souhaitez utiliser à la place, vous pouvez également utiliser header=your_vector_of_column_names pour définir les noms de colonne au lieu de les définir sur des chaînes vides.

+0

Merci, a regardé à l'aide aussi .... très nouveau – Btibert3