Je viens de commencer à apprendre Ruby. Language très cool, l'aimer beaucoup. J'utilise l'analyseur HTML Hpricot très pratique.Hpricot, Obtenez tout le texte du document
Ce que je cherche à faire est de récupérer tout le texte de la page, à l'exclusion des balises HTML.
Exemple:
<!DOCTYPE HTML PUBLIC "-//W3C//DTD HTML 4.01 Transitional//EN">
<html>
<head>
<title>Data Protection Checks</title>
<meta http-equiv="Content-Type" content="text/html; charset=UTF-8">
</head>
<body>
<div>
This is what I want to grab.
</div>
<p>
I also want to grab this text
</p>
</body>
</html>
Je suis désireux essentiellement de saisir que le texte que je finis donc avec une chaîne comme ceci:.
« Voilà ce que je veux saisir Je veux aussi prenez ce texte "
Quelle serait la meilleure méthode pour cela?
Vive
Eef
@Eef, vous devrez peut-être supprimer le code javascript avant de recueillir le tableau de texte '(doc/"script") chaque {| js |. js.inner_html = ''} '. – Andrei