.NET Je suis à la recherche des bibliothèques pour analyser HTML pour extraire les liens, les formulaires, les étiquettes etc.HTML Parsing Bibliothèques pour
- http://www.majestic12.co.uk/projects/html_parser.php
- http://www.netomatix.com/Products/DocumentManagement/HtmlParserNet.aspx
- http://www.developer.com/net/csharp/article.php/2230091
LGPL ou toute autre licence favorable au développement commercial est préférable.
Avez-vous une expérience avec l'une de ces bibliothèques? Ou pourriez-vous recommander une autre bibliothèque similaire?
HTML Agility Pack est génial, je le recommande aussi. –
D'accord. Nous l'avons utilisé dans un environnement de production, où nous avons analysé environ 50 000 (X) fichiers HTML/h, pour quelques années d'affilée. J'ai bien travaillé. – core
Avez-vous des recommandations pour un projet GPL? HTML Agility Pack est Ms-Pl qui est [incompatible avec la GPL] (https://www.gnu.org/licenses/license-list.html#ms-pl). –