Existe-t-il des approches, des algorithmes ou des outils fiables/déployés pour étiqueter le type de site Web en analysant certaines de ses pages Web?Classification du type de site Web à partir des pages Web
Ex: forums, blogs, sites PressRelease, nouvelles, E-Comm etc.
Je cherche des caractéristiques bien définies (règles statiques) à partir de laquelle il peut être déterminé. Si non, alors j'espère que le modèle Machine Learning peut aider.
Suggestions/Idées?