2017-09-27 5 views
-4

J'essaie d'obtenir le nombre de mots de la page Web en utilisant Mercury Parser.Expression Regex pour faire correspondre les nombres avant un deux-points et des guillemets

<div><p>Content of the webpage goes here</p> </div>"","next_page_url":null,"excerpt":"Get started learning all about SEO from the industry's most trusted source, Search Engine Land. Review basics of search engine optimization, ranking factors & more.","word_count":522,"direction":"ltr","total_pages":1,"rendered_pages":1 

Dans le contenu ci-dessus, je dois correspondre au nombre qui est précédé par "word_count":

Permettez-moi de savoir ce que l'expression regex puis-je utiliser.

J'essaie, (?<=word_count" :).*?(?=[100-10000]). Juste ne peux pas le faire correctement.

+1

Qu'avez-vous essayé? Quels problèmes avez-vous? S'il vous plaît nous montrer votre code. Si vous n'avez pas de code, Stack Overflow n'est probablement pas le bon endroit pour votre question. –

Répondre

1

essayez ceci:

(?<=word_count":)(\d+) 

Explication:

utilisant lookbehind positif (?<= trouver le match word_count": et l'exclure, et me donner tous les chiffres après que l'utilisation regex \d+

Remarque aussi bien que dans mon match, je n'ai pas d'espace entre " et : qui correspond exactement à votre stri ng Votre chaîne a un espace entre " et : qui ne correspondra pas.

+0

S'était bien passé. Merci! –

+3

@PaulSchoff si cette solution a fonctionné pour vous s'il vous plaît marquer comme la solution acceptée. –