Je suis en train de découper une chaîne qui pourrait ressembler à ceci:Regex de Split chaîne à mot particulier motif
International Bank for Reconstruction & Development (NAICS: 928120; SIC: 6081) World Bank (NAICS: 928120; SIC: 6081)
dans ce
International Bank for Reconstruction & Development World Bank
ou tout cela:
International Bank for Reconstruction & Development International Bank for Reconstruction & Development (SIC: 6081) International Bank for Reconstruction & Development (NAICS: 928120)
dans ce
International Bank for Reconstruction & Development
il pourrait y avoir un nombre quelconque de correspondances.
J'ai essayé quelques petites choses, en utilisant des classes de caractères négatifs ne fonctionne pas:
[^\(NAICS: (\d+);\)]+
J'utilise C# Regex.
Qu'est-ce que vous essayez de diviser * en *? Quels sont les résultats que vous voulez pour chacun de ces exemples? – ruakh
Chaque "nom" dans son propre match. Banque mondiale pour la reconstruction et le développement (SCIAN: 928120; CTI: 6081) Banque mondiale (SCIAN: 928120; CTI: 6081) correspond à cette série de correspondances {Banque internationale pour la reconstruction et le développement, Banque mondiale} –
Une classe de caractères (négative ou pas) correspond à * des caractères individuels *, pas * des séquences de caractères *. Ce '[^ \ (SCIAN: (\ d +); \)] +' est le même que ceci '[^() + :; ACINS \ d] +' – Tomalak