Hey les gars, étant donné un ensemble de données en texte clair telles que les suivantes:Comment Parse Certains Wiki Markup
==Events==
* [[312]] – [[Constantine the Great]] is said to have received his famous [[Battle of Milvian Bridge#Vision of Constantine|Vision of the Cross]].
* [[710]] – [[Saracen]] invasion of [[Sardinia]].
* [[939]] – [[Edmund I of England|Edmund I]] succeeds [[Athelstan of England|Athelstan]] as [[King of England]].
*[[1275]] – Traditional founding of the city of [[Amsterdam]].
*[[1524]] – [[Italian Wars]]: The French troops lay siege to [[Pavia]].
*[[1553]] – Condemned as a [[Heresy|heretic]], [[Michael Servetus]] is [[burned at the stake]] just outside [[Geneva]].
*[[1644]] – [[Second Battle of Newbury]] in the [[English Civil War]].
*[[1682]] – [[Philadelphia]], [[Pennsylvania]] is founded.
Je voudrais finir avec un NSDictionary
ou toute autre forme de collecte afin que je puisse avoir l'année (Le Nombre à gauche) correspondant à l'extrait (Le texte à droite). Voilà donc ce que le « modèle » est comme:
*[[YEAR]] – THE_TEXT
Bien que je voudrais l'extrait soit le texte brut, c'est pas de balisage wiki donc pas [[
ensembles. En fait, cela pourrait s'avérer difficile avec des liens d'alias tels que [[Edmund I of England|Edmund I]]
. Je ne suis pas très expérimenté avec les expressions régulières, donc j'ai quelques questions. Dois-je d'abord essayer d '«embellir» les données? Par exemple, supprimer la première ligne qui sera toujours ==Events==
et supprimer les occurrences [[
et ]]
?
Ou peut-être une meilleure solution: Dois-je le faire en passes? Ainsi, par exemple, le premier passage, je peux séparer chaque ligne en * [[710]]
et [[Saracen]] invasion of [[Sardinia]]
. et les stocker dans différents NSArrays
.
Ensuite, passer par la première NSArray
des années et que le texte brut dans le [[]]
(je dis texte et non le numéro car il peut être 530 BC), alors * [[710]]
devient 710
.
Et puis pour l'extrait NSArray
, passez et si un [[some_article|alias]]
se trouve, assurez-vous qu'il soit en quelque sorte que [[alias]]
, puis retirez tous les [[
et ]]
ensembles?
Est-ce possible? Dois-je utiliser des expressions régulières? Y a-t-il des idées que vous pouvez trouver pour des expressions régulières qui pourraient aider?
Merci! J'apprécie vraiment cela.
EDIT: Désolé pour la confusion, mais je veux seulement analyser les données ci-dessus. Supposons que c'est le seul type de balisage que je vais rencontrer. Je n'ai pas vraiment hâte d'analyser le balisage wiki en général, à moins qu'il y ait déjà une bibliothèque préexistante qui le fasse. Merci encore!
Merci, oui quelqu'un d'autre m'a référé à cette bibliothèque. (Je ne vous ai pas downvote). –