2010-01-17 1 views
4

Il peut parfois être utile de transformer markdown en texte pur (pour l'envoi d'un courrier électronique par exemple).MarkdownSharp/Markdown.NET: Comment récupérer du texte non formaté de la démarque?

Est-ce que l'une de ces bibliothèques supporte cette fonctionnalité? (Je suis en fait plus insterested à MarkdownSharp)

EDIT

En réponse au commentaire de Jorn. Je vais clarifier ce que j'attends de ce type de conversion:
Markdown a des caractères spéciaux qui, selon le contexte, n'ont qu'une signification de formatage. Les caractères **, =, - par exemple. Ce serait bien si je pouvais effacer le texte des caractères de mise en forme. Je ne suis pas sûr de ce qui serait la meilleure approche et quels caractères devraient être éliminés, ni je sais quoi faire avec des liens par exemple, mais je pense que quelqu'un aurait pu faire quelque chose dans ce sens avant.

EDIT 2

trouvé un bon exemple: Stackoverflow utilise ce type de compensation de démarquage dans la liste "Questions". Je suis tout à fait sûr qu'il efface la mise en forme markdown avant de rendre le contenu de la question brève, sinon il contiendrait des sauts de ligne, forts, H1s et ainsi de suite.

EDIT 3

Je suis d'accord à John. La meilleure solution semble être de convertir de la démarque au HTML, puis dépouiller le HTML résultant.

Et cette tâche semble être déjà résolu: How Can I strip HTML from Text in .NET?

+0

L'idée derrière Markdown n'est-elle pas que l'entrée est du "texte pur"? Quel genre de transformations attendez-vous de la bibliothèque dans une conversion "Markdown to pure text"? –

+0

@Jorn: J'ai édité la question à propos de votre commentaire. –

+0

Je crois toujours que la philosophie est que le "balisage" dans Markdown (sans jeu de mots) est censé être lisible par l'homme et la valeur ajoutée, même dans un environnement de texte seulement. «Un * grand * bol de pétunias» - c'est comme ça que j'insisterais sur un mot dans un courriel, par exemple. –

Répondre

2

Si vous voulez juste conserver le texte original, alors il suffit de ne pas passer à Markdown. Markdown est pour une chose seulement: en tournant le texte au format Markdown en HTML. Si vous voulez que Markdown le formate dans quelque chose d'autre que le HTML avec un ensemble différent de règles de transformation, alors, hélas, vous devrez écrire votre propre transformateur.

Si vous voulez obtenir la version "texte seulement" de Markdown déjà formaté en HTML, vous pouvez simplement supprimer les balises HTML. C'est ce que fait StackOverflow.

+0

Mon problème est que le texte original est passé en tant que démarque par l'utilisateur final –

+0

D'accord. J'ai édité la question btw.Je vous remercie! –

Questions connexes