2008-10-06 7 views
11

Je suis en train de graver un site html statique et de déplacer le contenu dans un CMS soutenu par une base de données. J'aimerais utiliser Textile dans le CMS.Comment puis-je convertir HTML en Textile?

Existe-t-il un outil qui convertit le HTML en Textile, afin que je puisse gratter le site existant, convertir le HTML en Textile et insérer ces données dans la base de données?

Répondre

-2

Ceci est un remplacement de balisage simple, rien qu'une bonne regex n'a pu réparer.

Je recommande Perl, LWP :: Simple et quelques expressions rationnelles à faire la chose (spidering, décapage conception et menus, conversion au textile, puis mise en ligne sur la base de données.)

1

Je sais que c'est une vieille question, mais je me suis retrouvé à essayer de le faire l'autre jour et de ne rien trouver d'utile, jusqu'à ce que je trouve Pandoc. Il peut aussi convertir des charges d'autres formats de balisage - c'est assez brillant.

+0

Mais vous allez perdre des styles et d'autres choses. Alors vous pourriez aussi bien convertir en Markdown. – Bruno

-1

essayer ce simple code Java espère travailler pour vous

import java.net.*; 
import java.io.*; 

class Crawle 
{ 

public static void main(String ar[])throws Exception 
{ 


URL url = new URL("https://www.google.co.in/#q=i+am+happy"); 
InputStream io = url.openStream(); 
BufferedReader br = new BufferedReader(new InputStreamReader(io)); 
FileOutputStream fio = new FileOutputStream("crawler/file.txt"); 
PrintWriter pr = new PrintWriter(fio,true); 
String data = ""; 
while((data=br.readLine())!=null) 
{ 
pr.println(data); 
System.out.println(data); 
} 

} 
} 
} 
+0

N'a rien à voir avec Textile – cmroanirgo

+0

Selon la question, il veut explorer n'importe quelle page de site Web et ensuite besoin de sauvegarder dans n'importe quel fichier texte, donc ce que j'ai posté dans ma réponse est lié à cela seulement. Et dans ma réponse j'avais partagé l'exemple simple pour la requête ci-dessus. Je ne reçois toujours pas de raison de downvote. – Simmant

+0

textile <> fichier texte. voir http://redcloth.org/textile – cmroanirgo

0

Comme il n'y avait pas d'implémentation javascript, je l'ai écrit un: https://github.com/cmroanirgo/to-textile

Il est un peu primitif au moment, comme il est un aveugle port de l'équivalent «to-markdown», mais devrait faire le travail.

Questions connexes