2009-04-08 2 views
0

Nous devons automatiser la mise à jour de la base de données plusieurs fois par mois.Mise à jour de la base de données backend à partir d'une entrée XML/PDF cuite: Quel est le meilleur outil/approche?

Mon cas d'utilisation actuel est le suivant.

Actuellement nous différons manuellement les données d'entrée avec l'entrée du mois précédent. S'il s'agit de XML, nous utilisons MS xmldiff. S'il est Pdf, il est entièrement fait par manuel verificaton :-(.

Une fois que les changements se trouvent, nous mettons à jour la base de données via une interface de formulaire (à nouveau manuellement). Les changements pourraient être créer de nouvelles entrées, la mise à jour existante les entrées ou la suppression des entrées plus anciennes. comme ce processus dans son ensemble est à la fois du temps et manuel sans parler de très ennuyeux et frustrant pour une personne physique, nous sommes chercher des façons d'automatiser ce processus autant que possible.

nous sommes actuellement en train de penser à mettre en œuvre le tout en utilisant un script langue (en particulier Python) .Mais nous n'avons vraiment personne qui a actuellement expérience dans les langages de script, nous devons donc apprendre au fur et à mesure.

Les questions que nous espérons recevoir des réponses avant de sauter à Åre

1) va avec un langage de script l'approche correcte? Nous avons pensé que le langage de script est meilleur car il y a plusieurs zones à couvrir (diff XML, connectivité de base de données, création de XML, etc.). Existe-t-il d'autres alternatives ou des outils?

2) Est-ce que Python fonctionne aussi bien que n'importe quelle autre langue? Sur la base de ce que nous avons recherché sur Google, python semble être mature et prend en charge toutes sortes de connectivité de base de données à travers les bibliothèques . Existe-t-il d'autres alternatives enquêter? (Encore une fois, personne n'a écrit un seul code Python)

3) Existe-t-il des outils Diff utiles et gratuits qui fonctionnent sur les fichiers PDF? Nous cherchons quelque chose qui peut vérifier si un tableau spécifique ou contenu de l'en-tête est changé dans un fichier pdf et vider la sortie.

Juste pour info, la base de données est un accès MS.

Merci pour votre temps.

Répondre

1

Je pense que Python est facile à apprendre et, à mon avis, si vous avez une expérience VBScript, vous devriez être capable de le relever rapidement. J'ai utilisé BeautifulSoup pour mon analyse XML/HTML, que j'ai trouvé très facile à utiliser. http://www.crummy.com/software/BeautifulSoup/documentation.html

Pour vos commandes PDF, vous pouvez jeter un oeil à toolkit rportlab (que je ne l'ai pas utilisé) http://www.reportlab.org/

+0

Merci. Nous allons essayer les liens. Donc, l'approche par script est la meilleure pour ce genre de scénario? – user88595

Questions connexes