2010-03-24 6 views
-1

Comment convertir des données non structurées en données structurées? Par exemple, les contacts de messagerie, d'un texte non structuré, à un format structuré.convertir des données non structurées en données structurées?

Existe-t-il des algorithmes pour cela?

+0

s'il vous plaît fournir plus de détails .. quelque chose comme, l'entrée d'échantillon et la sortie de l'échantillon sera utile pour comprendre votre problème. Qu'est-ce que et pourquoi voulez-vous convertir, par exemple par courriel voulez-vous dire obtenir tous les identifiants supprimant la partie de domaine ou quelque chose d'autre, ou vous voulez juste un CSV des identifiants de courrier électronique. Mettez plus de détails s'il vous plaît ... – mkamthan

+0

S'il vous plaît modifier la description pour expliquer quel langage de programmation que vous avez l'intention d'utiliser, et (si oui) baliser votre question avec cette langue. – bignose

+0

@mkamthan: essentiellement obtenir les identifiants et stocker dans un champ de courrier électronique dans la base de données. – Jony

Répondre

4

Il n'y a pas d'algorithme générique pour "prendre des données non structurées et les convertir en données structurées", non. Cela dépend fortement de la gamme d'entrée possible, de la structure souhaitée et des conversions à appliquer, etc.

La classe de problème est appelée "analyse": vous devez construire un analyseur pour les entrées spécifiques que vous attendez, et utilisez cet analyseur pour générer une structure à partir de ce qu'il découvre à propos de l'entrée que vous obtenez.

Votre langage de programmation aura probablement des bibliothèques d'analyse disponibles pour aider à la construction d'un analyseur spécifique.

+0

pouvez-vous nous dire des parseurs tiers qui peuvent le faire? – Jony

Questions connexes