Quelle est la meilleure approche pour identifier des entités et les extraire de textes en utilisant ma propre ontologie de domaine?Résolution d'entité provenant d'une ontologie spécifique à un domaine
Répondre
Avez-vous consulté l'un des services IBM Watson sur IBM Bluemix? J'ai rédigé un bref résumé de tous les services disponibles sur mon blog; voir: Meet the real Watson. Je sais que Watson Knowledge Studio vous permet d'identifier des entités et des relations dans des textes existants via une interface graphique. Je sais aussi que le service AlchemyAPI a une reconnaissance d'entité, mais je n'ai pas personnellement appris à le former avec ma propre ontologie (donc, je ne peux pas dire avec certitude si c'est possible ou non).
Je remarqué aussi que d'autres ont fourni des conseils et des liens intéressants sur Quora sous la question, Traitement du langage naturel: What APIs and libraries can extract dates, times, places, and other logistical information from unstructured text?
Vous pouvez utiliser Apache Stanbol pour construire un pipeline de reconnaissance d'entités de domaine spécifique pour vocabulaires personnalisés: https://stanbol.apache.org/docs/trunk/customvocabulary.html