2015-11-28 3 views
3

J'ai étudié la valeur par défaut UIMA Ruta Workbench projet Eclipse assez pour comprendre de manière significative ses pièces en mouvement - par exemple, pourquoi les dossiers input/ et output/ se comportent comme ils le font, comment réaliser le projet en utilisant les jcasgen et d'autres plugins Maven, etc.Comment/êtes-vous censé utiliser les bibliothèques DKPro avec UIMA Ruta?

Mais même après avoir étudié le projet et joué avec Maven pour essayer de le faire fonctionner, j'ai toujours beaucoup de mal à faire quelque chose de très simple: utiliser les bibliothèques DKPro (les types en particulier) d'un script Ruta.

Ma question fondamentale est la suivante: quel est le chemin de moindre résistance à l'utilisation des types et des composants d'analyse des bibliothèques DKPro et TC dans un script Ruta?

Mes questions spécifiques sont:

  1. je remarquai que dans le dossier desc/type de nombreux api pots il y a TypeSystemDescription fichiers XML qui semblent convenir à une utilisation avec Ruta. Y at-il un moyen d'obtenir un "maître" TypeSystemDescription fichier XML pour les composants DKPro?

  2. Y a-t-il un projet d'une complexité significative qui utilise à la fois Ruta et DKPro que je peux étudier?

  3. Quelle est la distinction entre un AnalysisEngine comme dans ce que vous faites avec Ruta scripts et un Analysis Component vous écrivez en Java?

Edité pour refléter moins de frustration

Répondre

3

En fait, les gens Ruta et DKPro faire des ateliers ensemble et s'asseoir joyeusement autour du feu de camp plus tard - ou tout au moins dans un bar à cocktails et boire quelques verres. Malheureusement, nous n'arrivons pas à le faire très souvent.

Le genre et le nombre de questions que vous posez des appels à un cours d'instruction;)

Avez-vous regarder les diapositives et des exemples de notre joint workshop at GSCL 2013?

Il comprend plusieurs exemples d'utilisation conjointe de DKPro Core et Ruta. Dans ces exemples, il y a un projet Maven chargé d'aller chercher les dépendances DKPro Core et de séparer les projets Ruta, puis d'avoir une dépendance sur ce projet Maven et d'utiliser les moteurs d'analyse.

Il devrait également travailler pour avoir un seul projet avec les natures Ruta et Maven.

  1. La manière d'obtenir un descripteur de type pour tous les types DKPro de base dans votre classpath (ou plutôt pour tous les types possibles uimaFIT-dans votre classpath) est

    import org.apache.uima.fit.factory.TypeSystemDescriptionFactory; 
    
    OutputStream os = ... 
    TypeSystemDescriptionFactory.createTypeSystemDescription().toXML(os); 
    
  2. Vérifiez la GSCL 2013 tutorial examples.

  3. AnalysisComponent représente la vue depuis l'intérieur , à savoir du point de vue du développeur de composants (la vue depuis l'intérieur du cadre). AnalysisEngine représente la vue de l'extérieur, c'est-à-dire de l'utilisateur d'un composant/flux de travail. Cependant, typiquement on dirait "je suis en train d'implémenter un nouveau moteur d'analyse" et je veux dire "je vais sous-classer JCasAnnotator_ImplBase (une implémentation de AnalysisComponent)". Voir également this post sur la liste de diffusion des développeurs UIMA.

Divulgation: Je suis un développeur de base DKPro et un développeur Apache UIMA.

+0

Désolé pour le ton de la question originale ... cela reflétait beaucoup de frustration. J'ai fini par me rendre compte que je pouvais réellement importer des descripteurs de type via 'IMPORT desc.type.' (dur pour moi). La Ruta intellisense laisse à désirer et je pense que le namespacing est trop ambigu ou agressif ou les deux. J'ai eu l'impression que vous ne respectiez pas Ruta d'un article que j'ai lu quelque part (peut-être je peux le trouver) où il était recommandé de ne pas utiliser Ruta pour plusieurs raisons :) - Je vais * certainement * vérifier le tutoriel ce soir –

+0

Pour être clair, j'apprécie vraiment d'utiliser vos bibliothèques; c'est un vrai privilège et je peux dire combien de sueurs et de larmes ont déjà coulé dedans (et je ne suis même pas en train d'enquêter sur le noyau, encore moins sur TC ou d'autres projets) ... alors comme un suivi, comment êtes-vous en développement et existe-t-il un groupe d'utilisateurs ou une liste de diffusion ou d'autres ressources communautaires que vous recommandez? Je n'ai pas l'intention de spammer ou même de publier une seule question en dehors de SO, mais cela ne me dérangerait pas de voir ce que vous faites –

+0

Nous sommes heureux d'avoir vos questions et commentaires sur les listes de diffusion des projets respectifs. Apache UIMA a une liste de diffusion d'utilisateurs et puisque Ruta et uimaFIT sont des sous-projets d'UIMA, ils utilisent le même. Tous les différents projets DKPro ont leurs propres listes de diffusion sur Google Groupes - ou simplement regarder nos projets Github. – rec