2017-07-24 1 views
0

Dans rapidminer, j'ai un attribut polynominal qui a des valeurs "Drame", "Comédie" et "Romance", mais certaines lignes sont à valeurs multiples, par exemple "Drame, Romance", est une façon que je peux afficher ces valeurs dans des rangées séparées?Afficher des valeurs polynominales multivaluées dans des rangées séparées par rapidminer

J'ai essayé l'opérateur split, mais il affiche des valeurs dans des attributs séparés, mais je veux afficher ces valeurs dans des lignes séparées.

Répondre

2

Je pense que ce que vous voulez faire est d'abord utiliser un opérateur Split obtenir les attributs séparés. la table serait comme:

word_1, word_2, word_3... 
Drama, Romance, 
Comedy, Romance 

..

Ensuite, vous pouvez utiliser un Depivot sur word_ \ d + pour les mettre dans les exemples individuels. Ci-joint un processus montrant cela.

Best, Martin

<?xml version="1.0" encoding="UTF-8"?><process version="7.5.003"> 
    <context> 
    <input/> 
    <output/> 
    <macros/> 
    </context> 
    <operator activated="true" class="process" compatibility="7.5.003" expanded="true" name="Process"> 
    <process expanded="true"> 
     <operator activated="true" class="generate_data_user_specification" compatibility="7.5.003" expanded="true" height="68" name="Generate Data by User Specification" width="90" x="45" y="85"> 
     <list key="attribute_values"> 
      <parameter key="word" value="&quot;Drama, Romance&quot;"/> 
     </list> 
     <list key="set_additional_roles"/> 
     </operator> 
     <operator activated="true" class="generate_data_user_specification" compatibility="7.5.003" expanded="true" height="68" name="Generate Data by User Specification (2)" width="90" x="45" y="187"> 
     <list key="attribute_values"> 
      <parameter key="word" value="&quot;Comedy, Thriller&quot;"/> 
     </list> 
     <list key="set_additional_roles"/> 
     </operator> 
     <operator activated="true" class="append" compatibility="7.5.003" expanded="true" height="103" name="Append" width="90" x="179" y="85"/> 
     <operator activated="true" class="split" compatibility="7.5.003" expanded="true" height="82" name="Split" width="90" x="447" y="85"/> 
     <operator activated="true" class="de_pivot" compatibility="7.5.003" expanded="true" height="82" name="De-Pivot" width="90" x="648" y="85"> 
     <list key="attribute_name"> 
      <parameter key="word" value="word_\d+"/> 
     </list> 
     <parameter key="index_attribute" value="id"/> 
     </operator> 
     <connect from_op="Generate Data by User Specification" from_port="output" to_op="Append" to_port="example set 1"/> 
     <connect from_op="Generate Data by User Specification (2)" from_port="output" to_op="Append" to_port="example set 2"/> 
     <connect from_op="Append" from_port="merged set" to_op="Split" to_port="example set input"/> 
     <connect from_op="Split" from_port="example set output" to_op="De-Pivot" to_port="example set input"/> 
     <connect from_op="De-Pivot" from_port="example set output" to_port="result 1"/> 
     <portSpacing port="source_input 1" spacing="0"/> 
     <portSpacing port="sink_result 1" spacing="0"/> 
     <portSpacing port="sink_result 2" spacing="0"/> 
    </process> 
    </operator> 
</process> 
0

Vous pouvez utiliser l'opérateur Nominal à Binominal pour créer de nouvelles colonnes pour chaque valeur distincte.

Best,

David

+0

Comme je l'ai dit: « Je veux afficher chaque valeur séparée En ligne séparée », actuellement je peux afficher chaque valeur dans l'attribut séparé (colonne) en utilisant l'opérateur Split. –