J'utilise importtsv pour importer des données dans Hbase.Hbase - Importtsv - comment ne pas importer des champs vides
Dans mes fichiers tsv, certains champs sont vides. Comment puis-je faire pour ne pas les importer dans Hbase? Par exemple, j'ai une table appelée Test in Hbase. Mon fichier TSV appelé test.tsv ressemble à:
1 a b c d
2 q f s
Quand je fais:
hbase org.apache.hadoop.hbase.mapreduce.ImportTsv -Dimporttsv.columns=HBASE_ROW_KEY,I:c1,I:c2,I:c3,I:c4 Test test.tsv
Je ces résultats:
1 column=I:c1, timestamp=1400855636910, value=a
1 column=I:c2, timestamp=1400855636910, value=b
1 column=I:c3, timestamp=1400855636910, value=c
1 column=I:c4, timestamp=1400855636910, value=d
2 column=I:c1, timestamp=1400855636910, value=q
2 column=I:c2, timestamp=1400855636910, value=
2 column=I:c3, timestamp=1400855636910, value=f
2 column=I:c4, timestamp=1400855636910, value=s
Même si le deuxième champ est vide dans la ligne 2 de mon fichier tsv, un enregistrement est créé sur Hbase. Comment puis-je éviter cela?
un peu de chance avec ça? – Havnar
une chance à ce sujet? – Peter