Je souhaite marquer "a.b.c
" en a, a.b, a.b.c, b.c, b, c
parties dans ElasticSearch. J'ai essayé quelques regex mais mettre à jour tokenizer est fastidieux et je suis très mauvais à regex donc je demande de l'aide.Modèle Tokenizer pour l'extraction du nom de fichier
je l'ai déjà essayé cette formule mais ils ne m'a donné ce que je veux:
[(^\\.)]+
[(.+\\.)]+
[^\\p{L}\\d]+
pourrait vous s'il vous plaît, donner plus breif sur votre condition réelle !! :) –
c'est exigence réelle! nom de fichier tokenizing dans ses parties – vakarami