2016-03-07 1 views
0

Y at-il une bibliothèque java ou un modèle regex pour extraire le hashtag et la mention de l'utilisateur de la légende des médias instagram? Je connais twitter-text api mais il ne peut pas gérer le hashtag de l'espace.extrait hashtag et mention d'instagram

+0

Vous devriez commencer ici 'https: // www.instagram.com/developer'. Si cela ne fonctionne toujours pas, affichez votre code qui montre le problème. – SubOptimal

Répondre

0

Celui-ci devrait fonctionner (^|\s)(#[a-z\d-]+) (obtenu à partir here)

Quoi qu'il en soit, si vous utilisez l'API Instagram, il y a une partie du résultat lorsque vous l'appelez qui vous donne tous les hashtags:

["data"]=> 
    array(14) { 
    ["attribution"]=> 
    NULL 
    ["tags"]=> 
    array(3) { 
     [0]=> 
     string(13) "workingermany" 
     [1]=> 
     string(18) "trabajarenalemania" 
     [2]=> 
     string(10) "radeberger" 
    } 

Si, comme l'a demandé dans votre commentaire, vous devez les caractères coréens, il suffit de les ajouter à l'expression régulière comme ceci: (^|\s)(#[a-z\p{Hangul}\d-]+) plus alphabets que vous voulez, plus ensemble de caractères vous devez ajouter, comme \p{Hiragana}, \p{Katakana}, ou \p{Latin}

+0

il ne peut pas gérer pour aucun hashtag de l'espace et coréen, chinois, japonais ..language. comme "# hello # world # 안녕하세요" – Seongju

+0

voir le edit @Seongju – SpongePablo