J'ai un fichier GFF nommé comme 50267.gff comme suitComment puis-je obtenir du contenu entre crochets en utilisant une expression régulière?
#start gene g1
dog1
dog2
dog3
#protein sequence = [DDDDDDDDDDDDDDDDDDDDDDDDDDDDDDDDDDDDDDDDDDD]
#end gene g1
###
#start gene g2
cat1
cat2
cat3
#protein sequence = [CCCCCCCCCCCCCCCCCCCCCCCCCCCCCCCCCCCCCCCCCCCCCC
#CCCCCCCCCCCCCCCCCCCCCCCCCCCCCCCCCCC]
#end gene g2
###
#start gene g3
pig1
pig2
pig3
...
Je veux obtenir le contenu entre parenthèses et faire nouveau fichier nommé comme 50267.fa comme suit
>g1_50267
DDDDDDDDDDDDDDDDDDDDDDDDDDDDDDDDDDDDDDDDDDD
>g2_50267
CCCCCCCCCCCCCCCCCCCCCCCCCCCCCCCCCCCCCCCCCCCCCCCCCCCCCCCCCCCC CCCCCCCCCCCCCCCCCCCC
...
import re. Vous pouvez utiliser globalement la regex suivante: \ [(. *?) \] –
Ce ne sont pas des parenthèses, ce sont des crochets. – Barmar
@HariomSingh crochets doivent être échappés – Barmar