Je me demande comment je peux supprimer des lignes d'un ensemble de données contenant plus d'un certain nombre de caractères, en fonction de la somme de deux lignes.Supprimer les lignes en fonction du nombre de caractères
Par exemple, les données suivantes:
2 rs121065 0 17696224 T C
2 rs1860485 0 17696230 T C
2 rs237147 0 17696256 C CGAGGCAG
2 rs1909633 0 17696365 A G
2 rs574724 0 17696368 T C
Je voudrais supprimer la troisième ligne. Le problème est que la série de lettres est variable, et ainsi dans d'autres endroits, les données peuvent ressembler à ceci:
2 rs113308 0 17683654 CCTTT C
ou ceci:
2 rs103371 0 17667279 TG T
donc - en gros, une ligne qui contient plus de 2 caractères dans les deux dernières colonnes doivent être supprimés, et idéalement mon jeu de données ressemblera à ceci:
2 rs121065 0 17696224 T C
2 rs1860485 0 17696230 T C
2 rs1909633 0 17696365 A G
2 rs574724 0 17696368 T C
Toutes les suggestions sont grandement appréciés!
Quand vous dites « plus de 2 caractères » que cela veut dire que vous voulez garder une ligne qui a 2 caractères dans l'une des colonnes? c'est-à-dire que vous voulez vraiment dire "plus d'un personnage"? – GSee
Supprimer les lignes contenant plus d'un caractère avant la sommation des deux dernières colonnes, ou plus de deux caractères après la sommation. – mfk534