2017-10-20 4 views
0

J'ai une trame de données et je veux savoir comment puis-je sélectionner des données qui contiennent un mot spécifique pour, par exemple, TissueA. Pour l'une de mes questions, il est écrit "Combien des échantillons sont des échantillons TissueA?"Comment sélectionner et extraire des données spécifiques dans un bloc de données dans R?

Pour le mettre en contexte, j'ai une photo de la table en Excel. La première colonne de chaque rangée est l'identificateur de gène: (gène-symbole | entrée ID), par ex. "A2M | 2" (A2M est le gène-symbole et 2 est l'identificateur de la base de données de la macroglobuline alpha 2)

Chaque identificateur d'échantillon est au format: TCGA-ID_Tissue # où le tissu est "TissueA" ou "TissueB" " par exemple "TCGA-AA-3548_TissueA"

J'ai essayé avec
df[which(df$TissueA)] qui me donne une erreur. Je cherche essentiellement à trier tous les patients qui ont un tissu A et voir combien.

Screenshot of Table

+2

des questions d'application de devoirs ou d'un emploi SHLD être RLY marqués comme tels. – hrbrmstr

Répondre

0

Vous pouvez utiliser

df[grep("TissueA", names(df)] # Extract 

sum(grepl("TissueA", names(df)) # Count