J'ai recherché des méthodes pour cela, mais l'utilisation de count (unique()) ne recherche pas d'autres facteurs. Un exemple de jeu de données est ci-dessous.Recherche de dénombrements taxonomiques uniques basés sur la hiérarchie
+------+------+--------------+----------------+-----------+-------+
| Site | Date | TaxonID | Family | Genus | Count |
+------+------+--------------+----------------+-----------+-------+
| X1 | 2006 | Chironomidae | Chironomidae | - | 2 |
| X1 | 2006 | Saetheria | Chironomidae | Saetheria | 1 |
| X1 | 2006 | Chimarra | Philopotamidae | Chimarra | 5 |
+------+------+--------------+----------------+-----------+-------+
Counting TaxonID serait plus compter, puisque dans ce cas la ligne 1 ne doit pas être prise en compte en raison de quelque chose identifié inférieur à ce niveau taxonomique, à savoir la ligne 2.
Dans cet ensemble de données, en comptant les valeurs uniques Le genre fonctionnera, mais dans un exemple où la ligne 2 n'est pas présente, ce ne sera pas le cas.
Ceci est une table tronquée, où normalement Phylum, Class et Order sont également présents, et TaxonID peut être quelque chose dans l'un de ces champs.
Je ne sais pas si je comprends ce que vous demandez. –
J'avais peur de ne pas être assez clair. Je cherche essentiellement à trouver le nombre de groupes uniques. Peut-être un autre exemple serait, table rouge, chaise rouge, NA rouge, NA bleu. Ici, la table rouge, la chaise rouge et la NA bleue sont uniques et le facteur de niveau supérieur, la couleur, est ignoré si un facteur de niveau inférieur, objet, existe mais n'est pas ignoré s'il n'y a pas d'entrée de facteur de niveau inférieur. Cela clarifie-t-il mieux? –
Et qu'attendez-vous à la suite de cela? Je veux dire dans votre exemple posté. 2 ou 3? –