J'analyse des données de séquence ADN/protéine avec python et j'ai un problème. Voici la table de la séquence d'ADN.résumer le chevauchement avec python
Je veux les analyser comme les deux groupe1 et groupe2. Par exemple, AAATTT_TTTCCC ou GGGCCC_GGAAA sont des paires. Ces données de séquence montrent parfois la même séquence. Par exemple, AAATTT est apparu trois fois et AGTC deux fois. Je veux compter cette séquence de chevauchement et résumer comme ci-dessous. Je me demande si je devrais utiliser des pandas, mais je ne sais pas comment faire. Si quelqu'un pouvait aider cela, je serais très reconnaissant avec cela.
Donc, vous voulez juste compter le nombre de fois que chaque valeur Groupe1 unique, apparaît? Pourquoi Group2 est-il une colonne dans votre tableau récapitulatif? – sundance
Oh, je veux aussi la séquence group2 si la séquence Group1 est la même! –