I ont un ensemble de données similaire à ceci:Comment fusionner les doublons dans les tableaux de python 2D
# Start_Time End_Time Call_Type Info
1 13:14:37.236 13:14:53.700 Ping1 RTT(Avr):160ms
2 13:14:58.955 13:15:29.984 Ping2 RTT(Avr):40ms
3 13:19:12.754 13:19:14.757 Ping3_1 RTT(Avr):620ms
3 13:19:12.754 Ping3_2 RTT(Avr):210ms
4 13:14:58.955 13:15:29.984 Ping4 RTT(Avr):360ms
5 13:19:12.754 13:19:14.757 Ping1 RTT(Avr):40ms
6 13:19:59.862 13:20:01.522 Ping2 RTT(Avr):163ms
...
Quand je parse à travers elle, je dois fusionner les résultats de Ping3_1
et Ping3_2
, prendre la moyenne de ceux deux lignes et l'exportation que d'une ligne, de sorte que la fin du résultat serait comme ceci:
# Start_Time End_Time Call_Type Info
1 13:14:37.236 13:14:53.700 Ping1 RTT(Avr):160ms
2 13:14:58.955 13:15:29.984 Ping2 RTT(Avr):40ms
3 13:19:12.754 13:19:14.757 Ping3 RTT(Avr):415ms
4 13:14:58.955 13:15:29.984 Ping4 RTT(Avr):360ms
5 13:19:12.754 13:19:14.757 Ping1 RTT(Avr):40ms
6 13:19:59.862 13:20:01.522 Ping2 RTT(Avr):163ms
...
Actuellement, je concaténer des colonnes 0 et 1 pour faire une clé unique, trouver la duplication là, puis en faisant la reste du traitement spécial pour ces pings parallèles. Ce n'est pas élégant du tout. Je me demande juste quelle est la meilleure façon de le faire. Merci!
Les doublons sont-ils toujours sur des lignes adjacentes? –