Considérons la matrice a
réseau de diffusion 1D contre tableau 2D pour lexsort: Permutation pour trier chaque colonne indépendamment lorsque l'on considère encore un autre vecteur
np.random.seed([3,1415])
a = np.random.randint(10, size=(5, 4))
a
array([[0, 2, 7, 3],
[8, 7, 0, 6],
[8, 6, 0, 2],
[0, 4, 9, 7],
[3, 2, 4, 3]])
je peux créer b
qui contient la permutation pour trier chaque colonne.
b = a.argsort(0)
b
array([[0, 0, 1, 2],
[3, 4, 2, 0],
[4, 3, 4, 4],
[1, 2, 0, 1],
[2, 1, 3, 3]])
Je peux trier a
avec b
a[b, np.arange(a.shape[1])[None, :]]
array([[0, 2, 0, 2],
[0, 2, 0, 3],
[3, 4, 4, 3],
[8, 6, 7, 6],
[8, 7, 9, 7]])
Ce fut l'amorce pour illustrer la sortie que je cherche. Je veux un tableau b
qui a la permutation requise pour trier la colonne correspondante dans a
en considérant également un lexsort
avec un autre tableau.
np.random.seed([3,1415])
a = np.random.randint(10, size=(10, 4))
g = np.random.choice(list('abc'), 10)
a
array([[0, 2, 7, 3],
[8, 7, 0, 6],
[8, 6, 0, 2],
[0, 4, 9, 7],
[3, 2, 4, 3],
[3, 6, 7, 7],
[4, 5, 3, 7],
[5, 9, 8, 7],
[6, 4, 7, 6],
[2, 6, 6, 5]])
g
array(['c', 'a', 'c', 'b', 'a', 'a', 'a', 'b', 'c', 'b'],
dtype='<U1')
Je veux produire un réseau b
où chaque colonne est la permutation requise pour lexsort
la colonne correspondante a
. Et le lexsort
est de trier la colonne d'abord par les groupes définis par g
puis par les valeurs dans chaque colonne dans a
.
Je peux générer les résultats avec:
r = np.column_stack([np.lexsort([a[:, i], g]) for i in range(a.shape[1])])
r
array([[4, 4, 1, 4],
[5, 6, 6, 1],
[6, 5, 4, 5],
[1, 1, 5, 6],
[3, 3, 9, 9],
[9, 9, 7, 3],
[7, 7, 3, 7],
[0, 0, 2, 2],
[8, 8, 0, 0],
[2, 2, 8, 8]])
Nous pouvons voir que cela fonctionne
g[r]
array([['a', 'a', 'a', 'a'],
['a', 'a', 'a', 'a'],
['a', 'a', 'a', 'a'],
['a', 'a', 'a', 'a'],
['b', 'b', 'b', 'b'],
['b', 'b', 'b', 'b'],
['b', 'b', 'b', 'b'],
['c', 'c', 'c', 'c'],
['c', 'c', 'c', 'c'],
['c', 'c', 'c', 'c']],
dtype='<U1')
et
a[r, np.arange(a.shape[1])[None, :]]
array([[3, 2, 0, 3],
[3, 5, 3, 6],
[4, 6, 4, 7],
[8, 7, 7, 7],
[0, 4, 6, 5],
[2, 6, 8, 7],
[5, 9, 9, 7],
[0, 2, 0, 2],
[6, 4, 7, 3],
[8, 6, 7, 6]])
Question
Existe-t-il un moyen de "diffuser" l'utilisation du tableau de regroupement g
pour une utilisation dans toutes les colonnes lexsort
? Quel est un moyen plus efficace de le faire?
C'est super intelligent – piRSquared
@piRSquared L'idée est la même que celle-ci - https://stackoverflow.com/a/40588862/3293881 – Divakar