J'essaie actuellement de classifier le texte. Mon jeu de données est trop grand et comme suggéré here, j'ai besoin d'utiliser une matrice clairsemée. Ma question est maintenant, quelle est la bonne façon d'ajouter un élément à une matrice clairsemée? Disons par exemple que j'ai une matrice X qui est ma contribution.SciPy NumPy et SciKit-learn, créer une matrice clairsemée
X = np.random.randint(2, size=(6, 100))
Maintenant cette matrice X ressemble à un ndarray d'un ndarray (ou quelque chose comme ça).
Si je ne
X2 = csr_matrix(X)
J'ai la matrice clairsemée, mais comment puis-je ajouter un autre élément à la matrice se font rares? par exemple cet élément dense: [1,0,0,0,1,1,1,0, ..., 0,1,0] à un vecteur clairsemé, comment l'ajouter à la matrice d'entrée clairsemée?
(BTW, je suis très nouveau au python, scipy, numpy, scikit ... tout)
Vous devriez vraiment lire ceci: http://scikit-learn.org/dev/auto_examples/document_classification_20newsgroups.html – zenpoy
Ceci est mon deuxième jour de travail avec python, c'est un peu exagéré pour une deuxième journée à lire. Je l'ai trouvé aussi btw – Ojtwist
Certaines choses prennent simplement leur temps. Peut-être devriez-vous consacrer du temps à faire des tutoriels sur Python, Numpy et Scipy. Par exemple, dans la réponse à l'autre question, je vous ai indiqué quelques liens, et zenpoy vous en a donné un autre. Je suppose que vous n'avez pas lu ces liens, puisque vous avez posté cette question quelques minutes après avoir répondu à l'autre. – HerrKaputt