2016-10-12 3 views
-3

Je veux développer un système de prédiction de la santé en utilisant l'exploration de données. Quelqu'un peut-il me donner quelques conseils sur la façon de le développer? L'exigence est que lorsque l'utilisateur entre les premiers symptômes, le système vérifiera dans combien de maladies ces mêmes symptômes après ce système donneront quelques options liées aux symptômes afin qu'il puisse différencier entre ces maladies et puisse en déduire quelle est la maladie. . Le composant ajouté ici (et c'est ici que les parties de data mining et de prédiction interviennent) est que, lorsque l'utilisateur entre un symptôme, il doit également suggérer d'autres symptômes qu'ils pourraient également rencontrer. Par exemple, s'ils ont de la fièvre, il y a une forte probabilité qu'ils aient aussi des frissons, alors quand ils entrent dans la «fièvre», ils devraient suggérer des «frissons» comme un symptôme supplémentaire.Système de prévision de la santé à l'aide de l'exploration de données dans j2ee

enter image description here

+0

Je suis confus; Quelle est votre vraie question? Que voulez-vous dire par "quelques conseils?" Pouvez-vous être plus précis sur ce que vous avez besoin d'aide? – EJoshuaS

+0

Je ne dis pas que j'ai besoin de tout le code, mais je ne sais pas comment le développer, j'ai besoin d'une idée de la façon d'aller de l'avant. D'où devrais-je commencer. – Hetaram

+0

On ne sait pas ce que vous avez fait jusqu'à présent. Avez-vous un design? Avez-vous rassemblé vos exigences? – EJoshuaS

Répondre

0

est ici une conception de base de données possible:

enter image description here

Voici un exemple de ce que les données ressemblerait à ceci: enter image description here Donc, en gros, cela veut dire que les symptômes de la La grippe est la fièvre, les frissons et la fatigue, mais les symptômes d'un rhume sont simplement de la «fatigue». (Evidemment ce n'est pas tout à fait complet mais c'est bon pour l'illustration). Une personne a cherché une maladie dont les symptômes étaient «fièvre» et «frissons». Une deuxième personne a cherché une maladie dont les symptômes n'étaient que des "frissons". Une troisième personne a cherché une maladie dont les symptômes étaient «fièvre» et «fatigue».

Les recherches seraient effectuées avec une procédure stockée: vous entrez un ou plusieurs symptômes et insère un enregistrement de la recherche dans la table SearchHistory et récupère une liste de maladies associées à celles-ci.

Si vous souhaitez calculer les probabilités d'apparition simultanée de deux symptômes, vous pouvez utiliser une fonction définie par l'utilisateur qui calcule le pourcentage de recherches contenant les deux symptômes. Par exemple, si les recherches 1, 2 et 3 ont des symptômes de fièvre et de frissons, mais que la recherche 4 a de la fièvre et de la fatigue et que la recherche 5 n'a que des frissons, il y a 60% de chances quelqu'un qui cherche "fièvre" cherchera aussi "frissons".

Il y a aussi 20% de chances que quelqu'un qui cherche "fièvre" cherchera aussi "fatigue", mais dans ce cas l'échantillon est évidemment trop petit pour savoir si c'est vraiment représentatif. (C'est l'un des inconvénients de cette conception - vos prédictions s'amélioreront au fil du temps, mais les premières prédictions ne seront peut-être pas trop précises). L'avantage de ceci est que vous n'avez pas besoin d'entrer manuellement des données sur les probabilités que des symptômes se produisent ensemble, et que le système s'adapte "automatiquement" et s'améliore avec le temps (c.-à-d. vous obtenez plus de données) en fonction de ce que les utilisateurs de votre système recherchent. L'inconvénient, bien sûr, est que vous n'auriez que des données sur les symptômes cooccurrents probables une fois que les gens ont commencé à utiliser le système, donc les premiers utilisateurs n'auraient pas l'avantage d'avoir les prédictions, et cela prendrait un peu de temps avant, il était tout aussi précis de prédire quels symptômes sont susceptibles de "aller ensemble". (Pensez au cas ci-dessus où vous prédisiez une probabilité de 20% de «fièvre» et de «fatigue» en se fondant uniquement sur une seule recherche).

Espérons que cela aide certains.

+0

Désolé mais je ne comprends pas comment le développer – Hetaram

+0

@Hetaram Pouvez-vous être plus précis sur ce que vous êtes confus au sujet de? – EJoshuaS

+0

C'est un concept totalement nouveau pour moi. Je ne sais pas comment l'appliquer. Vous avez fourni des données où vous avez créé deux tables une pour les symptômes et une autre pour les maladies, mais je n'ai qu'une seule table et les attributs sont id, nom, symptômes, type. Alors, comment puis-je l'implémenter en utilisant ce concept? – Hetaram