2009-04-10 4 views
1

Ceci est spécifique au domaine de la santé. Quelles solutions/outils utilisez-vous pour masquer les données PHI lors de la copie des données de la production vers les environnements de test?Masquage/brouillage de données

+0

Vous voulez dire anonymizer? – Naveen

+0

oui, en quelque sorte. l'idée est de masquer/brouiller les données afin que les RPS ne puissent être identifiés. – kishore

Répondre

0

Non spécifique à l'industrie des soins de santé, mais nous avions une exigence similaire pour les clients de télécommunications. Nous voulions être en mesure de fournir des données représentatives dans les systèmes de test, mais nous assurer qu'aucune information sensible n'a été copiée.

À cette fin, nous avons essayé un certain nombre de choses, y compris ceux que nous avons opté pour:

  1. Vues qui seraient utilisés à la place du tableau des accès directs - ces vues seraient essentiellement joindre des informations non sensibles à partir de la table réelle avec des informations fictives à partir de tables distinctes. L'information fictive a remplacé toutes les informations sensibles de la table réelle.

  2. Transfert de données via un filtre de nettoyage. Cela déchargerait la base de données de production et la passerait à travers un programme d'anonymisation qui remplacerait les informations sensibles. Pour les cas simples, des choses comme les adresses étaient toutes identiques.

  3. Similaire à (2) ci-dessus mais le filtre pourrait utiliser des données provenant de données de recherche spécifiques. Par exemple, une adresse peut être formée avec un numéro de rue à 4 chiffres, un nom parmi les 1000 noms de rues les plus courants, un type de rue (ST, RD, CRES, WAY, PLACE, etc.) et une base de données de villes. Un numéro de téléphone peut être n'importe quelle séquence de dix chiffres (sous réserve des exigences de l'opérateur) mais sans duplication.

Questions connexes