Cinq raisons d'abandonner les méthodes de classification manuelle des données
May 1, 2018
Qu'est-ce que la classification des données et à quel point est-ce difficile ? À première vue, Netwrix Data Classification ne semble pas difficile. Il y a quatre étapes clés dans le processus :
- Saisir des actifs, tels que les e-mails et les documents électroniques, dans le registre des actifs
- Classer chaque actif selon sa sensibilité
- Étiquetage de l'actif en fonction de sa classification
- Gérer l'actif en fonction de sa classification (par exemple, chiffrer les e-mails classés comme « confidentiels »)
Effectuer ces étapes manuellement nécessite de former les propriétaires de données ou d'autres utilisateurs à classer les documents selon votre data classification policy. Bien que les humains soient bien meilleurs que les machines pour comprendre le contexte des documents, à mesure que le nombre d'actifs, de niveaux de classification et de règles augmente, la classification des données devient rapidement compliquée et les processus manuels s'effondrent. Voici cinq raisons d'automatiser la classification des données.
Contenu connexe sélectionné :
Raison n°1. La classification manuelle des données est subjective et incohérente.
Comme le dit le proverbe, la beauté est dans l'œil de celui qui regarde. De même, décider quelles informations sont sensibles peut être subjectif. Même si deux personnes sont toutes deux formées pour classer les données, elles vont parfois étiqueter des données similaires différemment. En fait, même un individu seul pourrait étiqueter de manière incohérente un contenu similaire, surtout s'il y a beaucoup d'étiquettes parmi lesquelles choisir. Enfin, la qualité de la Netwrix Data Classification dépend également de l'engagement du propriétaire, ce qui peut entraîner une incohérence à travers l'organisation.
Raison n°2. Les utilisateurs négligent la Netwrix Data Classification car ils n'y voient aucune valeur.
La classification des données est rarement intégrée aux processus d'affaires ; au lieu de cela, c'est une tâche supplémentaire maladroite à laquelle les utilisateurs ne voient guère d'intérêt, donc ils l'ignorent si c'est possible. Si la direction exige qu'ils le fassent, ils font souvent un travail médiocre, par exemple, en sélectionnant simplement la première étiquette de la liste pour accélérer la tâche. Cela conduit à des classifications incomplètes ou incorrectes — et avoir des informations erronées sur vos données peut être encore pire que de ne pas avoir d'informations du tout, car vous pourriez vous concentrer sur les mauvaises données et laisser vos actifs réellement précieux avec une protection insuffisante.
Raison n°3. Les données ne sont pas statiques.
Les fichiers sont généralement classifiés au moment de leur création, mais les données — en particulier les données non structurées — changent tout le temps. Il n'y a aucune garantie que la classification originale d'un fichier reste précise tout au long de son cycle de vie. Et comme nous venons de le voir, si la classification n'est pas correcte, les règles de manipulation de l'information appliquées pourraient être insuffisantes pour protéger les données.
Contenu connexe sélectionné :
Raison n°4. La classification manuelle est complexe et coûteuse.
La plupart des organisations disposent à la fois d'une grande variété de données et d'un large volume de données. En conséquence, les classer manuellement est une tâche complexe, chronophage et coûteuse.
Raison n°5. Il est facile de passer à côté d'informations sensibles.
Lorsque vous commencez à classifier des données, vous pouvez certainement demander aux utilisateurs de classifier les nouveaux fichiers au fur et à mesure de leur création. Mais qu'en est-il de toutes les données déjà stockées sur vos serveurs de fichiers ? Si vous les excluez en les considérant hors de portée, vous risquez de laisser des données sensibles vulnérables. Mais essayer de trier manuellement des masses de données non structurées serait excessivement chronophage et extrêmement sujet à des erreurs. Ce serait comme essayer de faire manuellement le travail d'un moteur de recherche qui parcourt internet pour indexer des données.
Contenu connexe sélectionné :
Il existe certaines stratégies qui peuvent aider à atténuer ces défis avec la classification manuelle des données. Vous pouvez essayer :
- Donner aux employés une formation supplémentaire pour améliorer la cohérence de leur travail de classification
- Simplification de votre schéma de Netwrix Data Classification
- Classer des dossiers au lieu de documents individuels pour gagner du temps si vous avez beaucoup de données
- Exclure des départements entiers de la classification si leurs données ne semblent pas susceptibles de contenir les actifs les plus vitaux sur lesquels vous devez vous concentrer en premier
Cependant, un logiciel de Netwrix Data Classification fournira de bien meilleurs résultats avec beaucoup moins d'effort, garantissant que les règles de classification sont appliquées de manière cohérente et que la sensibilité des données est réévaluée lorsque les données changent. En conséquence, vous n'aurez pas à craindre de laisser vos actifs les plus critiques vulnérables sur la base d'informations incorrectes.
Partager sur
En savoir plus
À propos de l'auteur
Russell Smith
Consultant en TI
Consultant en TI et auteur spécialisé dans les technologies de gestion et de sécurité. Russell possède plus de 15 ans d'expérience dans le domaine des TI, il a écrit un livre sur la sécurité Windows et a coécrit un texte pour la série de cours académiques officiels de Microsoft (MOAC).
En savoir plus sur ce sujet
Du bruit à l'action : transformer le risque des données en résultats mesurables
Lois sur la confidentialité des données par État : Différentes approches de la protection de la vie privée
Qu'est-ce que la gestion des documents électroniques ?
Expressions régulières pour débutants : Comment commencer à découvrir des données sensibles
Partage externe dans SharePoint : Conseils pour une mise en œuvre judicieuse