Avez-vous déjà été confronté à une liste de clients comportant des doublons en raison de la conservation de l'historique des adresses ? Vous vous demandez comment ne garder que les données les plus récentes, comme la dernière date de mise à jour ?
Pas de panique ! Nous avons la solution pour vous. Que vous soyez novice ou expert en Excel, cette méthode simple vous permettra de nettoyer efficacement vos données et de conserver uniquement les informations les plus pertinentes pour vos analyses.
1. Identifiez une Clé Unique
Avant de commencer, assurez-vous d'avoir une clé unique pour chaque client.
- Un identifiant unique facilite la recherche, la mise à jour et l'organisation des informations.
- Sans identifiant unique, il est difficile de faire référence à des données spécifiques de manière cohérente.
Dans notre exemple, l'identifiant c'est l'email de nos clients. En effet, un email est propre à une personne alors qu'avec des noms de famille, il est possible d'avoir des noms identiques pour des personnes différentes
2. Utilisez la Fonction MAX.SI.ENS
La première étape consiste à utiliser la fonction MAX.SI.ENS dans Excel. En effet, MAX.SI.ENS va renvoyer la date la plus récente (la date maximale), parmi toutes les lignes relatives à un même email.
Dans notre cas, la construction de la fonction est assez simple
- Écrire le nom de la fonction =MAX.SI.ENS
- Sélectionner la colonne avec les dates de mise à jour
- Sélectionner la colonne avec les emails
- Indiquer comme critère de sélection, un email.
Les dates sont affichées au format de nombre "Standard". Mais en appliquant le format Date, vous affichez correctement vos dates dans les cellules.
Analysons le résultat.
- Nous pouvons voir, que pour chaque email, la fonction MAX.SI.ENS va renvoyer la date maximale parmi toutes les lignes qui ont le même email.
- Ainsi pour Sarah Leblanc, c'est la date du 25/10/2019 qui est renvoyée car c'est la plus grande valeur parmi les 3 dates, 13/12/2015, 11/05/2016 et 25/10/2019
- De même pour Nicolas Charpie, le résultat c'est le 29/08/2021 car, parmi les 2 lignes avec le même email, c'est la date la plus élevée
3. Convertir le résultat en test
Maintenant, nous allons convertir cette formule en un test logique. Pour chaque ligne, nous allons
- Utiliser le résultat de la fonction MAX.SI.ENS
- Pour le comparer avec la date de la mise à jour
De cette façon, lorsqu'il y a égalité, nous aurons la certitude que la date est la date la plus récente pour chaque email donné.
4. Filtrer les Résultats
Il ne reste plus qu'à appliquer un filtre sur la valeur VRAI pour conserver les lignes avec la date de mise à jour la plus récente.
En suivant ces étapes simples, vous pourrez facilement nettoyer vos historiques de données clients. Vous vous assurerez que vous disposez toujours des informations les plus récentes à partir de la date de mise à jour.
Vidéo tutorielle
Retrouver les explications dans cette vidéo.