F. Poulard : Datarama – Démocratiser l’accès aux retours clients exprimés textuellement
octobre 18, 2016 par Zélia DARNAULT
Fabien Poulard est titulaire d’un doctorat en informatique et a fondé l’entreprise Dictanova qui édite des logiciels d’analyse de l’expérience client. Dictanova offre une vision unifiée de l’avis du client sur son expérience, aide à identifier les actions prioritaires et contribue à développer une culture centrée sur le client dans l’organisation.
Fabien Poulard
« J’ai souhaité donner à ma présentation le sous-titre « journal d’une bataille en cours » car ce que je vais vous présenter aujourd’hui est un problème en cours de résolution.
Jusqu’à ces vingt dernières années, on était dans une quête ultime de la recherche de nouveaux clients. L’offre était alors inférieure à la demande, il était donc facile d’aller chercher de nouveaux clients. Aujourd’hui, il est 5 à 7 fois plus compliqué d’acquérir un nouveau client plutôt que d’en conserver un. La probabilité de vendre un produit ou un service à un client existant est de 60 à 70%, par contre la probabilité de vendre à un prospect est de 5 à 10%. En repositionnant son énergie non plus sur la conquête de nouveaux clients mais sur les clients existants on peut donc augmenter les profits. Améliorer la fidélité de 5% permettrait en effet une augmentation des profits de 25 à 95%.
Qui sont nos clients ? La plupart du temps, quand on essaye de répondre à cette question, on pense à une espèce de prototype qui ne représente rien de concret. Ce qui nous intéresse, c’est de savoir qui ils sont, ce qu’ils veulent et comment nous allons les servir grâce aux données. On connait déjà les données statiques qui ne bougent pas trop dans le temps : est-ce que le client est un homme, une femme, quelle est son adresse ou son statut social. On a ensuite des données transactionnelles relatives à la consommation du client et des données comportementales (comment le client se comporte face à un achat de produit). Toutes ces données sont assez maîtrisées, mais permettent-elles vraiment de connaître nos clients ? Ces données ne sont pas véritablement de la connaissance des clients, mais plutôt de la connaissance pour l’entreprise.
Pour aider à mieux connaître nos clients, on peut utiliser ce que l’on appelle le VOC (Voice Of Consumer) : c’est ce que disent nos clients. Aujourd’hui la voix peut être captée à toutes les étapes d’une expérience d’achat. Plusieurs points principaux sont en interaction avec le client : le site Internet ou l’application en ligne, le magasin, le paiement, le Service Après Vente, la livraison. Il est facile de mettre des capteurs sur chacune de ces étapes pour effectuer cette captation de voix du client. On a ainsi des informations qui concernent ce que le client pense de l’entreprise et comment il la perçoit. Cela fonctionne généralement avec une note mise par le client en fonction des différents services proposés. La voix du client est donc une matière très riche, une source permettant de connaître son avis pour agir sur sa fidélisation, sa loyauté. Mais les outils de statistiques descriptives s’appliquent mal à cette donnée textuelle, non structurée, non numérique. Il y a donc là un gros problème qui soulève de gros enjeux économiques.
Une des réponses à ce problème réside dans l’analyse sémantique : il s’agit d’identifier les éléments structurels dans un texte, le contexte, les perceptions positives et négatives. Cette réponse reste de l’ordre de la technologie : on va transformer le texte en autre chose, de l’ordre du numérique, mais on n’apporte pas de réponse sur l’usage.
Le véritable enjeu à utiliser cette voix du client est de rendre service, d’aider nos utilisateurs. Je vais vous raconter l’histoire de la naissance d’une visualisation en la découpant en itérations.
– Itération 1. On est capable d’identifier les concepts porteurs de sens dans les verbatims. On va donc chercher combien de fois ces concepts apparaissent dans les verbatims et on va les hiérarchiser. À partir d’une masse de texte dont on ne sait rien, il est possible d’établir des informations hiérarchisées. D’un côté, on va avoir des détails très pointus et de l’autre on va regrouper les mots qui ont le même sens dans des grandes catégories, puis distribuer ces thématiques et faire un histogramme.
– Itération 1 bis. On va rapprocher les titres de la valeur de la visualisation, en mettant tout à l’horizontal, il est plus facile de lire ce type de graphiques quand on travaille sur un écran et cela laisse de la place pour ajouter d’autres informations. La représentation est alors plus facile à lire, avec des sujets hiérarchisés dont on perçoit mieux l’importance. Par contre, cette représentation s’éloigne de la notion de performance : on dit ce qui est important mais pas en quoi cela joue sur la performance.
– Itération 2. Elle consiste à ajouter de la donnée. Si on est seulement sur le texte, on ne va pas loin. On va donc ajouter la note de satisfaction, ce qui va nous permettre de contextualiser l’analyse. Les questions de type sont « quelle est la probabilité que vous recommandiez cet organisme à votre entourage ? » avec une note de 0 à 10, ce qui va nous permettre de comprendre, d’une part, si le client est satisfait, mais aussi, d’autre part, s’il est tellement satisfait qu’il va être un nouveau levier pour promouvoir l’entreprise. Les clients qui attribuent une note comprise entre 9-10 sont qualifiés de promoteurs, ceux qui attribuent une note entre 7 et 8 sont qualifiés de passifs, ceux qui attribuent une note inférieure à 7 sont qualifiés de détracteurs. En associant cet indicateur là au texte, il est possible d’analyser l’information. Pour chaque sujet, la note est redistribuée en fonction des sujets analyse. Cela permet d’ avoir une idée précise de ce dont les promoteurs et détracteurs parlent le plus. Ainsi on se rapproche de la notion de performance. Il sera possible de mettre en valeur les critères qui nous permettent de voir ce qui est important pour le client. Un lien est établi entre le sujet abordé et la performance et permet une vision d’ensemble de la catégorie des clients.
– Itération 3. Le problème avec ce genre de représentation c’est qu’on perd l’importance du sujet. La notion d’importance doit être réintégrée en terme de volume dans la représentation. On obtient alors un graphique que l’on doit voir sur trop de dimensions, qui n’est pas facile à lire. Il n’y a pas d’ordre total : soit on le regarde avec l’entrée « importance », soit avec l’entrée « performance », mais on ne peut pas regarder les deux entrées car notre cerveau n’en est pas capable. On n’a pas assez de place pour intégrer la dynamique temporelle.
– Itération 4. Il faut arriver à établir un ordre total sur tous ces indicateurs. Il s’agit donc de combiner l’importance du sujet et la performance, ce qui n’est pas possible sur le plan visuel. Il faut faire appel aux mathématiques et à une combinaison arithmétique qui permettent de sortir un score. Il n’y a donc plus qu’une seule valeur numérique, qui peut être représentée avec des visualisations classiques. Même si ce graphique est facile à utiliser, il est important d’ajouter un texte sous la forme de verbatims pour voir ce que les gens ont voulu dire : le simple fait d’employer le langage naturel simplifie la lecture et lève les ambiguités. On simule ensuite un score global qui permet de voir si on agit sur ce point précis; quelle est la marge de progression potentielle. Le fait d’avoir un ordre total permet d’ordonner les sujets par importance. Le lien entre importance et performance est retrouvé avec ce type de représentation, la notion de temps et le sujet est plus explicite. En combinant ces critères, on voit le sujet réel qui peut permettre d’impacter la décision. Le problème de cette représentation est qu’il est difficile de comparer les sujets. C’est également plus compliqué de comprendre le fonctionnement de l’indicateur.
– Itération 5 (en cours). Dans la dernière itération, on a quitté le côté visuel pour aller vers une vision presque narrative des choses : comment tel élément a généré telle action et quels impacts cela a pu avoir. Cela donne une représentation globale mais qui perd le côté visuel. Pourquoi s’éloigner de ce côté visuel ? Avant, on travaillait avec des analystes qui voulaient avoir une vision d’ensemble, détaillée. De l’autre côté, on a des opérationnels qui se moquent du détail et veulent aller vers l’action. Ces deux points de vue sont antinomiques. Il faut chercher à interpréter sans biaiser la donnée. Tout le problème aujourd’hui réside donc dans cette question : « comment donner un cap, un axe de lecture sans biaiser la donnée ? »
Articles liés


