Méthodes et outils d'analyse statistiques de la Business Intelligence. Analyse de données et analyse multidimensionnelle OLAP langage R. Un point sur l'analyse prédictive à l'aide des réseaux de neurones et du machine learning pour mieux anticiper les souhaits des clients et les tendances du marché.
Les statistiques, c'est comme un bikini. Ce qu'elles révèlent est suggestif, ce qu'elles cachent est essentiel. Aaron Levenstein, Mathématicien
Les statistiques sont encore un outil d'analyse à privilégier
Analyse de données
L'analyse de données est au coeur même du système de Business Intelligence, si ce n'est au coeur des préoccupations de l'entreprise. Il s'agit en effet de décoder l'environnement toujours plus riche en signaux faibles afin d'assurer une prise de décision aux risques mesurés.
Mieux comprendre les attentes des clients, identifier les tendances pour rester sur la vague, évaluer les stratégies pour mieux anticiper l'évolution sont autant de voies incontournables pour assurer une rentabilité durable.
Analyse statistiques
Les outils de statistique descriptive, toujours plus performants, notamment dans les restitutions des résultats, graphiques et cartographies, Datavisualisation, ne sont pas d'un usage aisé pour les managers non expérimentés. Il est ainsi préférable de profiter de l'assistance d'un statisticien professionnel afin d'éviter les maniements incertains et les interprétations hasardeuses.
Les études de corrélations par exemple, même lorsque la dispersion est bien évaluée, délivrent parfois des résultats suffisamment surprenants pour satisfaire l'intellect du découvreur en herbe. Elles sont un véritable piège pour l'utilisateur inexpérimenté.
Analyse OLAP, tableaux dynamiques et langage R
Pour réaliser les analyses multidimentionnelles et les questionnements de type what if ?. Le thème est développé ici : Qu'est-ce que Olap ?. Voir aussi les tableaux dynamiques Excel :
vidéo formation : Les tableaux dynamiques ou tables pivots
Langage R
Le langage R est en fait un environnement de travail spécifiquement dédié aux analyses statistiques et aux représentations graphiques associées.
Sur le plan des fonctions statistiques disponibles, le langage R est assez complet. Il présente l'avantage de faciliter le passage aux représentations graphiques, indispensables pour rendre compréhensible le sens porté par les données étudiées.
le langage R est évolutif et peut être enrichi. A noter le langage R est un projet GNU, Open Source, il est donc indépendant des éditeurs propriétaires. C'est un projet à suivre de près.
L'Analyse Prédictive pour mieux anticiper les tendances du marché
L'analyse prédictive permet de mieux identifier les caractéristiques fondamentales des clients afin de les modéliser et d'anticiper au mieux les comportements.
L'analyse prédictive n'est pas un outil en soi, c'est plutôt une pratique qui s'appuie sur les outils statistiques bien sûr, mais aussi sur le data mining et la recherche de corrélation et la théorie des jeux. Le thème du machine learning et de la modélisation propre au Big Data ne vise d'autres ambitions, en tout cas dans le monde de l'entreprise commerciale. À noter, l'anticipation des fraudes et l'identification des comportements malhonnêtes sont aussi une piste de recherche.
L'analyse prédictive est utilisée pour les applications de CRM comme nous l'avons introduit ici, mais aussi par les compagnies d'assurance et le secteur de la banque pour bâtir les scoring crédits, affiner la mesure de risques et la prévention des fraudes.
Réseaux de neurones et machine learning au service de la connaissance client
Les Réseaux de neurones et le machine learning sont aussi utilisés dans les sciences statistiques aux fins d'analyse prédictive.
Modélisation, apprentissage, multiples données d'entrées sont les principales caractéristiques des réseaux de neurones. (Cognos 4Thought était un outil de modélisation prédictive et d'analyse de type "what if" utilisant les réseaux de neurones. Le produit n'est plus référencé tel quel au catalogue IBM.)
Les moteurs d'analyse à base de réseaux de neurones sont maintenant intégrés au sein d'outils plus complets comme SAS ® Enterprise Miner TM Neural Networks.
Voir aussi la régression linéaire et la régression logistique, variante de la première.
Analyse prédictives et le e-commerce
Transformer la Business Intelligence en Madame Soleil, ce n'est pas pour demain. Ce n'est pas le but non plus, ne nous méprenons pas sur le terme de prédictif. Lorsque l'on traite de très grandes quantité de données, il devient possible d'établir des corrélations suffisamment fines pour définir des profils, des modèles de comportement.
Á titre d'exemple trivial, lorsqu'un visiteur explore méticuleusement votre boutique en ligne sans rien acheter, il y a de grandes chances pour que ce soit en concurrent. Évident, n'est-ce pas ? Mais, c'est un exemple. Avec des outils un peu plus fins, on peut construire des profils types permettant non pas d'anticiper à coup sûr mais bien d'envisager des comportements possibles.
Ce thème, limité pour cet exemple au cas de à la boutique en ligne, s'applique à de multiples domaines dès que l'on peut disposer de grandes quantités de données suffisamment complètes pour éviter les contresens. On rejoint là l'importance de disposer aisément de méga volumes de données, voir ci-dessus.
Analyse prédictive et sagesse des foules
Dans un ouvrage qui fit pas mal de bruit, l'économiste James Surowiecki montrait, dans son livre La sagesse des foules, la supériorité de la multitude sur un expert unique en terme de pertinence. "Because the many are smarter than the few", tel est le slogan développé par cette approche révolutionnaire de l'analyse décisionnelle et de la prédiction profitant pleinement des avantages du net.
Il existe d'ailleurs de nombreuses expériences en ligne de prévision des tendances boursières, et plus généralement des évolutions de cours des marché financiers, des résultats sportifs ou de scrutins électoraux.
L'Intelligence collective en pratique Que ferait-on aujourd'hui sans experts, prévisionnistes et autres spécialistes de la prospective ? En temps d'incertitude, le recours-réflexe à l'expert semble une évidence pour le décideur dans l'expectative. Mais qu'en est-il de l'intelligence collective ? N'est-elle pas plus efficace qu'un expert ? .
Alain Fernandez est un spécialiste de la mesure de la performance et de l’aide à la décision. Au fil de ces vingt dernières années, il a accompagné nombre d'entreprise en France et à l'International. Il est l'auteur de plusieurs livres publiés aux Éditions Eyrolles consacrés à ce thème et connexes, vendus à plusieurs dizaines de milliers d'exemplaires et régulièrement réédités.
Qu'est-ce que le Text Mining ? Définition et outils de Text Mining. Un premier exemple historique pour bien comprendre l'importance d'extraire le sens de documents non structurés, suivi d'un second exemple bien plus récent où cette idée d'extraire des résumés synthétiques...
Data Mining, explorer les données du Data Warehouse Il ne suffit pas de stocker une multitude de données au sein d'une base spécialisée, Data Warehouse ou Big Data, encore faut-il les exploiter. C'est là le rôle du Data Mining qui, bien utilisé, saura tirer les enseignements contenus dans cette masse de données...
Qualité des données décisionnelles L'importance de la qualité des données collectées n'est plus à démontrer. Avec la croissance exponentielle du nombre de données générées, collectées, stockées, analysées et échangées, cette question est toujours plus sensible...
Lecture recommandée
L'ouvrage de référence auprès des managers, consultants, chefs de projets décisionnels, formateurs et enseignants...
De l'importance de réformer les principes archaïques de contrôle de la mesure de la performance pour enfin dynamiser la prise de décision en équipe, incontournable clé de l'entreprise innovante. La méthode SOCRIDE centrée sur les questions de Confiance et de Reconnaissance est ici expliquée, illustrée et détaillée :