Business Intelligence Open Source, principe et produits
Depuis déjà quelques années, les solutions de Business Intelligence Open source sont étudiées selon les mêmes critères que les solutions propriétaires. Tout en sachant que l'open source signifie code ouvert, ils sont une sérieuse limite aux éventuelles "back door". Mais ce n'est pas l'unique avantage de ces solutions.
La BI à l'heure de l'Open Source (OSS)
Qu'est-ce que l'Open Source (OSS) ?
L'informatique décisionnelle ou Business Intelligence est un secteur des technologies de l'information pour l'entreprise toujours en essor. À juste titre.
Le contexte économique est complexe et l'information mérite d'être correctement collectée et traitée pour assure une prise de décision efficace.
L'offre de progiciels Business Intelligence Open Source disponibles est désormais à peu près en phase avec les exigences attendues pour une majorité d'applications d'entreprise.
Logiciels BI Open Source, le principe
Ces toutes dernières années, le monde de l'édition de progiciels d'entreprise Open Source, dont la BI fait partie, est entré dans une phase de restructuration de grande ampleur. Le secteur de la BI Open source est un secteur à suivre de très près.
Avant de poursuivre, simplement une petite remarque à propos de la définition d'Open Source. Un progiciel en Open Source n'est pas nécessairement gratuit. Les deux termes ne sont pas synonymes malgré une croyance encore tenace.
Pour mémoire
Un progiciel Open Source est un progiciel dont l'ensemble des programmes sources est publié en intégralité. Il peut être redistribué, ou modifié. Il n'est pas nécessairement gratuit.
Linux, Apache, MySQL, Mozilla FireFox pour ne citer que les plus connus sont des exemples de progiciel Open Source.
Depuis déjà quelques années, le marché des outils décisionnels open source est en pleine restructuration.
« Concentration » semble d'ailleurs être le mot clé pour décrire cette évolution...
Concentration signifie absorption
Les plus gros absorbent les plus petits. Seuls les éditeurs de solutions de grande envergure peuvent encore escompter faire leur trou sur ce marché en pleine croissance.
Pour résister face aux ténors de la profession et éviter d'être mangé, il faut grossir et manger à son tour les plus petits. Il ne s'agit pas seulement d'une mise en application des lois de la nature à l'économie.
La chaîne décisionnelle est en effet fort complexe. Pour asseoir sa pérennité, l'éditeur doit couvrir les trois étapes majeures du processus :
- Étape 1. Collecte et stockage des données
- Étape 2. Transformation des données en informations
- Étape 3. Présentation
Proposer la chaîne complète n'est pas à la portée de petits éditeurs.
Le client, le best of breed Vs solutions durables
De son côté, le client ne peut plus se contenter du « Best of breed », séduisante recette qui consiste à faire son marché et à sélectionner chez l'un ou l'autre le meilleur produit pour chacune des phases du processus.
Cette recette ne peut tenir la route bien longtemps par manque de standard et de réelle compatibilité entre les produits. La question de la cohérence de la chaîne dans le temps et les problèmes de maintenance à répétition viennent rapidement à bout des avantages initiaux.
Dans tous les cas, le marché n'a pas encore atteint son stade de maturité et il faut s'attendre à de nouvelles annonces de rachats et de rapprochements. Seul les éditeurs proposant la chaîne complète tiendront leurs promesses.
Panorama des suites décisionnelles Open Source
Projet BI Open Source
Le projet Business Intelligence est un projet complexe qui comporte au minimum les briques fonctionnelles suivantes :
1) Collecter
2) Stocker
3) Distribuer
4) Exploiter
Bâtir une suite logiciel implique donc de fournir un ensemble cohérent de progiciels intégrés au sein d'une logique unique couvrant totalement ou partiellement l'ensemble de ces fonctions. C'est non seulement la qualité des produits pris séparément mais aussi la cohérence de la chaîne globale qu'il s'agit de considérer. Le coût d'achat, soit-il modéré, est une préoccupation secondaire. De toutes façons, la principale qualité de l'Open Source réside dans son appellation même : les sources des programmes sont ouverts ce qui signifie : vérifiables et évolutives.
Intégration
Cet effort d'intégration n'est pas des moindres. Pour en apprécier l'ampleur, il suffit de suivre le parcours au forcing des géants de l'édition informatique d'entreprise pour absorber les acteurs de la Business Intelligence, achetés et rachetés les uns après les autres.
Le projet Pentaho
Pentaho est un projet global couvrant l'ensemble de la
chaîne décisionnelle.
Pentaho comporte les briques suivantes :
reporting,
analyse,
tableau de bord,
data mining et
workflow.
Le projet Pentaho a été initié par des vétérans du décisionnel, des ex de Business Objects, Cognos, Hyperion, IBM, Oracle, et SAS.
Ce projet est réellement ambitieux. Il est à suivre de près. Selon les propos des fondateurs, leur objectif n'est pas uniquement de proposer une alternative
Open Source, mais bien de dépasser en terme de fonctionnalités les offres du marché. Ils n'attendent pas que vous choisissiez cette solution parce qu'elle est Open Source, mais bien parce que c'est la meilleure.
Ambitieux, vous dites ? À suivre en tout cas.
Le projet Pentaho intègre les produits suivants :
- Mondrian - Open Source OLAP Server
- Pentaho Reporting Engine - Open Source Reporting
- Kettle - Open Source Data Integration (ETL)
- Pentaho - Comprehensive Open Source BI Suite
- Weka - Open Source Data Mining
En 2015, Pentaho a été racheté par Hitachi Data System, Depuis 2017 Pentaho est intégré au sein de Hitachi Ventara.
Voir le site web : www.hitachivantara.com.
À lire
Pentaho Solutions: Business Intelligence and Data Warehousing With Pentaho and Mysql
Pentaho Solutions
Roland Bouman, Jos Van Dongen
John Wiley & Sons
648 pages (anglais)
Dispo :
www.amazon.fr
Le projet Spago
Spago est un projet d'intégration de progiciels décisionnels Open Source. L'objectif étant de proposer un cadre (framework) global.
Le site :
www.knowage-suite.com .
Le projet Jaspersoft
Jaspersoft est un ensemble d'outils de reporting désormais présentés sous forme de suites. Jaspersoft se compose (actuellement) des produits suivants :
- JasperReports - Bibliothèque de rapports
- JasperStudio - Conception de rapports graphiques
- JasperServer - Serveur de rapports interactifs
- JasperAnalysis - Analyse interactive des données/OLAP
- JasperETL - Intégration des données
Le site (en français) :
www.jaspersoft.com
Les autres projets
Il existe d'autres projets d'intégration globale du système décisionnel, comme par exemple
MarvelIT. Cependant, ils ne sont pas tous aussi aboutis que Pentaho ou Spago pour ne citer que ceux-ci.
Les produits DataMining Open source
Le chapitre
Définition du Data Mining, intégré dans le dossier
analyse des données, précise le rôle du data mining, son utilisation et le déroulement du projet.
Weka
Waikato Environment for Knowledge Analysis
Collection d'outils de Data Mining et techniques connexes développées en Java par l'Université de Waikato, New Zeland (collaboration du CERN)
Weka se connecte aux bases SQL en utilisant le JDBC (Java Database Connectivity), développement Java oblige.
Le site :
www.cs.waikato.ac.nz/ml/weka/
Weka est désormais intégré dans la
Pentaho Open BI Suite.
Pour ceux qui souhaitent s'initier, rien de plus facile. Weka se télécharge depuis sourceforge.net, par exemple :
la version windows.
Rapid Miner
Rapid Miner, anciennement YALE (Yet Another Learning Environment), est un produit open source de data mining écrit en Java. C'est un outil assez complet et bien diffusé. Il intègre des fonctions d'ETL et sait exploiter les données de multiples sources (Microsoft Office, Sybase, Oracle, mySql...) de surcroît, il est assez ergonomique et intègre la bibliothèque d'apprentissage de Weka.
Voir aussi
À lire
Un ouvrage est associé au développement du projet de data mining libre Weka.
Facile d'accès, suffisamment documenté et explicite pour que le lecteur puisse se forger une solide connaissance de la question. Les exemples s'appuient sur le fameux outil gratuit de data mining open source Weka. (Ouvrage en anglais)
Data Mining
I.H. Witten, Eibe Frank
Morgan Kaufmann Publishers
4ème édition 2016
654 pages
Prix : 59 Euros
Dispo :
www.amazon.fr & Format Kindle
Pour la petite histoire, le Weka est un oiseau de la taille d'une petite poule, assez commun dans le bush en Nouvelle-Zélande, il ne vole pas et n'est pas vraiment farouche. En période de nidification, son cri assez curieux surprend les non-autochtones au détour d'un chemin de randonnée. C'est bien ce volatile qui orne le portail web de l'université Waikato.
Panorama des solutions Data Warehouse et OLAP Open source : la Business Intelligence et le progiciel libre...
Panorama Data Warehouse et OLAP Open Source
Data Warehouse
Le Data Warehouse est un système de base de données spécialisée dans le stockage des données utilisées à des fins décisionnelles.
Le Data Warehouse constitue le coeur du système décisionnel. Consultez le dossier
Data Warehousing et la
définition du Data Warehouse pour en savoir un peu plus.
Infobright
Infobright est le moteur Data Warehouse pour le serveur de bases de données MySQL. Infobright automatise la gestion du célèbre SGBD dans une logique d'entrepôt de données assurant une capacité de plusieurs téraoctets selon l'éditeur.
Il existe deux versions :
- la version en téléchargement libre, Community Edition (ICE)
- la version plus "pro", Infobright Enterprise Edition (IEE)
Le site de l'éditeur :
hwww.ignitetech.com/infobright-db/
OLAP
Les bases de type OLAP sont destinées à faciliter les interrogations à usage décisionnel en permettant les analyses multi dimensionnelles.
Voir à ce sujet le dossier
Qu'est-ce que OLAP ?
Palo Suite
Serveur Olap intégrant un outil d'ETL, accessible depuis le web et compatible Microsoft Excel
Le site de l'éditeur :
https://www.jedox.com/fr/
Jedox Palo OLAP Server
La suite Palo de Jedox intègre un moteur Olap : Palo OLAP Server.
Le site de l'éditeur :
www.jedox.fr
Mondrian Pentaho
Mondrian est un serveur Olap écrit en langage Java. Mondrian utilise le langage d'interrogation
MDX.
Mondrian, précurseur du décisionnel Open source, est désormais intégré au projet Pentaho.
Le site de l'éditeur
itachivantara.com/s/article/mondrian
Autres solutions OLAP open source
- On n'oubliera pas Jpivot, bibliothèque adossée à la base OLAP Mondrian
jpivot.sourceforge.net/
- On pourra aussi s'intéresser au projet Pocolap "The little OLAP Project".
Il se télécharge sur sourceforge.
Panorama des outils ETL en Open Source
La collecte des données
La collecte des données éparses dans l'entreprise est une fonction fondamentale du système décisionnel. Récupérer les données stockées dans les bases de production pour les utiliser à des fins décisionnels nécessite une série d'opérations particulièrement conséquentes.
La phase de collecte est non seulement la plus difficile mais c'est aussi la plus chronophage et la plus coûteuse, ceci entraînant cela.
Les outils ETL Open Source
La phase de collecte est non seulement la plus difficile mais c'est aussi la plus chronophage et la plus coûteuse, ceci entraînant cela.
Les outils d'ETL (Extract Transform Load) ont en charge cette délicate opération du système global décisionnel. Se référer au dossier Collecte des données ETL pour de plus amples informations sur ce sujet particulièrement délicat.
Talend Open Studio
Talend Open Studio est un produit d'ETL particulièrement complet. Un produit à suivre.
Talend Open Studio génère directement les tâches de transformation en Java ou en PERL et dispose de multiples connecteurs pour les principaux produits logiciels d'entreprises.
Le site de l'éditeur :
www.talend.com/
La dernière version est téléchargeable sur le site de l'éditeur.
Pentaho Data Integration (PDI)
Pentaho Data Integration (PDI) est en fait à la base la solution d'ETL Kettle intégrée au sein du projet Pentaho.
Le site de l'éditeur :
Pentaho Data Integration
À lire
Pentaho Kettle Solutions: Building Open Source ETL Solutions with Pentaho Data Integration
Pentaho Kettle Solutions
Matt Casters, Roland Bouman, Jos Van Dongen
John Wiley & Sons
720 pages
Prix : 45 Euros
Dispo chez :
www.amazon.fr & Format Kindle
Enhydra Octopus
Enhydra Octopus est un outil d'Extraction, Transformation, Loading. Il se connecte aux bases de données sous JDBC et s'appuie comme il se doit sur un
schéma XML.
Le site de l'éditeur :
opensource-it.com/
Clover ETL
Clover ETL est une solution d'intégration des données écrite en Java.
Le site de l'éditeur :
cloveretl.com
Ketl
Ketl est un produit d'ETL basé sur une architecture Java.
Le site de l'éditeur :
linuxlinks.com/ketl
Voir aussi GeoKettle site web https://www.spatialytics.org/projects/geokettle/ et sur sourceforge : https://sourceforge.net/projects/geokettle/?source=directory
Panorama des outils Reporting Open Source (OSS)
Définition Reporting Open Source
Les outils de reporting permettent de réaliser plus ou moins automatiquement des rapports d'activités. L'outil de reporting interroge les bases de données selon un schéma de requêtes SQL élaboré au préalable.
L'offre reporting Open source, désormais opérationnelle, est suffisamment aboutie pour entrer en compétition avec les produits d'éditeur et intéresser les prescripteurs des projets de Business Intelligence.
Reporting ad hoc
Remarque : les outils disposant d'un module d'interrogation "ad hoc" permettent de construire ses propres requêtes. Cette fonction qui n'est pas du reporting à proprement parlé n'est pas systématiquement intégrée. Pour en savoir plus, voir le dossier
Définition du reporting en ligne sur ce site.
Les outils de Reporting open Source
Jasper report
Jasper Report a été racheté par TIBCO, une société américaine d'intégration informatique. JasperReport est toujours aujourd'hui l'outil le plus utilisé par les entreprises friandes de solutions non-propriétaires. Jasper Report, développé en Java, s'exécute aussi bien sur plate-forme : Windows, Linux, ou Mac.
La solution de reporting se compose d'une collection de composants :
- JasperReport Library : une bibliothèque de classes Java et d'APIs
- iReport Report Designer,
- JasperReport Studio : deux outils de conception, le second plus récent est prévu pour remplacer le premier
- JasperReport Server.
Jasper Report est populaire, l'outil bénéficie donc d'un support conséquent que ce soit au niveau de la documentation disponible que des forums spécialisés.
Le site open source :
community.jaspersoft.com (anciennement sous Sourceforge)
Cette solution open source de reporting était déjà supportée par une société commerciale, TIBCO a conservé le site d'origine :
www.jaspersoft.com.
Eclipse Birt
La solution Birt intègre plusieurs composant : Report Designer, Runtime, chart Engine, chart Designer et le Viewer. Le Design Engine API vous permet d'intégrer la solution de reporting au sein de vos applications maison.
Birt est un produit de Eclipse. Eclipse est une communauté open source qui génère des rapports pour les applications web.
www.eclipse.org/birt/phoenix
Jfreereport
Jfreereport est une bibliothèque de fonctions reporting écrites en Java et désormais intégrée dans le
projet Pentaho.
Pentaho est une solution complète de Business Intelligence.La suite inclut aujourd'hui les principales briques d'un projet professionnel.
Quelques autres solutions dignes d'intérêt
Datavision
Datavision sur Sourceforge
datavision.sourceforge.net
Open Report
Open Report est un générateur de rapport dynamique directement au niveau du navigateur.
Le site de l'éditeur :
oreports.com
DynamicReports
DynamicReports utilise la solution JasperReports pour créer très rapidement des rapports opérationnels.
Le site de l'éditeur : DynamicReports
Voir aussi Jfreechart, www.jfree.org, une librairie graphique Java.
Présentation détaillée du livre "la transformation démocratique de l'entreprise"
L’auteur
Alain Fernandez est un spécialiste de la mesure de la performance et de l’aide à la décision. Au fil de ces vingt dernières années, il a conduit et accompagné de nombreux projets d'entreprise en France et à l'International. Il est l'auteur de plusieurs livres publiés aux Éditions Eyrolles consacrés à ce thème et connexes, vendus à plusieurs dizaines de milliers d'exemplaires et régulièrement réédités.
À ce sujet, voir aussi
- Comment choisir un progiciel open source d'entreprise ?
Quelques conseils et recommandations pour bien choisir sa solution Open Source pour le SI de l'entreprise ?...
- ERP Enterprise Resource Planning Progiciel de Gestion Intégrée
Centre fédérateur des informations d'entreprise et des processus métiers, les ERP réunissent les fonctions essentielles dites de gestion comme les RH, le commercial, la production, la finance, la comptabilité, les achats...
- CRM Customer Relationship Management
CRM désigne un ensemble de méthodes, de pratiques et d'outils technologiques assurant une gestion plus efficace dans la durée des relations avec les clients et les prospects. En français, on parle de Gestion de la Relation Client (GRC).
- Knowledge Management Open Source
Les des principaux produits logiciels de Knowledge Management publiés sous licence Open Source. La notion de gestion des connaissances englobe de nombreux domaines interconnectés. Nous nous intéresserons essentiellement à la thématique de la Gestion des Contenus (GDC) et au e-learning.
Ressources web
eBook gratuit
Méthode Gimsi
Pour concevoir et réaliser le projet BI en totalité
Alain Fernandez
38 pages
Téléchargement libre
À lire...
Les 10 étapes de la méthode Gimsi sont ici expliquées et illustrées. Best-seller, vendu à plus de 40 000 exemplaires...
Les nouveaux tableaux de bord des managers
Le projet Business Intelligence clés en main
Alain Fernandez
6ème édition Eyrolles
468 pages
☛ Voir la fiche du livre »»»
Pour acheter ce livre :
Format ebook : PDF ou ePub,
Kindle
Comprendre les enjeux de l'open source avec son principal supporter.
Depuis plus de 25 ans, Richard Stallman défend le logiciel libre. À l'origine de la démarche GNU et du copyleft, Richard Stallman milite activement et fermement contre les brevets logiciels...
Richard Stallman et la révolution des logiciels libres
Richard M. Stallman, Sam Williams, Christophe Masutti
Livio Éditions
340 pages
Dispo :
www.amazon.fr
Piloter l'Entreprise Innovante...
De l'importance de réformer les principes archaïques de contrôle de la mesure de la performance pour enfin dynamiser la prise de décision en équipe, incontournable clé de l'entreprise innovante. La méthode SOCRIDE centrée sur les questions de Confiance et de Reconnaissance est ici expliquée, illustrée et détaillée :
Les tableaux de bord du manager innovant
Une démarche en 7 étapes pour faciliter la prise de décision en équipe
Alain Fernandez
Éditeur : Eyrolles
Pages : 320 pages
Consultez la fiche technique »»»
Pour acheter ce livre :
Format ebook : PDF & ePub,
Format Kindle
Voir aussi...
Le mot du jour
QuestionnementThe important thing is not to stop questioning. Curiosity has its own reason for existing. Albert Einstein
Partagez cet article...
(total partages cumulés > 45)