M-Files est un GED ( un logiciel de gestion électronique des documents) qui présente des fonctionnalités de classement , de filtrage , et de recherche de différents documents comme les mails, les métadonnées, les images ou fichiers pdf avec la possibilité de se connecter à des bases de données ou de consulter ces informations avec une API REST.
Catégorie : Big Data
Tableau de bord avec QLik et Tibco Spotfire
QLik et Tibco Spotfire sont deux outils distincts pour réaliser des tableaux de bord.Je m’intéresse ici à l’intégration du Web Map Service ou WMS qui est un protocole de communication standard qui permet d’obtenir des cartes de données géoréférencées à partir de différents serveurs de données.
Construire un projet Big Data
A travers l’étude du diabète de patients recensés dans 130 hôpitaux des USA de 1999 à 2008, je vous présente ma vision pour mener à terme un projet Big Data.
Ce projet est en construction et je débute la construction du Backend avec Jhipster qui utilise les outils Spring Boot et Angularjs.
La démonstration du Back Office est disponible ici.
Et celle du Front Office programmé avec Angularjs est disponible ici
Utilisateur : user
Mot de passe : user
Les données proviennent du site archive.ics.uci.edu
Classification et régression linéaire avec Radiant
Je peaufine mon apprentissage de Radiant avec deux cas pratiques dont :
- L’un traite de la régression linéaire
- L’autre de la classification par l’interprétation d’un arbre.
Liens utiles:
SAS , Le SQL tentaculaire
Le langage de commande de SAS, pour Statistical Analysis System, est un langage propriétaire de programmation de quatrième génération (L4G) conçu par SAS Institute depuis 1976.J’ai testé les requêtes les plus courantes et quelques difficiles qu’un programmeur se doit de maîtriser grâce à la version gratuite SAS University Edition.
Liens utiles:
Tableaux de bord avec Superset
Superset est une application web qui permet de réaliser des tableaux de bord sophistiqués.
Liens utiles:
Gestion des Kafkas avec Landoop Lenses
Apache Kafka est un outil qui vise à fournir un système unifié, temps réel à latence faible pour la manipulation de flux de données. Sa conception est fortement influencée par les transactions de logs.
Landoop Lenses permet de faciliter le développement d’applications pour les réseaux Kafka.
Lien utiles:
SQL universel avec Dremio
Dremio rend vos données faciles, accessibles et interactives, quel que soit le nombre de téraoctets, peu importe où ils sont stockés. Dremio optimise vos données pour que vous n’ayez pas à le faire.
Quelques liens utiles:
- Working-with-your-first-dataset
- Visualizing-your-first-dataset-with-tableau-and-dremio
- Convert MS Access Northwind database to Oracle
Dans cette démo vidéo , je me connecte à une base de données Elasticsearch , puis une base de donnée Oracle XE à partir de Dremio.
Tableau de bord avec Kibana
Kibana est un outil de visualisation de données pour Elasticsearch publié sous la licence libre Apache version 2.
Il fournit des fonctions de visualisation sur du contenu indexé dans une grappe Elasticsearch.
Les utilisateurs peuvent créer des diagrammes en barre, en ligne, des nuages de points, des camemberts et des cartes de grands volumes de données.
Liens utiles:
JHIPSTER ET ELASTICSEARCH: Apogée du BIG DATA
JHipster fournit des outils pour générer un projet avec côté serveur, une pile Java (à l’aide de Spring Boot) et côté client un frontal Web adaptatif (avec Angular et Bootstrap).Ainsi , dans ce projet je synchronise les données enregistrées dans la base de données MySQL avec celle d’une instance Elasticsearch virtualisée avec Docker.
Quelques liens utiles: