Les Big Data ou mégadonnées désignent l'ensemble des données numériques produites par l'utilisation des nouvelles technologies à des fins personnelles ou professionnelles.
OBJECTIFS PEDAGOGIQUES
- Comprendre les concepts et les enjeux du Big Data
- Identifier les technologies et solutions pour réaliser un projet Big Data
- Apprendre à gérer des flux de données complexes, non structurés et massifs
- Implémenter des modèles d'analyses statistiques pour répondre aux besoins métiers
- Appréhender un outil de data visualisation pour restituer des analyses dynamiques
PROGRAMME
LES CONCEPTS ET ENJEUX DU BIG DATA
- Origines et présentation du Big Data
- Tour d'horizon des chiffres clés du marché dans le monde et en France
- Les enjeux du Big Data : ROI, organisation, confidentialité des données
- Présentation d'un cas pratique d'une architecture Big Data
LES TECHNOLOGIES DU BIG DATA
- L'écosystème de la plateforme Hadoop et son origine
- Les modes de stockage (NoSQL, HDFS) / principes de fonctionnement de MapReduce
- Présentation des distributions principales du marché et des outils complémentaires
- Installer une plateforme Hadoop
- Présentation des technologies spécifiques pour le Big Data
GESTION DES DONNÉES STRUCTURÉES ET NON STRUCTURÉES
- Gestion des données structurées et non structurées
- Les fonctionnalités de Hadoop Distributed File System (HDFS)
- Réalisation de requêtes SQL avec HIVE et utilisation de PIG pour traiter la donnée
- Utilisation d'un ETL pour industrialiser la création de flux de données massives
- Démonstration de Talend For Big Data
LES MÉTHODES DE DATAMINING DU BIG DATA
- Les méthodes d'exploration et de description
- Les méthodes de classification
- Les méthodes d’estimation et de prévision
- La méthode de régression linéaire
- L'implémentation des modèles
DATA VISUALISATION ET CAS D'USAGE CONCRETS
- Les outils de restitution du marché
- Méthodologie de mise en forme des rapports
- Apport du Big Data pour le "Social Business"
- Mesurer l'e-réputation et la notoriété d'une marque
- Mesurer l'expérience et la satisfaction clients, optimiser le parcours client
PUBLIC
Développeurs, chefs de projet, Data Miners, chargés d'études statistiques, consultants en informatique décisionnellePRÉREQUIS
INFORMATIONS PRATIQUES
HORAIRES DE LA FORMATION
de 9 h 00 à 12 h 30 et de 13 h 30 à 17 h 00
MÉTHODOLOGIE PÉDAGOGIQUE
Théorie | Cas pratiques | Synthèse
MODALITÉS D'ÉVALUATION
Évaluation qualitative des acquis tout au long de la formation et appréciation des résultats