Les Big Data ou mégadonnées désignent l'ensemble des données numériques produites par l'utilisation des nouvelles technologies à des fins personnelles ou professionnelles.

 

OBJECTIFS PEDAGOGIQUES

  • Comprendre les concepts et les enjeux du Big Data
  • Identifier les technologies et solutions pour réaliser un projet Big Data
  • Apprendre à gérer des flux de données complexes, non structurés et massifs
  • Implémenter des modèles d'analyses statistiques pour répondre aux besoins métiers
  • Appréhender un outil de data visualisation pour restituer des analyses dynamiques

PROGRAMME

LES CONCEPTS ET ENJEUX DU BIG DATA

  • Origines et présentation du Big Data
  • Tour d'horizon des chiffres clés du marché dans le monde et en France
  • Les enjeux du Big Data : ROI, organisation, confidentialité des données
  • Présentation d'un cas pratique d'une architecture Big Data

LES TECHNOLOGIES DU BIG DATA

  • L'écosystème de la plateforme Hadoop et son origine
  • Les modes de stockage (NoSQL, HDFS) / principes de fonctionnement de MapReduce
  • Présentation des distributions principales du marché et des outils complémentaires
  • Installer une plateforme Hadoop
  • Présentation des technologies spécifiques pour le Big Data

GESTION DES DONNÉES STRUCTURÉES ET NON STRUCTURÉES

  • Gestion des données structurées et non structurées
  • Les fonctionnalités de Hadoop Distributed File System (HDFS)
  • Réalisation de requêtes SQL avec HIVE et utilisation de PIG pour traiter la donnée
  • Utilisation d'un ETL pour industrialiser la création de flux de données massives
  • Démonstration de Talend For Big Data

LES MÉTHODES DE DATAMINING DU BIG DATA

  • Les méthodes d'exploration et de description
  • Les méthodes de classification
  • Les méthodes d’estimation et de prévision
  • La méthode de régression linéaire
  • L'implémentation des modèles

DATA VISUALISATION ET CAS D'USAGE CONCRETS

  • Les outils de restitution du marché
  • Méthodologie de mise en forme des rapports
  • Apport du Big Data pour le "Social Business"
  • Mesurer l'e-réputation et la notoriété d'une marque
  • Mesurer l'expérience et la satisfaction clients, optimiser le parcours client

PUBLIC

Développeurs, chefs de projet, Data Miners, chargés d'études statistiques, consultants en informatique décisionnelle

PRÉREQUIS

  • Connaissances de base des modèles relationnels, des statistiques et des langages de programmation Connaissances de base des concepts de la Business Intelligence
  • INFORMATIONS PRATIQUES

    HORAIRES DE LA FORMATION
    de 9 h 00 à 12 h 30 et de 13 h 30 à 17 h 00

    MÉTHODOLOGIE PÉDAGOGIQUE
    Théorie | Cas pratiques | Synthèse

    MODALITÉS D'ÉVALUATION
    Évaluation qualitative des acquis tout au long de la formation et appréciation des résultats