INTRODUCTION AU MONDE DU BIG DATA

Date

28/03/2019

}

Heure

19:15

lieu

Invivoo

Présentation

Plus d’une décennie après le lancement de Hadoop, le Big Data est désormais la pierre angulaire d’une nouvelle ère axée sur les données. Le Big Data est devenu le moteur qui alimente les systèmes des plus grandes entreprises du monde et les technologies de cet écosystème sont caractérisées par une amélioration constante.

Mais même si le Big Data influence notre vie quotidienne de plusieurs manières, les mécanismes de fonctionnement de ses différentes technologies représentent encore un mystère pour la plupart d’entre nous.

A travers cette formation, nous allons plonger profondément dans ce monde et nous allons exploiter les différents éléments de l’écosystème Big Data.

    Programme

    1- Big Data, pourquoi?
    • Les outils classiques de gestion de bases de données
    • Les problématiques rencontrées
    • La naissance de Hadoop
    2. Big Data : concepts de base
    • Les 5 V du Big Data
    • Traitement et stockage distribués
    • Batch vs. Streaming
    • Les architectures Big Data : Lambda / Kappa
    3. Big Data : les différentes technologies
    • Hadoop (Stockage distribué (HDFS), traitement distribué (MapReduce), gestion de ressources (Yarn))
    • Spark (notions de base, architecture, Les différentes APIs)
    • Hive (notions de base, HQL)
    • Kafka (notions de base, architecture)
    • Zeppelin (notions de base, les interpréteurs, les notes, Zeppelin 0.8)
    • Passage rapide sur d’autres technologies (Zookeeper, HBase, Pig, Impala, Kudu, Superset, Storm, Flume, Airflow)
    4. Big Data, Big Players
    • ING : Tout faire via Spark
    • Netflix : Le Big Data via les notebooks
    • Airbnb : Le stack Big Data complet

    Que vais-je apprendre ?

    • Comprendre les besoins derrière le Big Data
    • Comprendre les notions de base de l’écosystème Big Data (les 4 V)
    • Avoir une idée sur les différentes technologies de l’écosystème et leurs fonctionnalités (Hadoop, Spark, Kafka, Hive, Zeppelin)
    • Avoir une idée sur les architectures Big Data Lambda et Kappa et leurs spécificités
    • Etudier des cas d’utilisation réels (ING, Netflix, Airbnb)
    Mahdi Karabiben

    Mahdi Karabiben

    Consultant Big Data

    Ingénieur en génie logiciel diplômé de l’INSAT en 2018, Mahdi a commencé depuis sa première année d’études à explorer le monde du Big Data.

    En 2017, il a remporté le premier hackathon de Data Journalism en Tunisie grâce à sa visualisation « US Investment In Tunisia ». Ensuite il a été recruté par l’ONG DemocracyInternational au sein de laquelle il a développé la première plate-forme d’open-data en Tunisie, en utilisant des technologies comme D3.js et Tableau.
    En 2018, il a effectué son projet de fin d’études au sein de l’entreprise 1000mercis à Paris où il a conçu et mis en place un pipeline de données massives basé sur des technologies Big Data, notamment Apache Airflow, Spark, et Apache Zeppelin. Depuis novembre 2018, Mahdi est l’un des consultants Big Data d’INVIVOO où il participe à la mise en place des architectures Big Data conçues pour les acteurs financiers.

    inscription

    Workshop Intro Big Data

    informations pratiques

    }

    durée

    1x2h

    Niveau

    Initiation

    v

    Langue

    Français