Aller au contenu principal

DU DATA ANALYST

PRESENTATION DU DATA ANALYST

OBJECTIFS DE LA FORMATION

  • Développer son esprit d’analyse
  • Disposer de bonnes qualités rédactionnelles
    Savoir communiquer
  • Programmer efficacement
  • Savoir manipuler une base de données
  • Maîtriser des outils de visualisation
  • Modéliser des problèmes orientés données
  • Apprendre à transformer les données brutes Trier les informations et
    les exploiter pour sortir des indicateurs concrets

OBJECTIFS PROFESSIONNELS

Devenir Analyste de données c’est :

  • Acquérir des compétences particulières en informatique et maîtriser des outils spécifiques au Big Data, aussi bien au niveau du stockage des données que de leur traitement (par exemple MapReduce, Hadoop ou encore Spark).
  • Apprendre à dégager des tendances pouvant aboutir à des recommandations sur les stratégies à adopter

CONTACT

Responsable de la formation :

Dominique Quadri– Professeure à l’université PARIS SACLAY

@ dominique.quadri@universite-paris-saclay.fr

PUBLICS CONCERNES

Cette formation s’adresse à des salariés ou à des adultes en reprise d’études. De niveau BAC +4 minimum dans un domaine scientifique, et justifiant d’une expérience professionnelle permettant de suivre cette formation.

 

PROGRAMME PEDAGOGIQUE

Algorithmique et langages dynamiques (25h)

Outils et techniques algorithmiques de pointe : algorithmique sur les graphes (tri topologique, etc.), les techniques de mémorisation, de programmation dynamique et de backtracking. Notion de flots et les algorithmes de calcul de flot maximal

Data mining / Data warehouse (25h)

Entrepôt de données (ou base de données décisionnelle, ou encore data warehouse) : désigne une base de données utilisée pour collecter, ordonner, journaliser et stocker des informations provenant de base de données opérationnelles et fournir ainsi un socle à l'aide à la décision en entreprise. Présentation des mécanismes de base de ces entrepôts de données et étude des différentes fonctionnalités

Ecosystème : Hadoop, MapReduce,  Spark (25h)

Présenter et manipuler des environnements de programmation distribuée tels que  Hadoop. Aborder le patron d’architecture MapReduce sur lequel repose Hadoop. Etudier Spark qui est un framework de calcul distribué qui lui travaille en mémoire vive et non sur MapReduce.

Maths / Statistiques / Probabilités (25h)

Espace de probabilité discret : notion de modèle d'une expérience aléatoire, construction d'un espace de probabilité, espace et probabilité produit, indépendance et probabilités conditionnelles. Variables aléatoires discrètes : espérance et variance, lois et représentations graphiques, lois et modèles classiques. Statistiques : Loi des grands nombres et problèmes d'estimation. Introduction aux tests d'hypothèses et intervalles de confiance

Machine Learning (25h)

Bases indispensables en apprentissage automatique ou "Machine Learning" : principales familles de modèles et algorithmes associés (inférence et apprentissage)

Modélisation (25h)

Espace de probabilité discret : notion de modèle d'une expérience aléatoire, construction d'un espace de probabilité, espace et probabilité produit, indépendance et probabilités conditionnelles. Variables aléatoires discrètes : espérance et variance, lois et représentations graphiques, lois et modèles classiques. Statistiques : Loi des grands nombres et problèmes d'estimation. Introduction aux tests d'hypothèses et intervalles de confiance.

Technologies mobiles (25h)

Nouvelles technologies mobiles, connaissances fondamentales et compréhension des avantages et inconvénients des différentes solutions existantes, en s'intéressant tout particulièrement au contexte IoT.

Visualisation des données (25h)

L’enjeu de la représentation des connaissances est de permettre d’expliciter des connaissances humaines de toutes sortes dans un formalisme interprétable par une machine, c'est-à-dire lui permettant de raisonner sur ces connaissances pour remplir des tâches variées (recherche d’information, surveillance et diagnostic de systèmes

complexes, …). Ce cours présentera différents formalismes de représentation de connaissances.

DATES DE LA FORMATION :             du 04 décembre 2023 au 16 février 2024

FORMAT PEDAGOGIQUE                  200 heures de formation

Rythme de la formation :                  Une semaine (25h en présentiel) sur deux,
                                                             durant huit semaines et demi.

Format des cours : présentiel

Seuil minimum d’ouverture pour une session de formation :  15 apprenants

Modalités de contrôle des connaissances                   Contrôle continu intégral

POUR CANDIDATER

Inscription sur dossier et sur entretien après l’avis favorable de la responsable de la formation

Date ou période d’inscription :  date butoir 15 octobre 2024

MODALITÉS DE CANDIDATURE

Examen du dossier de candidature et entretien de motivation

Pièces à joindre au dossier de candidature :

CV, lettre de motivation, résultats académiques antérieurs

Envoi du dossier avant  le 15 octobre à  @ dominique.quadri@universite-paris-saclay.fr

et en copie le Service de Formation Continue & VAE de la Faculté des Sciences d’Orsay de l’Université PARIS-SACLAY
@
fc.sciences@universite-paris-saclay.fr

FRAIS DE FORMATION :        4120 € à régler en supplément au Service de la Formation continue de la Faculté de Sciences d’Orsay- Université PARIS-SACLAY

FRAIS UNIVERSITAIRES :        380 € de Droits d’inscription, à régler en supplément au Service de la Scolarité de la Faculté de Sciences d’Orsay- Université PARIS-SACLAY

 

Plaquette du DU DATA ANALYST