CF210-exam

 0    67 fiszek    ilyasselhadi
drukuj graj sprawdź się
 
Pytanie Odpowiedź
Quelles sont les étapes de la gestion de données?
rozpocznij naukę
Collecter, Stocker, Distribuer, Exploiter
Qu'est-ce que la science des données?
rozpocznij naukę
Science multidisciplinaire visant l’extraction de connaissance à partir d’ensemble de données
Qu'est-ce que l'exploration des données?
rozpocznij naukę
Data mining -> découvrir et d’extraire un savoir ou uneconnaissance à partir de (grandes) quantités de données
Qu'est-ce que l'apprentissage automatique?
rozpocznij naukę
Champ d'étude de l’intelligence artificielle. Permet à une machine d’apprendre automatiquement à partir d’un ensemble de données et produire des actions par prédiction/déduction
Nommez trois approches de l'apprentissage automatique
rozpocznij naukę
Apprentissage supervisé. Apprentissage non-supervisé. Apprentissage par renforcement
Nommez-moi 3 freins à l'exploration des données
rozpocznij naukę
les données non structurées, une carence des outils de traitement des données, l’absence de mesure du ROI
Nommez deux familles de modélisation
rozpocznij naukę
Descriptive: trouver les patterns. Prédictive: inférence à partir des données actuelles pour prédire des évolutions
Nommez les méthodes descriptives.
rozpocznij naukę
Regroupement (clustering), Détection d'anomalies, Règles d'association
Nommez les méthodes prédictives.
rozpocznij naukę
Arbre de décision, régréssion linéaire
Nommez trois langages de programmation utilisés par les data scientists.
rozpocznij naukę
R, Python, SQL
Exemples de technologies NoSQL.
rozpocznij naukę
MongoDB, CouchDB
Qu'est-ce que le SGBDR?
rozpocznij naukę
Système de gestion de bases de données relationnelles
Exemples de BD relationnelles?
rozpocznij naukę
Oracle, MySQL, MSSQL
Qu'est-ce qu'une clé dans une BD?
rozpocznij naukę
Identifie un type d'entité ou un type d'association
Que permet une clé primaire?
rozpocznij naukę
Identifier de manière unique un enregistrement dans une table.
Que permet une clé étrangère?
rozpocznij naukę
Un ou ensemble d'attributs, qui est clé primaire dans une autre relation (ex.: numéro du client dans la table commande)
Où se trouve la clé primaire et étrangère dans ces deux relations: clients(codeClient, nomClient, addresseClient, ville, province, codePostal) ET commandes(codeClient, noCommande, etc...
rozpocznij naukę
codeClient dans clients() est une clé primaire, codeClient est la clé étrangère dans commandes()
Qu'est-ce qu'un entrepôt de données?
rozpocznij naukę
Mêmes données que dans les BDs, mais aggrégées, sommarisées, orientées métier pour faciliter l’analyse.
Qu'est-ce que le data lake?
rozpocznij naukę
Données brutes et volumineuses, non modélisées, non structurées, stockées pour un usage ultérieur. L'accès est complexe.Ex.: IdO, média sociaux, appareils mobiles
Qu'est-ce que la méthode CRISP?
rozpocznij naukę
Compréhension du problème, compréhension des données, Préparation des données, Modélisation, Évaluation, Déploiement
Nommez trois sources des données.
rozpocznij naukę
BD relationnelles, Entrepôt de données, Data Lake
Que permet la clause HAVING dans SQL?
rozpocznij naukę
Ajouter une condition à la requête.
Nommez le défaut de l'entrepôt des données.
rozpocznij naukę
Sources diverses, redondantes, manquantes, incohérentes
Qu'est-ce que le ETL dans l'entrepôt des données?
rozpocznij naukę
Extract Transform Load
Quels sont les types de tables dans l'entrepôt des données?
rozpocznij naukę
Table de faits, table de dimensions
Quels sont les trois V du big data?
rozpocznij naukę
Volume, Vitesse, Variété
Quelle est la méthode de stockage du big data?
rozpocznij naukę
Data lake
En quoi le data lake est différent du data warehouse?
rozpocznij naukę
Le data warehouse a une structure destructrice des détails et a des données qui satisfont un besoin identifié. Le lac de données absorbe un flux de données bruts + schema on read.
Qu'est-ce que l'apprentissage supervisé?
rozpocznij naukę
Infère un résulat à partir de données étiquettées (ex.: Arbre de décision)
Qu'est-ce que l'apprentissage non supervisé?
rozpocznij naukę
Essaie de trouver une structure à partir de données non étiquettées (ex.: Règle d’association)
Qu'est-ce que l'apprentissage par renforcement?
rozpocznij naukę
Effectue une action dans le but de maximiser une «récompense» (ex.: Chaîne de Markov)
Quelle est la première étape de la méthode MERISE?
rozpocznij naukę
Analyse des besoins
Quelle est la deuxième étape de la méthode MERISE?
rozpocznij naukę
Élaboration du modèle conceptuel de données (MCD)
Quelle est la troisième étape de la méthode MERISE?
rozpocznij naukę
Élaboration du modèle logique de données (MLD) et normalisation
Quelle est la quatrième étape de la méthode MERISE?
rozpocznij naukę
Élaboration du modèle physique de données (MPD) et Implémentation du MLD dans un SGBDR spécifique
Qu'est-ce que le MCD?
rozpocznij naukę
L'ensemble des informations à stocker
Nommez les bénéfices d'un entrepôt de données.
rozpocznij naukę
Mener des analyses poussées sur différents sujets d'affaires, vue consolidée des données de l'entreprise, simplifient l'accès de données
Donnez-moi 3 exemples de systèmes décisionnels.
rozpocznij naukę
ERP (enterprise resource planning) et CRM (customer relationshi management)
Qu'est-ce que le business intelligence (BI) ou intelligence d'affaires?
rozpocznij naukę
L’informatique décisionnelle est l'informatique à l'usage des décideurs et des dirigeants d'entreprises.
Qu'est-ce qu'un data warehouse ou un entrepôt de données?
rozpocznij naukę
Un Entrepôt de données est une base de données regroupant une partie ou l'ensemble des données fonctionnelles d'une entreprise. Il entre dans le cadre de l'informatique décisionnelle.
Nommez une problématique des BD en production
rozpocznij naukę
Sources de données hétérogènes, quantité d'information ne cesse d'augmenter
Pourquoi le modèle de BD relationnel normalisé ne convient pas pour le «reporting»?
rozpocznij naukę
La requête risque de ne pas être performante (jointures, beaucoup de données à lire). Ceci va ralentir le système transactionnel de l’entreprise. Les données peuvent être dans plusieurs BD.
Quel modèle de données est meilleur pour le reporting/BI?
rozpocznij naukę
Le data warehouse
Nommez 3 différences entre BD relationnelles et entrepôt de données.
rozpocznij naukę
Orientée sujet (organisées par client produit etc), intégrées (proviennent de plusieurs sources), non-volatiles (ne se modifient jamais et ne sont pas supprimées)
OLTP (Online Transaction Processing) fait partie de quel modèle de données?
rozpocznij naukę
SGBD
OLAP (Online Analytical Processing) fait partie de quel modèle de données?
rozpocznij naukę
Data warehouse
Nommez 2 bénéfices du data warehouse.
rozpocznij naukę
Simplifie l'accès aux données, permet des analyses plus poussées sur différents sujets d'affaires
Quelles sont les étapes d'un système décisionnel?
rozpocznij naukę
Collection –Intégration –Organisation –Restitution
Qu'est-ce qu'un data mart?
rozpocznij naukę
un sous-ensemble d’un data warehouse destiné à fournir des données aux utilisateurs, et souvent spécialisé vers un groupe ou un type d'affaire
Qu'est-ce que la modélisation dimensionnelle?
rozpocznij naukę
Technique de conception logique utilisée pour les entrepôts de données.
Nommez les 3 modèles de données? (schema)
rozpocznij naukę
Modèle en étoile, modèle en constellation de faits, modèle en flocon de neige
Quelles sont les 6 phases de la méthode CRISP-DM?
rozpocznij naukę
Compréhension du marché, compréhension des données, préparation des données, modélisation, évaluation, déploiement
Qu'est-ce que la statistique descriptive?
rozpocznij naukę
résumer et présenterles données observées afin d'en en prendre connaissance plusfacilement sous forme de tableaux, graphes, etc.
Qu'est-ce que la statistique inférentielle?
rozpocznij naukę
étendre et/ou généraliser les conclusions obtenues mais sous certaines conditions
Quelles sont les étapes de la visualisation des données?
rozpocznij naukę
Comprendre le contexte, choisir représentation visuelle, rafiner, interaction
Que permet de faire le clustering?
rozpocznij naukę
regrouper tout ce qui se ressemble, et éloigner tout ce qui est franchement différent.
Qu'est-ce que le PCA?
rozpocznij naukę
C’est un ensemble de techniques pour réduire la taille d’unjeu de données
Quel est le problème opérationnel du big data?
rozpocznij naukę
les capacités de stockage augmentent rapidement, mais la vitesse d’accès n’augmente pas au même rythme
Qu'est-ce que Apache Hadoop?
rozpocznij naukę
Hadoop est un framework open source. Le stockage et le traitement sont tous les deux parallélisés.
Qu'est-ce que Apache Spark?
rozpocznij naukę
Solution pour accélérer le traitement des systèmes Hadoop
Qu'est-ce que la propriété ACID?
rozpocznij naukę
Atomicité, Cohérence, Isolation, Durabilité
Nommez les 4 familles de BD NoSQL
rozpocznij naukę
clé/valeur (redis), orienté colonne (cassandra), orienté document (mongodb), orienté graphe (neo4j)
Nommez les 4 types d'attaquants
rozpocznij naukę
États-nation, cybercriminels, hacktivistes, script kiddies
Qu'est-ce que le business email compromise?
rozpocznij naukę
comme la fraude du président
Comment réduire la taille d'un dataset?
rozpocznij naukę
Réduction d'attributs, séléction d'attributs
Qu'est-ce que la gouvernance des données?
rozpocznij naukę
La gouvernance de données associe un ensemble de personnes, de processus et de technologiespour garantir la qualité et la valeur des informations d’une entreprise.
Nommez 2 objectifs de la gouvernance des données?
rozpocznij naukę
l’amélioration de la segmentation, l’amélioration de la confiance en le reporting

Musisz się zalogować, by móc napisać komentarz.