Analyse de données sur le diabète
24 Questions
0 Views

Choose a study mode

Play Quiz
Study Flashcards
Spaced Repetition
Chat to Lesson

Podcast

Play an AI-generated podcast conversation about this lesson

Questions and Answers

Comment appelle-t-on le jeu de donnes tudi dans ce cours ?

diabete

Quelle fonction permet de lire un fichier RDS?

readRDS

Quelle commande permet d'afficher les premires lignes d'un DataFrame?

head (diabete)

Quelle commande permet de visualiser la structure d'un DataFrame?

<p>str (diabete)</p> Signup and view all the answers

Qu'est-ce qu'un graphe de connaissances?

<p>Un outil permettant de visualiser les relations entre les variables d'un jeu de donnes. (A), Un graphe qui permet de mesurer l'association entre les variables. (B), Un graphe qui utilise des noeuds pour reprsenter les variables et des arcs pour reprsenter les relations entre les variables. (C), Un type de graphe qui permet de reprsenter des observations sous forme d'un rseau. (D)</p> Signup and view all the answers

Deux vnements sont indpendants si la probabilit de les observer conjointement est gale la somme des probabilits de les observer sparment.

<p>False (B)</p> Signup and view all the answers

La probabilit d'observer les vnements ______ et ______ conjointement est la meme que de les observer sparment.

<p>A, B</p> Signup and view all the answers

Dans l'exemple des ds, quelle est la probabilit d'observer simultanment les deux vnements A et B?

<p>$1/36$</p> Signup and view all the answers

Deux vnements sont dpendants si la probabilit de les observer conjointement est diffrente de la somme des probabilits de les observer sparment.

<p>False (B)</p> Signup and view all the answers

Que signifie le symbole $\perp!!!\perp$?

<p>indpendant</p> Signup and view all the answers

Que signifie le symbole $\not!\perp!!!\perp$ ?

<p>dpendant</p> Signup and view all the answers

Que signifie le symbole $\mid$?

<p>conditionnellement</p> Signup and view all the answers

Les variables Surpoids et Insuline sont dpendantes si l'on ignore la variable Diabte.

<p>True (A)</p> Signup and view all the answers

Les variables Surpoids et Insuline sont indpendantes si l'on sait que la personne est Diabte.

<p>True (A)</p> Signup and view all the answers

Qu'est-ce que l'indpendance conditionnelle?

<p>L'ide que deux variables peuvent tre dpendantes marginalement, mais indpendantes lorsqu'on tient compte d'une troisime variable.</p> Signup and view all the answers

En quoi consiste l'ensemble de sparation?

<p>L'ensemble de sparation est un ensemble de variables qui permet de rendre deux variables indpendantes conditionnellement.</p> Signup and view all the answers

Que signifie la notation d-sparation?

<p>C'est une rgle qui permet de dterminer si l'information peut circuler d'une variable une autre, en tenant compte de l'ensemble de sparation.</p> Signup and view all the answers

Donnez un exemple de d-sparation.

<p>Si l'ensemble de sparation C rend A indpendant de B, alors on dira que C d-spare A de B.</p> Signup and view all the answers

Comment est-il possible de dterminer si une arte est oriente ou non, dans le graphe de connaissances?

<p>En utilisant les fonctions 'isArc' et 'isEdge' , qui permettent de dterminer si l'arte est oriente ou non.</p> Signup and view all the answers

Quelle est la fonction qui permet de mettre jour les connexions dans le graphe de connaissances?

<p>UpdateAmat</p> Signup and view all the answers

La connexion convergente est l'une des trois connexions possibles dans le graphe de connaissances.

<p>True (A)</p> Signup and view all the answers

Pourquoi faut-il commencer par orienter les connexions convergentes dans le graphe de connaissances?

<p>Parce que la connexion convergente est un cas particulier important dans le graphe de connaissances.</p> Signup and view all the answers

Quelle fonction permet de dterminer si une connexion est une v-structure ou non?

<p>degree</p> Signup and view all the answers

La prsence de deux arcs orients vers un mme nud peut tre interprte comme un collider.

<p>True (A)</p> Signup and view all the answers

Flashcards

Le jeu de données diabete

Ce cours étudie le jeu de données "diabete".

Fichier .rds

Un fichier .rds est utilisé pour charger le jeu de données.

Charger le jeu de données diabete

Charger le jeu de données "diabete" depuis le fichier .rds.

Study Notes

Analyse des données "diabete"

  • Un jeu de données, appelé "diabete", est utilisé dans le cours.
  • Ce jeu de données est stocké dans le fichier './Diabete_dataset.rds'.
  • Le jeu de données contient 10000 observations et 6 variables.
  • L'une des variables, notée $C$, est un facteur à 2 niveaux ("OUI" et "NON").

Graphe de connaissances

  • Un graphe de connaissances sert à représenter visuellement les observations et leurs relations.
  • Chaque nœud représente une variable.
  • Chaque arc (flèche) représente une relation entre les variables correspondantes.
  • Les relations peuvent être des dépendances ou des indépendances probabilistes.

Définition (indépendance probabiliste)

  • Deux événements $A$ et $B$ sont indépendants si la probabilité d'observer $A$ et $B$ conjointement est égale au produit des probabilités d'observer $A$ et $B$ séparément.
  • Formellement, $\mathbb{P}(A \cap B) = \mathbb{P}(A) \times \mathbb{P}(B)$.

Exemple d'application

  • Deux dés équilibrés à 6 faces sont lancés simultanément.
  • Événement $A$ : "Faire un 6 avec le premier dé".
  • Événement $B$ : "Faire un 4 avec le deuxième dé".
  • La probabilité d'observer $A$ et $B$ simultanément est $\frac{1}{36}$.

Définition (dépendance probabiliste)

  • Deux événements sont dépendants si leur indépendance ne peut pas être déterminée par leur observation.

Initialisation du graphe de connaissances

  • Le graphe de connaissance est initialement créé comme un graphe complètement connecté. Cela suppose que toutes les variables sont liées entre elles.

Variables des données

  • Les variables du jeu de données "diabete" sont étudiées à l'aide d'un graphe de connaissances.
  • Le graphe montrera les relations de dépendance entre les variables.
  • Concrètement, le graphe identifie les variables qui influencent les autres dans le jeu de données.

Fonction UpdateAmat

  • Cette fonction permet de mettre à jour une matrice d'adjacence en ajoutant ou en supprimant des arcs (connexions) entre les nœuds (variables).

Calcul de l'ensemble de séparation

  • Un ensemble de séparation est un moyen de déterminer quels noeuds d'un graphe conditionnent un certain arc.
  • Pour calculer ce dernier, une fonction getNbr est utilisée et prend en entré des variables pour calculer un ensemble de séparation.

Création d'un graphe de connaissance orienté

  • Le graphe est mis à jour avec une orientation en utilisant le calcul de l'ensemble de séparation, ce qui permet de formaliser les relations de dépendance conditionnelle entre les variables.

Conclusions

  • Le graphe final montre les dépendances conditionnelles entre les variables.
  • Les variables $Surpoids$, $Diabète$ et $Insuline$ semblent être dépendantes.

Studying That Suits You

Use AI to generate personalized quizzes and flashcards to suit your learning preferences.

Quiz Team

Related Documents

Proba_photos_cours_chapt2-3 PDF

Description

Ce quiz porte sur l'analyse des données liées au diabète, utilisant un jeu de données avec 10 000 observations. Vous explorerez les relations entre les variables à travers un graphe de connaissances et comprendrez le concept d'indépendance probabiliste. Testez vos connaissances sur ces notions fondamentales en statistiques.

More Like This

Diabetes Overview and Types
72 questions
Diabetes Mellitus Overview and Symptoms
23 questions
Diabetes Overview and Treatments
43 questions
Diabetes Mellitus Management Flashcards
8 questions
Use Quizgecko on...
Browser
Browser