Modèles Multinomiaux Ordonnés

Choose a study mode

Play Quiz
Study Flashcards
Spaced Repetition
Chat to Lesson

Podcast

Play an AI-generated podcast conversation about this lesson
Download our mobile app to listen on the go
Get App

Questions and Answers

Qu'est-ce qu'un modle polytomique univari ordonn ?

C'est un modle o une variable dpendante a plusieurs modalits (catgories) qui possdent un ordre naturel. On suppose que ces modalits sont identiques pour tous les individus.

Comment la variable latente $y_i^*$ est-elle dfinie dans un modle polytomique ordonn ?

La variable latente $y_i^$ est dfinie par l'quation $y_i^ = x_i \beta + \epsilon_i$, o $x_i$ sont les variables explicatives, $\beta$ les coefficients et $\epsilon_i$ un terme d'erreur.

Comment la probabilit $p(y_i = 1)$ (correspondant la deuxime catgorie, souvent indexe comme 1 si la premire est 0) est-elle calcule en termes de la fonction de rpartition F dans un modle polytomique ordonn ?

$p(y_i = 1) = p(c_1 \leq y_i^* < c_2) = F(\frac{c_2 - x_i \beta}{\sigma}) - F(\frac{c_1 - x_i \beta}{\sigma})$

Comment la probabilit $p(y_i = m)$ (dernire catgorie) est-elle calcule en termes de la fonction de rpartition F dans un modle polytomique ordonn ?

<p>$p(y_i = m) = p(y_i^* \geq c_m) = 1 - F(\frac{c_m - x_i \beta}{\sigma})$ (Note : Le slide utilise $c_m$ comme seuil infrieur pour la catgorie $m$. La formulation peut varier, parfois $c_{m-1}$ est utilis). L'expression exacte du slide est $p(y_i=m) = p(y^* &gt; c_m) = 1 - F(\frac{c_m}{\sigma})$, ce qui suppose implicitement $x_i\beta$ absorb ou une normalisation diffrente. L'interprtation la plus courante est $1 - F(\frac{c_{m-1} - x_i \beta}{\sigma})$ si $m$ est la dernire catgorie et les seuils sont $c_1, ..., c_{m-1}$. Le slide a une formulation lgrement ambigu sur $c_m$ vs $c_{m-1}$. En suivant le slide: $1 - F(c_m/\sigma)$ en supposant implicitement $x_i\beta$ nul ou intgr dans la dfinition, ou $1 - F(\frac{c_{m-1} - x_i \beta}{\sigma})$ si $m$ est la dernire catgorie et il y a $m$ seuils nots $c_1,...c_m$. Cependant, la diapositive 3 note $p(y_i=m) = p(y^* &gt; c_m) = 1 - F(c_m / \sigma)$ mais c'est probablement une simplification ou une erreur, car $x_i\beta$ devrait apparatre. Le slide 4 utilise $c_j$ et $c_{j+1}$. Une interprtation cohrente avec le reste serait $p(y_i=m) = P(y_i^* \ge c_{m-1}) = 1 - F(\frac{c_{m-1} - x_i\beta}{\sigma})$</p> Signup and view all the answers

Crivez la formule gnrale de la log-vraisemblance $I(y, \beta, \vec{c})$ d'un modle polytomique ordonn, comme prsent dans la diapositive 3.

<p>$I(y, \beta, \vec{c}) = \sum_{i=1}^{N} \sum_{j=0}^{m} y_{ij} \log [F(\frac{c_{j+1} - x_i \beta}{\sigma}) - F(\frac{c_j - x_i \beta}{\sigma})]$ (en dfinissant $c_0 = -\infty$ et $c_{m+1} = +\infty$. La diapositive utilise $j=0$ pour la premire probabilit $p(y_i=0)=F((c_1-x_i\beta)/\sigma)$, ce qui implique $c_0=-\infty$. Elle utilise $p(y_i=m)=1-F((c_m - x_i\beta)/\sigma)$, ce qui implique $c_{m+1}=+\infty$. Notons $c_i$ dans la formule du slide comme les seuils, $ ilde{c_j} $ dans la formule suivante).</p> Signup and view all the answers

Quelle est la relation entre $\tilde{c}_j$ et $c_j$, et entre $\tilde{\beta}$ et $\beta$ dans la formule simplifie de la log-vraisemblance $LogL(y, \tilde{\beta}, \tilde{c}_1, ..., \tilde{c}_m)$ pour le modle polytomique ordonn ?

<p>$\tilde{c}<em>j = c_j / \sigma</em>\epsilon$ et $\tilde{\beta} = \beta / \sigma_\epsilon$.</p> Signup and view all the answers

Quelles sont les deux grandes classes de modles multinomiaux non ordonns bases sur l'hypothse IANP ?

<p>Il existe des modles qui satisfont l'hypothse IANP (Indpendance des Alternatives Non Pertinentes) et des modles qui ne la satisfont pas.</p> Signup and view all the answers

Que stipule l'hypothse IANP (Indpendance des Alternatives Non Pertinentes) ?

<p>Elle stipule que le rapport de deux probabilits de choix (associes deux alternatives spcifiques) est indpendant de l'existence ou des attributs des autres alternatives disponibles.</p> Signup and view all the answers

Quels sont les deux principaux types (varits) de modles multinomiaux non ordonns mentionns ?

<ol> <li>Les modles logit multinomiaux indpendants (ou simplement modles logit multinomiaux).</li> <li>Les modles logit multinomiaux conditionnels (ou modles logit conditionnels).</li> </ol> Signup and view all the answers

Dans le contexte des modles logit multinomiaux, comment la fonction d'utilit $U(w)$ est-elle dcrite pour un individu effectuant un choix rationnel entre $m+1$ modalits ?

<p>Elle reprsente le niveau de satisfaction procur par chaque modalit $w$. Le modle suppose que l'individu choisit la modalit qui maximise son utilit.</p> Signup and view all the answers

Pourquoi le niveau d'utilit peut-il tre considr comme stochastique dans ces modles ?

<p>Parce qu'il dpend d'un terme alatoire $\epsilon_j$. Cela peut reflter une mauvaise perception de la qualit par l'individu, une difficult valuer prcisment l'utilit, ou des facteurs non observs par le modlisateur.</p> Signup and view all the answers

Comment l'utilit $U(x_j, \epsilon_j)$ pour la modalit $j$ est-elle dfinie pour l'individu $i$ ?

<p>$U(x_j, \epsilon_j) = v(x_j) + \epsilon_j$, o $v(x_j)$ est la partie dterministe de l'utilit dpendant des caractristiques $x_j$, et $\epsilon_j$ est le terme alatoire (stochastique).</p> Signup and view all the answers

Dans la fonction d'utilit $U(x_j, \epsilon_j) = v(x_j) + \epsilon_j$, le terme $v(.)$ est stochastique.

<p>False (B)</p> Signup and view all the answers

Exprimez la probabilit $p(y=j)$ comme la condition que l'utilit du choix $j$ soit suprieure l'utilit de tous les autres choix $k \neq j$.

<p>$p(y=j) = P( U(x_j, \epsilon_j) &gt; U(x_k, \epsilon_k) \text{ pour tout } k \neq j )$</p> Signup and view all the answers

Crivez la forme intgrale gnrale pour la probabilit $p(y=j)$ impliquant les fonctions de densit $f(\epsilon_k)$, comme montr sur la diapositive 7.

<p>$p(y=j) = \int_{-\infty}^{+\infty} [ \int_{-\infty}^{v_j - v_0 + \epsilon_j} f(\epsilon_0) d\epsilon_0 \times \int_{-\infty}^{v_j - v_1 + \epsilon_j} f(\epsilon_1) d\epsilon_1 \times \dots \times \int_{-\infty}^{v_j - v_m + \epsilon_j} f(\epsilon_m) d\epsilon_m ]<em>{k \neq j} f(\epsilon_j) d\epsilon_j$ (Note: La diapositive dcompose l'intgrale multiple d'une manire spcifique, intgrant sur $\epsilon_0, ..., \epsilon</em>{j-1}, \epsilon_{j+1}, ..., \epsilon_m$ puis sur $\epsilon_j$).</p> Signup and view all the answers

Si $F(.)$ est la fonction de rpartition associe la loi de $\epsilon$, crivez la forme intgrale pour $p(y=j)$ utilisant $F(.)$ comme prsente sur la diapositive 8.

<p>$p(y=j) = \int_{-\infty}^{+\infty} { \prod_{k=0, k \neq j}^{m} F[v(x_j) - v(x_k) + \epsilon_j] } f(\epsilon_j) d\epsilon_j$ (Note: La formule sur la diapositive 8 indexe le produit de k=1 m, ce qui suppose que l'alternative de base est 0 ou que la notation est lgrement diffrente. En gnral, le produit porte sur toutes les alternatives $k$ diffrentes de $j$.)</p> Signup and view all the answers

Quelle est la formule de la probabilit $p(y_i = j)$ dans un modle logit multinomial ?

<p>$p(y_i = j) = \frac{\exp[v(x_{ij})]}{\sum_{k=0}^{m} \exp[v(x_{ik})]}$</p> Signup and view all the answers

Que reprsente $x_{ij}$ dans le contexte des modles logit multinomiaux (tel qu'utilis sur la diapositive 9) ?

<p>$x_{ij}$ dsigne la valeur du vecteur comportant les variables exognes (caractristiques) pour l'individu $i$ associes au choix de la $j^{\text{me}}$ alternative.</p> Signup and view all the answers

Dans le modle Logit multinomial indpendant, comment $v(x_{ij})$ est-il typiquement spcifi ?

<p>$v(x_{ij}) = x_i \beta_j$. Les caractristiques $x_i$ sont celles de l'individu, et les coefficients $\beta_j$ sont spcifiques chaque alternative $j$.</p> Signup and view all the answers

Quelle est la formule du rapport des probabilits $p(y_i=j) / p(y_i=k)$ dans le modle logit multinomial indpendant ?

<p>$\frac{p(y_i=j)}{p(y_i=k)} = \frac{\exp(x_i \beta_j)}{\exp(x_i \beta_k)} = \exp(x_i (\beta_j - \beta_k))$</p> Signup and view all the answers

L'hypothse IANP (ou IIA - Independance of Irrelevant Alternative) est gnralement vrifie dans les applications relles des modles logit multinomial.

<p>False (B)</p> Signup and view all the answers

Dans le modle Logit multinomial conditionnel (McFadden, 1973), comment $v(x_{ij})$ est-il typiquement spcifi ?

<p>$v(x_{ij}) = x_{ij} \beta$. Les caractristiques $x_{ij}$ varient selon l'alternative $j$ (et potentiellement l'individu $i$), tandis que les coefficients $\beta$ sont les mmes pour toutes les alternatives.</p> Signup and view all the answers

Dans le modle logit conditionnel, les paramtres $\beta$ dpendent de la modalit (alternative) spcifique $j$.

<p>False (B)</p> Signup and view all the answers

Donnez la formule de la probabilit $p(y_i = j)$ dans un modle logit conditionnel.

<p>$p(y_i = j) = \frac{\exp(x_{ij} \beta)}{\sum_{k=0}^{m} \exp(x_{ik} \beta)}$</p> Signup and view all the answers

Crivez la formule de la log-vraisemblance $LogL(y, \beta)$ dans un modle logit conditionnel.

<p>$LogL(y, \beta) = \sum_{i=1}^{n} \sum_{j=0}^{m} y_{ij} \log [p(y_i = j)]$</p> Signup and view all the answers

Que reprsente $y_{ij}$ dans la formule de la log-vraisemblance pour le modle logit conditionnel ?

<p>$y_{ij}$ est une variable indicatrice qui vaut 1 si l'individu $i$ a choisi l'alternative $j$, et 0 sinon.</p> Signup and view all the answers

Crivez la formule dveloppe de la log-vraisemblance $LogL(y, \beta)$ en utilisant $y_{ij}$, comme donn sur la diapositive 13.

<p>$LogL(y, \beta) = \sum_{i=1}^{n} \sum_{j=0}^{m} y_{ij} x_{ij} \beta - \sum_{i=1}^{n} \log [\sum_{k=0}^{m} \exp(x_{ik} \beta)]$ (Note: La diapositive crit $k=0$ dans la seconde somme, mais elle l'crit $j=0$ par erreur. La somme interne doit porter sur l'indice des alternatives k, l'index $j$ est dj utilis pour la somme externe. La formule sur la diapositive est: $\sum_{i=1}^{n} \sum_{j=0}^{m} y_{ij}x_{ij}\beta - \sum_{i=1}^n \log[\sum_{j=0}^m \exp(x_{ij}\beta)]$. La notation est un peu incohrente entre les slides, $k$ est plus usuel pour l'index de la somme interne.)</p> Signup and view all the answers

Comment le rapport des probabilits $p_j / p_k$ (probabilit de choisir j sur probabilit de choisir k pour un individu i) est-il exprim dans le modle logit conditionnel, confirmant l'hypothse IANP ?

<p>$\frac{p_j}{p_k} = \frac{\exp(x_{ij} \beta)}{\exp(x_{ik} \beta)} = \exp((x_{ij} - x_{ik}) \beta)$</p> Signup and view all the answers

Le principal avantage du modle logit conditionnel rside dans sa validation de l'hypothse IANP.

<p>False (B)</p> Signup and view all the answers

Quel est un avantage cl du modle logit conditionnel en matire de prdiction ?

<p>Il permet de prdire la probabilit de choisir une nouvelle alternative (virtuelle ou non encore existante) en fonction de ses caractristiques (variables explicatives simules).</p> Signup and view all the answers

Quelle application du modle logit conditionnel est discute par Greene (1995) ?

<p>Le choix du mode de transport pour un voyage entre Sydney et Melbourne.</p> Signup and view all the answers

Quels sont les 4 modes de transport considrs dans l'tude de choix de voyage Sydney-Melbourne ?

<p>Avion, train, bus et voiture.</p> Signup and view all the answers

Listez quelques caractristiques (variables) considres dans l'tude de choix de mode de transport.

<p>Constante (spcifique l'alternative), cot gnralis du voyage (GC), mesure en terme de salaire du temps pass en voyage (INVC), date finale pour le choix entre l'avion et les autres modes (TTIME), revenu du mnage (HINC). Les rsultats montrent aussi DAIR, DTRAIN, DBUS (probablement des constantes spcifiques).</p> Signup and view all the answers

Flashcards

Modèle polytomique univarié ordonné

Un modèle où une variable a plusieurs modalités avec un ordre naturel, identique pour tous les individus.

Indépendance des Alternatives Non Pertinentes (IANP)

Elle stipule que le rapport de probabilité entre deux événements est indépendant des autres événements.

Logit multinomiaux

Modèles où l'utilité est stochastique, décrite par une fonction avec un terme aléatoire.

Xij

La valeur du vecteur comportant les variables exogènes pour un individu, connaissant le choix de la variable.

Signup and view all the flashcards

Modèle Logit multinomial indépendant

Un modèle logit où v(xij) = x¡βj.

Signup and view all the flashcards

Modèle Logit multinomial conditionnel

Un modèle logit où les paramètres β sont indépendants des modalités.

Signup and view all the flashcards

Utilité du modèle conditionnel

Mesure la probabilité d'une nouvelle modalité avec des variables explicatives simulées.

Signup and view all the flashcards

Caractéristiques du choix du mode de transport

Constante, Le coût généralisé du voyage (GC), une mesure en terme de salaire, du temps passé en voyage(INVC), la date finale pour le choix entre l'avion et les autres modes (TTIME) et le revenu des ménage (HINC)

Signup and view all the flashcards

Study Notes

Modèles Multinomiaux Ordonnés

  • Un modèle polytomique univarié ordonné utilise une variable avec plusieurs modalités ordonnées

  • Les modalités sont considérées identiques pour tous les individus

  • Un modèle polytomique univarié peut s'écrire sous la forme:

  • yi = 1 si yi < c1

  • yi = 2 si c1 ≤ yi < c2

  • ...*

  • yi = m si yi ≥ Cm

  • i = 1, ..., N*

  • ci < ci+1 et yi* est défini par:

  • yi = xiβ + i

  • i est iid(0, σ2) et suit une fonction de répartition F(.)

  • Afin de construire la vraisemblance, il faut déterminer les probabilités

  • p(yi = 0) = p(y*i < c1) = F((c1/σ) - (xiβ/σ))

  • p(yi = 1) = p(c1 < y*i < c2) = F((c2/σ) - (xiβ/σ)) - F((c1/σ) - (xiβ/σ))

  • p(yi = m) = p(y*i > cm) = 1 - F(cm/σ)

  • La log vraisemblance est donnée par la formule:

  • l(y, β, cei) = Σ(i=1 à N) Σ(j=0 à m) yij logF[(cej+1/σ) - (xiβ/σ)] - F[(cej/σ) - (xiβ/σ)]*

  • cej = cj/σε et βe = β/σε, et F(.) est une fonction de répartition donnée

  • Log vraisemblance:

  • LogL(y, β) = Σ(i=1 à n) Σ(j=0 à m) yij log [p(yi = j)]*

Modèles Multinomiaux Non Ordonnés

  • Il y a deux types de modèles multinomiaux non ordonnés, ceux qui satisfont l'hypothèse d'Indépendance des Alternatives Non Pertinentes (IANP ou IIA) et ceux qui ne la satisfont pas
  • L'hypothèse stipule que le rapport de deux probabilités associées à deux événements particuliers est indépendant des autres événements
  • Les modèles logit multinomiaux peuvent être indépendants ou conditionnels

Logit Multinomiaux

  • Un individu effectue un choix rationnel représenté par une fonction d'utilité U(w) entre m + 1 modalités, procurant autant de niveaux de satisfaction

  • Le niveau d'utilité est stochastique, décrit par une fonction U(.) avec un terme aléatoire

  • Le choix se justifie par une mauvaise perception de la qualité des modalités ou par difficulté à évaluer les niveaux d'utilité avec certitude

  • L'utilité de l'individu i pour chaque modalité j = 0, 1, .., m est donnée par:

  • U(xj, εj) = v(xj) + εj) ∀j = 0, 1... , N*

  • La fonction v(.) est déterministe et continue, et εj est une variable aléatoire iid dont la loi est décrite par la fonction de répartition F(.)

  • Formule pour p(y=j): voir notes. Long and unweildy!

  • On peut écrire, si F(.) est la fonction de répartition associée à la loi de ε:

  • p (y = j) = ∫(-∞ à +∞) {Π(k=1 à m) F [v (xj) − v (xk) + εj ] } f (εj) dεj*

  • Il est possible de montrer que :

  • p (yi = j) = exp [v (xij)] / Σ(k=0 à m) exp [v (xij)]*

  • xij est la valeur du vecteur contenant les variables exogènes pour l'individu i, connaissant le choix de la variable j

  • Le modèle Logit multinomial indépendant est représenté par v (xij ) = xi βj

  • Les probabilités associées à deux modalités j et k donnent:

  • exp(xiβj) / exp(xiβk)*

  • Ce rapport est indépendant des alternatives autres que j et k; c'est l'hypothèse d'Indépendance des Alternatives Non Pertinentes (IANP)

  • L'hypothèse est rarement vérifiée, ce qui remet en cause l'utilisation des modèles logit multinimial

Modèle Conditionnel

  • Le modèle Logit multinomial conditionnel (McFadden, 1973) s'exprime par: v (xij ) = xij βj

  • Les paramètres β sont indépendants des modalités, et les variables explicatives diffèrent selon les modalités et les individus

  • Dans ce modèle Logit conditionnel:

  • p(yi = j) = exp(xijβ) / Σ(i=0 à m) exp(xikβ)*

  • Avec yij = 1 si yi = j et 0 sinon

  • Log vraisemblance :

  • LogL(y, β) = Σ(i=1 à n) Σ(j=0 à m) yij xij β -Σ(i=1 à n) log [Σ(j=0 à m) exp (xij β)]*

  • Le rapport de deux probabilités associées aux modalités j et k est le suivant:

  • pi / pj = exp(xijβ) / exp(xikβ) = exp(xij - xikβ)*

  • L'hypothèse de IANP est validée, mais ce n'est pas un avantage majeur du modèle

  • Le modèle permet de prédire la probabilité d'une nouvelle modalité (virtuelle) avec des variables explicatives simulées

Application: Choix du Mode de Transport (Greene, 1995)

  • Analyse du choix du mode de transport pour un voyage entre Sydney et Melbourne
  • Quatre modes considérés : avion, train, bus et voiture
  • Les caractéristiques sont : constante, coût généralisé du voyage (GC), mesure en salaire, temps de voyage (INVC), date pour le choix avion/autres modes (TTIME), revenu du ménage (HINC)
  • Les données comprennent 210 observations, avec une population majoritairement composée de conducteurs

Studying That Suits You

Use AI to generate personalized quizzes and flashcards to suit your learning preferences.

Quiz Team

Related Documents

More Like This

Use Quizgecko on...
Browser
Browser