Université Paris-Sud Devoir de statistique M2 SDS XXXXXXXXXX MODÉLISATION PAR LES MODÈLES MULTI-ÉTATS Une étude canadienne menée auprès de 125 enfants scolarisés en 6ème a porté sur leur...

The homework is in french but i cant translate it. I just want to know the price of 3 page of homework in statistics. Its about matrix and EML


Université Paris-Sud Devoir de statistique M2 SDS 2020-2021 MODÉLISATION PAR LES MODÈLES MULTI-ÉTATS Une étude canadienne menée auprès de 125 enfants scolarisés en 6ème a porté sur leur comportement tabagique : après leur rentrée scolaire (t0 = 0), ils ont été suivis aux moments suivants (en années) : t1 = 0.15, t2 = 0.75, t3 = 1.10 et t4 = 1.90 (voir [?]) 1. Trois ”états” tabagiques ont été considérés : — État 1 : l’enfant n’a jamais fumé — État 2 : l’enfant fume actuellement — État 3 : l’enfant a déjà fumé, mais ne fume plus actuellement À chaque visite, on a dénombré le nombre d’enfants qui sont dans chaque état en fonction de leur état à la visite précédente et on comptabilise ainsi les transitions (les nombres entre parenthèses sont des nombres attendus utiles par la suite) : État à t0 / État à t1 1 2 3 1 93 (96.0) 3 (1.7) 2 (0.3) 2 0 (0) 8 (12.9) 10 (5.1) 3 0 (0) 1 (0.5) 8 (8.5) Table 1. Transitions des états à la date t0 aux états à la date t1 État à t1 / État à t2 1 2 3 1 89 (85.7) 2 (4.2) 2 (3.1) 2 0 (0) 7 (4.0) 5 (8.0) 3 0 (0) 5 (2.8) 15 (17.2) Table 2. Transitions des états à la date t1 aux états à la date t2 État à t2 / État à t3 1 2 3 1 83 (84.9) 3 (2.9) 3 (1.2) 2 0 (0) 9 (6.8) 5 (7.2) 3 0 (0) 2 (2.3) 20(19.7) Table 3. Transitions des états à la date t2 aux états à la date t3 État à t3 / État à t4 1 2 3 1 76 (74.5) 3 (4.3) 4 (4.3) 2 0 (0) 6 (3.7) 8 (10.3) 3 0 (0) 0 (4.3) 28(23.7) Table 4. Transitions des états à la date t3 aux états à la date t4 On définit pour un individu donné l’état X(t) dans lequel il se trouve à la date t et les probabilités de transition pij = P ( X(t) = j|X(s) = i ) 1. L’analyse qui suit fait appel à une modélisation complexe comportant plusieurs paramètres d’intérêt. Le but est de pouvoir interpréter la démarche suivie par les auteurs. Il ne sera en particulier fait aucun calcul de variance asymptotique d’estimateurs qui aurait nécessité des calculs de covariances (au delà du cours). Néanmoins, ce type de modélisation communément appelée ”modèle multi-états”, se rencontre dans différentes pathologies : cancer [?], sida [?], complications ophtalmologique du diabète [?] et asthme [?]. 2 pour 0 ≤ s ≤ t et i = 1, 2, 3, j = 1, 2, 3. On propose une modélisation markovienne des données, où la distribution de probabilité de l’état futur X(t), connaissant l’état présent X(s) ne dépend pas du passé. On note ω`, ` = 1, 2, 3, 4 les temps écoulés ω` = t` − t`−1. A. On note P (`) la matrice des probabilités de transition pij(ω`) = pij ( t`−1, t` ) où ` = 1, 2, 3, 4. — Combien de paramètres inconnus contient en général et dans notre cas spécifique la matrice P (`) et combien y a-t-il de matrices P (`) 2 ? Cela fait combien de paramètres à estimer au total dans notre problème ? Dans la suite, on s’intéressera à la vraisemblance de ces paramètres. — On considère par exemple un enfant qui passe de l’état 1 en t0 à l’état 2 en t1 pour y rester ensuite. En utilisant la propriété marko- vienne de notre contexte, écrire la contribution à la vraisemblance de cet enfant conditionnellement à son état en t0. — Écrire la vraisemblance et la log-vraisemblance en fonction de ces paramètres et des comptages de transitions nij` observés (condi- tionnelles à la distribution des enfants dans les états en t0). — Écrire les dérivées partielles par rapport à chacun de ces paramètres (on trouvera une formule commune) : cela consiste à dériver par rapport à un paramètre en considérant les autres paramètres comme des constantes. On rappelle que la dérivée de la fonction ln(x) est 1 x . — On obtient le système des équations du maximum de vraisemblance en posant l’égalité à zéro de chacune de ces dérivées partielles. Résoudre ce système pour obtenir les estimateurs du maximum de vraisemblance des paramètres. — Quels sont les nombres attendus dans chaque cellule avec ces esti- mations ? B. On suppose de plus que notre modélisation est un processus de Markov homogène : les probabilités de transition ne dépendent que de l’inter- valle de temps écoulé, c’est-à-dire que pij ( s, s+u ) = pij(0, u) = pij(u) pour i, j, s et u. On définit les intensités (ou forces instantanées de passage) données par λij = lim ∆t→0 pij(∆t) ∆t pour i 6= j et λii = − ∑ i 6=j λij . La matrice des intensités considérée ici est Q =  −θ1 θ1 00 −θ2 θ2 0 θ3 −θ3  où θi > 0, i = 1, 2, 3. — Représenter les possibilités de passage entre les différents états avec un graphique où la présence d’une flèche entre un état et un autre, surmontée de la valeur de l’intensité, indique la possibilité de pas- sage instantané. — On admettra que les probabilités de transition peuvent s’écrire à partir des intensités, par exemple p11(ω) = e −θ1ω (les autres sont un peu plus complexes). On peut alors écrire la vraisemblance en fonc- tion de ces nouveaux paramètres et les estimer par maximisation 2. On oubliera pas qu’il s’agit de probabilités et on considèrera de plus, les transitions possibles et impossibles 3 de la vraisemblance. Les estimations obtenues sont (on admettra) : Q̂ =  −0.136 0.136 00 −2.28 2.28 0 0.47 −0.47  ce qui conduit à des estimations des nombres attendus eij` données entre parenthèses au début de l’énoncé. Exprimer les probabilités de transition estimées pij(ω`) en fonction de eij`. — Avec ces estimations et ce modèle, à combien peut-on prédire le nombre d’enfants qui n’ayant jamais fumé à l’entrée de l’étude ne fumeront pas trois ans plus tard ? — On souhaite tester la validité de cette modélisation markovienne (adéquation du modèle) et pour cela comparer la vraisemblance optimisée sans modèle (partie A.) avec la vraisemblance optimisée en modélisant les probabilités de transition à partir des intensités. Quelle est la statistique du rapport de vraisemblance ? Donner sa valeur numérique (pour une cellule où nij` = 0, compter ”zéro”). — Soient m0 le nombre de paramètres à estimer dans le modèle sous l’hypothèse nulle (adéquation du modèle) et m1 le nombre de pa- ramètres estimés sous l’hypothèse alternative, les deux hypothèses étant ”embôıtées”, c’est à dire que H0 peut être considérée comme un cas particulier de H1. Donner m0 et m1. La statistique du rap- port de vraisemblance est distribuée sous H0 suivant la loi du χ 2 dont le nombre de degrés de liberté est la différence m1 − m0. Conclure sur la validité du modèle. Commenter.
Jan 04, 2021
SOLUTION.PDF

Get Answer To This Question

Related Questions & Answers

More Questions »

Submit New Assignment

Copy and Paste Your Assignment Here