EXERCICE - FORMULE BAYES / PROB CONDITIONNELLES/ PREVALENCE / COURBE ROC

Aide sur les questions de probabilités.
Shiro.A
Membre
Messages : 3
Inscription : 16 janvier 2019, 15:12

EXERCICE - FORMULE BAYES / PROB CONDITIONNELLES/ PREVALENCE / COURBE ROC

Message par Shiro.A » 16 janvier 2019, 15:26

Bonjour, j ai un exo que je n'arrive à faire. Je suis bloqué depuis maintes temps...
IMPOSSIBLE DE M EN SORTIR

Merci d avance JOOB !
Exercice 1 :

L’ADN est constitué par un enchaînement de bases choisies parmi 4 possibles (A, C, T, G). L’ADN
humain contient environ 3 milliards de bases. Dans cet exercice, on le supposera d’un seul morceau
(on ignorera le découpage en chromosomes). On supposera également que la séquence des bases est
constituée totalement aléatoirement.

1. On s’intéresse à des séquences de 3 bases, ou triplets. Pour simplifier, on considèrera que
l’ADN est la juxtaposition de triplets successifs, sans recouvrement : il y a donc 3 × 109 / 3 = 109 triplets.

A. Avec 4 bases (A, C, T, G), il est possible de former exactement 34 triplets différents.

B. La probabilité de trouver le triplet AAA au moins une fois dans l’ADN vaut

C. La probabilité de trouver au moins 2 fois le triplet AAA dans l’ADN vaut :
1 − (1 − 1⁄64)89:
− 10; × 1⁄64 × (1 − 1⁄64)89:%8
(Si besoin on admettra que cette probabilité vaut 1)

D. Le triplet ATG se trouve en moyenne 250000 fois dans tout l’ADN.

E. Le triplet GCA se trouve exactement une fois dans l’ADN.

2. On s’intéresse maintenant au cas général d’une séquence de f bases, ou f-uplet. On fera à
nouveau l’approximation que l’ADN est une juxtaposition de séquences de cette longueur, sans
chevauchement.
A. Avec 4 bases possibles, il est possible de former 4f f-uplets.
B. Dans l’ADN, il y a f-uplets.
C. Le nombre de copies d'un f-uplet dans l’ADN suit une loi binomiale.
D. La probabilité de ne pas trouver le f-uplet A, A, …, A (f fois) dans l’ADN vaut
E. La probabilité de trouver au moins une fois le f-uplet A, A, …, A (f fois) est
3. Pour faire une carte génétique, on souhaite déterminer à partir de quelle longueur f une
séquence donnée est « unique » dans tout l’ADN. À partir des calculs précédents, on a obtenu :

Longueur de séquence (f) I P(au moins 1 fois la séquence) I P(au moins 2 fois la séquence)
10 I 1 I 1
15 I 0,17 I 0,015
20 I 0,00014 I 9.10-9
30 I 7 10-11 I 8.10-21

{ TABLEAU MAL TRANSMIS JE PEUX L ENVOYER PAR MAIL SI BESOIN}

A. La probabilité de trouver au moins 2 fois la même séquence de longueur 10 lorsque celle-ci est
présente au moins 1 fois est une probabilité conditionnelle.

B. La probabilité de trouver au moins 2 fois la même séquence de longueur 10 lorsque celle-ci est
présente au moins 1 fois est supérieure à 99,99%.

C. La probabilité de trouver au moins 2 fois la même séquence de longueur 15 lorsque celle-ci est
présente au moins 1 fois vaut entre 8 et 10%.

D. La probabilité de trouver au moins 1 fois la même séquence de longueur 20 lorsque celle-ci est
présente au moins 2 fois vaut entre 6 × 10-5 et 7 × 10-5.
E. La probabilité qu’une séquence de 20 bases présente au moins une fois dans l’ADN soit unique
est supérieure à 99,99%.

Avatar de l’utilisateur
Job
Propriétaire du forum
Messages : 2584
Inscription : 28 juin 2013, 15:07
Contact :

Re: EXERCICE - FORMULE BAYES / PROB CONDITIONNELLES/ PREVALENCE / COURBE ROC

Message par Job » 16 janvier 2019, 17:54

Bonjour

1. Il y a $3\times 10^9$ bases. Le nombre de séquences de triplets de 3 bases est donc : $\frac{3\times 10^9}{3}=10^9$

A À la première place du triplet, il y a 4 choix possibles, de même pour la seconde et pour la troisième place donc on peut former : $4\times 4 \times 4 =4^3 =64$ triplets différents.

B La probabilité de trouver le triplet $(A,A,A)$ est donc égale à $\frac{1}{64}$

Soit la variable aléatoire $X$ égale au nombre de triplet $(A,A,A)$ dans l' ADN.
$X$ suit une loi binomiale de paramètres $n=10^9$ et $p=\frac{1}{64}$
La probabilité qu'il n'y ait aucun triplet $'A,A,A)$ est égale à :
$P(X=0)=(1-\frac{1}{64})^{10^9}$
Donc la probabilité qu'il y ait au moins un triplet $(A,A,A)$ est égale à : $1-(1-\frac{1}{64})^{10^9}$

C La probabilité qu'il y ait un seul triplet $(A,A,A)$ est égale à :
$P(X=1)=10^9 \times (\frac{1}{64}) \times (1-\frac{1}{64})^{10^9}$

La probabilité qu'il y ait au moins 2 fois le triplet $(A,A,A)$ est donc :
$1-(1-\frac{1}{64})^{10^9}-10^9 \times (\frac{1}{64}) \times (1-\frac{1}{64})^{10^9}$

Je n'ai pas très bien compris les réponses que vous avez indiquées.

Répondre