Modele urne pour anniversaire

L`évaluation numérique montre, assez étonnamment, que pour n = 23 la probabilité qu`au moins deux personnes ont le même anniversaire est d`environ 0,5 (la moitié du temps). Pour n = 42, la probabilité est d`environ 0,9 (90 pour cent du temps). Il est clair que nous devons avoir (U + V = m ) donc une fois que nous avons la distribution de probabilité et les moments d`une variable, nous pouvons facilement les trouver pour l`autre variable. Cependant, nous allons d`abord résoudre la version la plus simple du problème d`anniversaire. Le cas où il y a au moins une duplication lorsqu`un échantillon de taille (n ) est choisi à partir d`une population de taille (m ) est [b_ {m, n} = {V lt n } = {U gt m-n } ] le problème d`anniversaire (simple) est de calculer la probabilité de cet Par exemple, supposons que nous choisissiez (n ) personnes au hasard et noter leurs anniversaires. Si nous ignorons les années bissextiles et supposons que les anniversaires sont répartis uniformément tout au long de l`année, notre modèle d`échantillonnage s`applique à (m = 365 ). Dans ce paramètre, le problème d`anniversaire est de calculer la probabilité qu`au moins deux personnes ont le même anniversaire (ce cas particulier est l`origine du nom). Cet exemple montre que les applications de la théorie des probabilités au monde physique sont facilitées par des hypothèses qui ne sont pas strictement vraies, bien qu`elles soient approximativement vraies. Ainsi, les hypothèses selon lesquelles une année a 365 jours et que tous les jours sont également susceptibles d`être l`anniversaire d`un individu aléatoire sont fausses, parce qu`un an sur quatre a 366 jours et parce que les dates de naissance ne sont pas distribuées uniformément tout au long de l`année.

En outre, si l`on tente d`appliquer ce résultat à un groupe réel de personnes, il est nécessaire de demander ce que cela signifie pour que ceux-ci soient «choisis au hasard». Il serait naturellement déraisonnable de l`appliquer à un groupe connu pour contenir des jumeaux. En dépit de l`échec évident des hypothèses à être littéralement vrai, comme un exemple de classe, il dénomme rarement les instructeurs de classes ayant plus de 40 étudiants. Dans cette section, nous nous intéressons au nombre de valeurs de population manquantes dans l`échantillon et au nombre de valeurs de population (distinctes) dans l`échantillon. Le calcul des probabilités liées à ces variables aléatoires sont généralement appelés problèmes d`anniversaire. Souvent, nous interpréteront l`expérience d`échantillonnage comme une distribution de boules (n ) dans les cellules (m ); (X_i ) est le nombre de cellules de la balle (i ). Dans cette interprétation, notre intérêt est dans le nombre de cellules vides et le nombre de cellules occupées. En dépit de sa solution facile, le problème d`anniversaire est célèbre parce que, numériquement, les probabilités peuvent être un peu surprenant. Notez qu`avec un juste 60 personnes, l`événement est presque certain! Avec seulement 23 personnes, l`événement d`anniversaire est d`environ (frac{1}{2} ); spécifiquement (p (b_ {365, 23}) = 0,507 ). Mathématiquement, l`augmentation rapide de la probabilité d`anniversaire, comme (n ) augmente, est due au fait que (m ^ n ) pousse beaucoup plus vite que (m ^ {(n)} ).

Le fait que la probabilité est 1 pour (n gt m ) est parfois appelé le principe de casier: si plus de (m ) pigeons sont placés dans (m ) trous alors au moins un trou a 2 pigeons ou plus.