\documentclass[a4paper,11pt,dvips]{article} \usepackage[dvips,dvipsnames,usenames]{color} \usepackage[LGR,T1]{fontenc} \usepackage[latin1]{inputenc} \usepackage[greek,frenchb]{babel} \usepackage{marvosym} \usepackage{pifont} \usepackage{geometry} \usepackage{picins} \usepackage{fancyhdr} \usepackage{array} \usepackage{supertabular} \usepackage{fancybox} \usepackage{amsmath} \usepackage{multicol} \usepackage{multido} \usepackage{graphicx} \usepackage{pstcol} \usepackage{pstricks} \usepackage{pst-fill} \usepackage{pst-grad} \pagestyle{fancy} \setlength{\textwidth}{17cm} \setlength{\textheight}{25cm} \setlength{\oddsidemargin}{-5.5mm} \setlength{\evensidemargin}{0pt} \setlength{\marginparwidth}{1cm} \setlength{\headheight}{13pt} \setlength{\topmargin}{-30pt} \setlength{\footskip}{26pt} \setlength{\headsep}{13pt} \geometry{ hmargin=1.5cm, vmargin=1cm } \setlength{\arraycolsep}{0.6mm} \setlength{\jot}{0cm} \rfoot{\textit{\footnotesize{Cours statistiques\\ classe de 3\textsuperscript{ème} - année 2002-2003}}} \rhead{}\renewcommand{\headrulewidth}{0pt} \begin{document} \centerline{\shadowbox{\parbox{12 cm}{\centering\textsc{\large Statistiques}}}} \section*{Références au programme} \subsection*{Programme officiel} {\scriptsize {\begin{center}\begin{tabular}{|p{4cm}|p{6.5cm}|p{6.5cm}|} \hline \multicolumn{1}{|c|}{\textbf{Contenus}}&\multicolumn{1}{|c|}{\textbf{Compétences exigibles}}&\multicolumn{1}{|c|}{\textbf{Commentaires}}\\\hline {\textbf{Statistique}}&&Il s'agit essentiellement, d'une part de faire acquérir aux élèves les premiers outils de comparaison de séries statistiques, d'autre part de les habituer à avoir une attitude de lecteurs responsables face aux informations de nature statistique. \\ Caractéristiques de position d'une série statistique&Une série statistique étant donnée (sous forme de liste ou de tableau, ou par une représentation graphique), proposer une valeur médiane de cette série et en donner la signification.&On repère, en utilisant effectifs ou fréquences cumulées, à partir de quelle valeur du caractère on peut être assuré que la moitié de l'effectif est englobée. Les exemples ne devront soulever aucune difficulté au sujet de la détermination de la valeur de la médiane.\\ Approche de caractéristiques de dispersion d'une série statistique&Une série statistique étant donnée, déterminer son étendue ou celle d'une partie donnée de cette série. &L'étude de séries statistiques ayant même moyenne permettra l'approche de la notion de dispersion avant toute introduction d'indice de dispersion. On introduira l'étendue de la série ou de la partie de la partie de la série obtenue après élimination des valeurs extrêmes. On pourra ainsi aborder la comparaison de deux séries en calculant quelques caractéristiques de position et de dispersion, ou en interprétant des représentations graphiques données.\\ Initiation à l'utilisation de tableurs-grapheurs en statistique&&Les tableurs que l'on peut utiliser sur tous les types d'ordinateurs permettent, notamment en liaison avec l'enseignement de la technologie, d'appliquer de manière rapide à des données statistiques les traitements étudiés. \\ \hline \end{tabular}\end{center}}} \subsection*{Textes d'accompagnement} \begin{multicols}{2}\noindent{\scriptsize{La place des statistiques dans la vie courante et leur utilisation dans de nombreuses disciplines demandent que la formation du futur citoyen se poursuive en ce domaine : on le fait en abordant le problème de la comparaison de séries statistiques, avec une première approche de la notion de dispersion.\\Le contenu et les commentaires du programme concernant la statistique constituent un prolongement de ceux des classes antérieures, l'objectif de l'enseignement de statistique descriptive au collège étant indiqué dans le document d'accompagnement des programmes du cycle central.\\ En classe de 3\textsuperscript{ème}, il s'agit d'aider les élèves à franchir une nouvelle étape dans le développement de leur autonomie de jugement à propos d'informations qui peuvent être nombreuses. Dans le cas d'un regroupement en classes, les choix effectués peuvent avoir des effets sur les résultats numériques ou les représentations graphiques et leurs interprétations. En classe de 4\textsuperscript{ème}, on a pu observer que " la moyenne d'une population dont les éléments sont rangés par ordre croissant ne sépare pas ceux-ci, en général, en deux parties de même effectif ", ce qui justifie l'introduction de la médiane en classe de 3\textsuperscript{ème}. Les élèves disposent alors de deux indicateurs de la tendance centrale d'une population, leur position relative pouvant faire l'objet d'une interprétation dans des situations appropriées.\\ La nécessité de distinguer deux séries statistiques de même tendance centrale justifie l'intérêt de la notion de dispersion. Dans ce premier contact, le programme se limite à l'étendue d'une série statistique ou à l'étendue d'une partie donnée de celle-ci ; cela permet, sans difficulté technique, de familiariser les élèves avec une démarche habituelle en statistique : procéder à une synthèse de l'information sous la forme de nombres mesurant respectivement la position et la dispersion de la série étudiée.\\ Choix de la représentation d'une série statistique, interprétation des résultats obtenus et comparaison de deux séries statistiques peuvent être conduits, sans répétitions inutiles ni pertes de temps, en utilisant des tableurs-grapheurs ou en répartissant le travail au sein de la classe. De plus, outre son intérêt spécifique, l'enseignement des statistiques contribue au développement des compétences en mathématiques, notamment celles liées au calcul et à la construction, la lecture et l'utilisation de graphiques ; toutes les capacités correspondantes peuvent être mises en oeuvre au cours d'activités interdisciplinaires.}} \end{multicols} \newpage \section{Caractéristiques de position d'une série statistique} \subsection{Moyenne d'une série statistique} \begin{itemize} \item[\textbullet]Série représentée en liste\par Une classe de 5\textsuperscript{ème} a fait un contrôle de mathématiques. Voici la liste des notes obtenues : 8, 11, 5, 12, 2, 17, 7, 8, 19, 2, 10, 4, 7, 7, 11, 14, 7, 8, 12, 5, 10, 8, 5, 10, 11, 8, 12, 10, 14, 12.\\ Si l'on veut calculer la moyenne de ce contrôle, on additionne les notes et on divise par le nombre de notes : $$\frac{8+11+5+\ldots+10+14+12}{30}=\frac{276}{30}=9,2$$ \item[\textbullet]Série regroupée par valeurs dans un tableau\par On peut aussi regrouper ces nombres dans le tableau suivant selon les valeurs des notes obtenues :\\ \begin{center}\begin{tabular}{|m{2.5cm}|*{11}{c|}}\hline {\textbf{Notes}}&2&4&5&7&8&10&11&12&14&17&19\\\hline{\textbf{Effectif}}&2&1&3&4&5&4&3&4&2&1&1\\\hline \end{tabular}\end{center}~\\ La moyenne est alors {\textbf{une moyenne pondérée}} par les effectifs ; on la calcule en multipliant chaque valeur par l'effectif correspondant, en faisant la somme de ces produits et en divisant par l'effectif total, soit : $$\frac{2\times2+4\times1+5\times3+\ldots+14\times2+17\times1+19\times1}{30}=\frac{276}{30}=9,2$$ \item Série regroupée par classe dans un tableau\par On peut enfin regrouper ces nombres en classes dans le tableau suivant :\\ \begin{center}\begin{tabular}{|m{2.5cm}|*{5}{c|}}\hline {\textbf{Notes}}&$0\leq n<5$&$5\leq n<10$&$10\leq n<15$&$15\leq n\leq20$&{\textsc{Total}}\\\hline{\textbf{centre de la classe}}&2,5&7,5&12,5&17,5&~\\\hline {\textbf{Effectif}}&3&12&13&2&30\\\hline\end{tabular}\end{center}~\\ On considère alors que le centre de chaque classe représente la classe donc la moyenne de la série ainsi regroupée en classesest égale à : $$\frac{2,5\times3+7,5\times12+12,5\times13+17,5\times2}{30}=\frac{295}{30}\approx9,83$$ \end{itemize} {\textbf{Remarques :}} \begin{itemize}\item La moyenne et la moyenne pondérée par les effcetifs sont égales.\item Le regroupement en classes permet des calculs plus rapides mais ne permet pas d'obtenir la valeur exacte de la moyenne.\end{itemize} \subsection{Médiane d'une série statistique} \begin{tabular}{p{2.5cm}p{14cm}} {\textbf{Définition}}& La {\textbf{médiane}} $\mathcal{M}$ d'une série statistique est la valeur qui partage le groupe étudié en deux sous-groupes de même effectif chacun tels que :\begin{itemize} \item tous les éléments du premier groupe on des valeurs inférieures ou égales à $\mathcal{M}$ ; \item tous les éléments du deuxième groupe ont des valeurs supérieures ou égales à $\mathcal{M}$. \end{itemize}\\ \end{tabular}\\[0.2cm] {\textbf{Application:}} \begin{itemize} \item[\textbullet] {\textbf{Détermination de la médiane d'une série statistique}}\begin{itemize} \item {\textbf{A partir d'un tableau d'effectifs cumulés ou de fréquences cumulées}}\\ {\textit{Exemple : }} \\ Sur une population de 75 feuilles de platane, on étudie la longueur en mm de la grande nervure. On obtient le tableau statistique suivant :\\ \begin{center}\begin{tabular}{|m{3.5cm}|*{9}{c|}} \hline Longueurs&102&112&122&132&142&152&162&172&182\\\hline Effectif&1&6&6&10&13&19&10&8&2\\\hline Effectif cumulé croissant&1&7&13&23&36&\colorbox{gray}{55}&65&73&75\\\hline \end{tabular}\end{center}~\\[0.4cm] Les feuilles étant rangées par longueurs croissantes, la case grisée indique que de la 37\textsuperscript{ème} à la 55\textsuperscript{ème}, les feuilles ont pour longueur 152 mm.\\ Or $75=37+1+37$ donc la médiane est la longueur de la 38\textsuperscript{ème} feuille c'est-à-dire 152 mm.\\ $$\begin{array}{l*{9}{c}}\mbox{Rang :}&1^{re}&2^{e}&\ldots&36^{e}&37^{e}&38^{e}&39^{e}&\ldots&75^{e}\\ \mbox{Longueur :}&102&112&\ldots&142&152&\textcolor{red}{152}&152&\ldots&182\\& \multicolumn{5}{c}{\overset{\underbrace{\quad\qquad\qquad\qquad\quad}_{{\mbox{37 feuilles}}}}{~}}&~&\multicolumn{3}{c}{\overset{\underbrace{\qquad\qquad\quad}_{\mbox{37 feuilles}}}{~}} \end{array}$$ D'autre part, la longueur moyenne de ces feuilles est de : $$\begin{array}{l} {\bar l}=\dfrac{102\times1+112\times6+122\times6+132\times10+142\times13+152\times19+162\times10+172\times8+182\times2}{75}\\ {\bar l}=\dfrac{10920}{75}=145,6 \end{array}$$ donc la médiane et la moyenne sont (en général) {\textbf{différentes}}. \item {\textbf{\`A partir d'une représentation graphique}}\\ Une valeur approchée de la médiane peut être obtenue à l'aide de la courbe polygonale des effectifs cumulés croissants (ou des fréquences cumulées) en lisant la valeur correspondant à la moitié de l'effectif total (ou à une fréquence cumulée égale à 50\%) :\\ \`{A} la question "Quelle quantité d'eau buvez-vous par jour ?", les cinquante personnes interrogées ont donné des réponses qui ont permis de tracer le polygone des effectifs cumulés croissants suivant : \begin{center}\scalebox{0.8}{\begin{pspicture}(0,0)(13,11.5) \psline{->}(0,0)(13.5,0) \multido{\n=2+2}{5}{\psline(-0.08,\n)(0.08,\n)} \multido{\n=2+2}{6}{\psline(\n,-0.08)(\n,0.08)} \psline{->}(0,0)(0,10.5)\psline[linecolor=red](0,0)(2,2.4)(4,6.6)(6,8.4)(8,9.6)(12,10) \psdots[dotscale=1.5,dotstyle=x](2,2.4)(4,6.6)(6,8.4)(8,9.6)(12,10) \uput{0.2}[270](2,0){0,5}\uput{0.2}[270](3.2,0){\textcolor{red}{0,8}} \uput{0.2}[270](4,0){1}\uput{0.2}[270](6,0){1,5}\uput{0.2}[0](9,6){\parbox{5cm}{\textit{La courbe polygonale des effectifs cumulés est obtenue en joignant par des segments les points dont l'abscisse est une valeur de la série et dont l'ordonnée est l'effectif cumulé correspondant à cette valeur.}}} \psline[linestyle=dashed](2,0)(2,2.4)(0,2.4)\psline[linestyle=dashed,linecolor=BlueViolet](3.2,0)(3.2,5)(0,5) \psline[linestyle=dashed](4,0)(4,6.6)(0,6.6)\psline[linestyle=dashed](6,0)(6,8.4)(0,8.4) \psline[linestyle=dashed](8,0)(8,9.6)(0,9.6)\psline[linestyle=dashed](12,0)(12,10)(0,10) \uput{0.2}[270](8,0){2}\uput{0.2}[270](10,0){2,5}\uput{0.2}[270](12,0){3} \uput{0.2}[180](0,2.4){12}\uput{0.2}[180](0,5){\textcolor{red}{25}} \uput{0.2}[180](0,10){50}\uput{0.2}[180](0,6.6){33} \uput{0.2}[180](0,8.4){42}\uput{0.2}[180](0,9.6){48} %\uput{0.2}[270](11,0){16}\uput{0.2}[270](12,0){17} \uput{0.2}[0](0,10.5){{\textit{Effectif cumulé}}}\uput{0.2}[90](13,0){{\textit{Quantité d'eau (en L)}}} \end{pspicture}}\end{center}~\\[0.6cm] $\mathcal{M}$ est environ égal à 0,8 L : en effet, la moitié des personnes interrogées consomme moins de 0,8 L par jour (ou la moitié des personnes interrogées consomme plus de 0,8 L par jour). \end{itemize}\end{itemize} \section{Une caractéristique de dispersion : l'étendue} \begin{tabular}{p{2.5cm}p{14cm}} {\textbf{Définition}}& {\textbf{L'étendue}} d'une série statistique est égale à la différence entre la plus grande et la plus petite valeur prises par cette série. Elle mesure la "dispersion" de cette série. \end{tabular}\\[0.6cm] {\textbf{Les critères de dispersion}} indiquent de quelle façon les valeurs du caractère sont groupées (plus ou moins resserrées) autour des valeurs "centrales" : l'étendue est le plus simple de ces paramètres. En général, lorsque l'étendue est élevée, la dispersion est grande.\\ {\textbf{Exemple : }} pour la série avec les platanes, l'étendue est de $182-102=80$ mm. \section{Notions de quatrième} \subsection{Effectifs et fréquences} \begin{tabular}{p{2.5cm}p{14cm}} {\textbf{Définition}}& Dans un tableau statistique, l'{\textbf{effectif}} est le nombre de réponses associées à chaque valeur.\par L'ensemble des valeurs et des effectifs forme une {\textbf{série statistique}}.\par En divisant l'effectif d'une valeur par l'effectif total, on obtient la {\textbf{fréquence}}.\par En multipliant par 100 la fréquence, on obtient la {\textbf{fréquence en pourcentage}}.\\ \end{tabular}\\[0.2cm] \\La standardiste d'une radio FM a noté le nombre d'appels téléphoniques reçus par tranches d'heures au cours d'une matinée. Elle obtient les résultats suivants :\\[0.2cm] \begin{center}\begin{tabular}{|m{3.5cm}|c|c|c|c|c|} \hline Tranches horaires&9h-10h&10h-11h&11h-12h&12h-13h& {\textbf{Total}}\\\hline Effectifs\par(nombres d'appels)&19&37&46&28&{\textbf{130}}\\\hline Mesures d'angles au centre en degrés &52,6&102,5&127,4&77,5&{\textbf{360}}\\\hline\end{tabular}\end{center} \begin{enumerate} \item Compléter le tableau. \item Représenter cette série statistique par un diagramme circulaire \end{enumerate} {\textbf{Réponse à la question 2 :}\\ Pour construire un diagramme circulaire, il faut calculer les mesures des angles de chaque valeur. Les angles au centre du disque sont proportionnels aux effectifs donc il s'agit de compléter un tableau de proportionnalité. Sachant qu'un tour complet mesure 360° et que celui-ci doit représenter l'effectif total 130, il faut compléter le tableau suivant :\\[0.2cm] \begin{minipage}{10cm}On obtient alors le diagramme suivant : \end{minipage}\hfill\begin{minipage}{7cm}\includegraphics{coursstats3eme.1}\end{minipage} \subsection{Effectifs et fréquences cumulés} \begin{tabular}{p{2.5cm}p{14cm}} {\textbf{Définition}}& Lorsque les valeurs sont rangées dans l'ordre croissant, on obtient {\textbf{l'effectif cumulé croissant}} d'une valeur en additionnant son effectif à ceux qui le précèdent (on additionne à partir de la gauche du tableau). \par De la même manière, les {\textbf{fréquences cumulées croissantes}} s'obtiennent en divisant l'effectif cumulé croissant par l'effectif total. \par Pour obtenir les effectifs ou les fréquences {\textbf{cumulés décroissants}}, on additionne à partir de la droite du tableau.\\ \end{tabular}\\[0.6cm] {\textbf{Remarque :}} les effectifs cumulés croissants indiquent quel est l'effectif de la série dont la valeur est inférieure à une valeur donnée.\\ {\textbf{Exemple :}} On reprend l'exemple précédent : \begin{center}\begin{tabular}{|m{3.5cm}|c|c|c|c|} \hline Tranches horaires&9h-10h&10h-11h&11h-12h&12h-13h\\\hline Effectifs\par(nombres d'appels)&19&37&46&28\\\hline Effectifs {\textbf{cumulés croissants}}&{\textbf{19}}&19 + 37 = {\textbf{56}}& 19 + 37 + 46 = {\textbf{102}}&{\textbf{Total des appels : 130}}\\\hline \end{tabular}\\[0.2cm] \begin{tabular}{|m{3.5cm}|c|c|c|c|} \hline Tranches horaires&9h-10h&10h-11h&11h-12h&12h-13h\\\hline Fréquences en \%&14,6&28,5&35,4&21,5\\\hline Fréquences {\textbf{cumulées décroissantes}}&{\textbf{Total des appels : 100}}&28,5 + 35,4 + 21,5 = {\textbf{85,4}}& 35,4 + 21,5 = {\textbf{56,9}}&21,5 \\\hline \end{tabular}\end{center} \subsection{Moyenne} \begin{tabular}{p{2.5cm}p{14cm}} {\textbf{Définition}}& La {\textbf{moyenne}} d'une série statistique est le quotient de la somme de toutes les valeurs par l'effectif total de cette série :\par $${\displaystyle{{\mbox{moyenne}} = \frac{{\mbox{somme de toutes les valeurs}}}{{\mbox{effectif total de la série}}}}}$$\\ \end{tabular}\\[0.6cm] {\textbf{Exemple :}} Dans une usine, sept employés calculent le salaire moyen (en \textgreek{\euro}) des salaires de leur atelier. $$\frac{760 + 825 + 915 + 990 + 1065 + 1160 + 1296}{7}\approx 1002$$ Le salaire moyen des employés de cet atelier s'élève environ à 1002 \textgreek{\euro}. \subsection{Moyenne pondérée} \begin{tabular}{p{2.5cm}p{14cm}} {\textbf{Définition}}& La {\textbf{moyenne pondérée}} d'une série statistique est le quotient de la somme des valeurs, affectées chacune de leur coefficient, par la somme totale des coefficients. \\\end{tabular}\\[0.4cm] {\textbf{Exemple :}} Dans une classe de 28 élèves, les notes à un devoir se répartissent de la manière suivante :\\[0.2cm] \begin{tabular}{|m{2.5cm}|c|c|c|c|c|c|c|c|c|c|} \hline Notes&6&7&8&9&10&11&12&13&15&17\\\hline Effectifs& \color{red} 2&\color{red} 1&\color{red} 2&\color{red} 4&\color{red} 6&\color{red} 3&\color{red} 3&\color{red} 3&\color{red} 2&\color{red} 2\\\hline\end{tabular} \\[0.2cm] Nous représentons cette série par un diagramme en barres (FIG.~\ref{illustration}). \begin{center}\scalebox{0.8}{\begin{pspicture}(0,0)(13,10) \psline{->}(0,0)(13.5,0) \multido{\n=1+1}{7}{\psline[linecolor=red](0,\n)(13,\n)} \psline{->}(0,0)(0,8) \multido{\n=1+1}{7}{\uput{0.2}[180](0,\n){\textcolor{red}\n}} \uput{0.2}[270](1,0){6}\uput{0.2}[270](2,0){7} \uput{0.2}[270](3,0){8}\uput{0.2}[270](4,0){9} \uput{0.2}[270](5,0){10}\uput{0.2}[270](6,0){11}\uput{0.2}[270](7,0){12} \uput{0.2}[270](8,0){13}\uput{0.2}[270](9,0){14}\uput{0.2}[270](10,0){15} \uput{0.2}[270](11,0){16}\uput{0.2}[270](12,0){17} %\psset{fillcolor=Blue} \psframe[fillstyle=solid,fillcolor=blue](0.7,0)(1.3,2)\psframe[fillstyle=solid,fillcolor=blue](1.7,0)(2.3,1) \psframe[fillstyle=solid,fillcolor=blue](2.7,0)(3.3,2)\psframe[fillstyle=solid,fillcolor=blue](3.7,0)(4.3,4) \psframe[fillstyle=solid,fillcolor=blue](4.7,0)(5.3,6)\psframe[fillstyle=solid,fillcolor=blue](5.7,0)(6.3,3) \psframe[fillstyle=solid,fillcolor=blue](6.7,0)(7.3,2)\psframe[fillstyle=solid,fillcolor=blue](7.7,0)(8.3,3) \psframe[fillstyle=solid,fillcolor=blue](9.7,0)(10.3,2)\psframe[fillstyle=solid,fillcolor=blue](11.7,0)(12.3,2) \uput{0.2}[180](0,7.5){{\textit{Effectifs}}}\uput{0.2}[270](13,0){{\textit{Notes}}} \end{pspicture}}\end{center} \caption[pspicture]{\label{illustration} {\textbf{Diagramme en barres :}} La hauteur des barres est égale aux effectifs} Pour calculer la moyenne, on effectue le calcul suivant : $$\frac{6\times\textcolor{red}{2}+7\times\textcolor{red}{1}+8\times\textcolor{red}{2}+9\times\textcolor{red}{4}+10\times\textcolor{red}{6}+11\times\textcolor{red}{3}+ 12\times\textcolor{red}{3}+13\times\textcolor{red}{3}+15\times\textcolor{red}{2}+17\times\textcolor{red}{2}}{2+1+2+4+6+3+3+3+2+2}=\frac{303}{28}\approx10,8$$ Pour calculer la moyenne pondérée d'une série de valeurs, il faut :\begin{itemize} \item calculer les produits de chaque valeur par leur coefficient ; \item calculer la somme de ces produits ; \item puis diviser le résultat par la somme des coefficients. \end{itemize} \subsection{Répartition en classes et moyenne} Il arrive dans certains cas qu'une série statistique soit répartie en classes, c'est-à-dire que l'on prend des intervalles de valeurs : \\{\textbf{Exemple : }} Le tableau ci-dessous présente la répartition de 2000 adultes suivant leur taille :\\[0.4cm] \begin{tabular}{|m{3cm}|c|c|c|c|}\hline Tailles en cm &$\left[140\, ; 150\right[$&$\left[150\, ; 160\right[$&$\left[160\, ; 170\right[$& $\left[170\, ; 195\right[$\\\hline Effectifs&48&397&913&642\\\hline\end{tabular}\\[0.4cm] Il est impossible a priori de calculer la moyenne de cette série puisqu'on ne connait pas les valeurs des tailles et leurs effectifs. On considère alors que la valeur au centre de la classe va représenter la classe. On calcule alors la moyenne pondérée pour obtenir une valeur approchée de la moyenne de la série.\\[0.4cm] \begin{tabular}{|m{3cm}|c|c|c|c|}\hline Tailles en cm &$\left[140\, ; 150\right[$&$\left[150\, ; 160\right[$&$\left[160\, ; 170\right[$& $\left[170\, ; 195\right[$\\\hline Centre de la classe&145&155&165&182,5\\\hline Effectifs&48&397&913&642\\\hline\end{tabular}\\[0.4cm] Pour calculer la taille moyenne, on effectue le calcul suivant :$$\frac{145\times48+155\times397+165\times913+145\times642}{2000}\approx168$$ La taille moyenne de ce groupe d'adultes est d'environ 168 cm. \section{Eléments historiques et culturels} {\emph{Les activités statistiques remontent à la plus haute Antiquité (en \'Egypte vers -1700 et en Chine encore avant peut-être) et correspondent à des recueils de données chiffrées dont le but était de fournir des renseignements sur la population. Le mot "statistique" appartient au langage administratif et apparaît en 1664 dans les premières enquêtes lancées par Colbert, ministre de Louis XIV, pour recenser la population, les fermages et les animaux sur toute la France. Connaître et expliquer les phénomènes sociaux et économiques nécessite le besoin de représenter pour visualiser, d'où diverses formes de graphiques, en barres ou en secteurs, mais aussi le besoin de résumer la masse de données recueillies. Plusieurs paramètres sont alors créés : le "mode" (valeur apparaissant le plus fréquemment) et des "moyennes".\\ C'est à l'astronomie que l'on doit l'origine de ces concepts. Les Babyloniens et les Grecs avaient repéré la position de certaines étoiles et la périodicité de leur mouvement après un grand nombre de mesures et calculs. Tycho Brahé (1546-1601) fait, lui aussi, de multiples observation d'une même quantité pour en estimer une valeur la plus juste possible. Il cherche à éliminer le maximum d'erreurs dans ses observations et calculs et, pour estimer la valeur qui lui paraît la plus juste possible, il utilise la moyenne arithmétique. \\Les sondages n'arriveront que plus tard au début du XIX\textsuperscript{ème} lorsque des méthodes de relevés partiels permettront de rendre compte aussi précisément des phénomènes.\\ De nos jours, les méthodes statistiques sont utilisées en médecine et en pharmacie (efficacité d'un traitement ou d'un médicament), en politique (sondages avant élections), dans l'industrie (contrôle de qualité, gestion des stocks, marketing) et dans de très nombreux domaines.}} \end{document}