Statistiques
Contexte des ??coles Wikip??dia
SOS Enfants produite ce site pour les ??coles ainsi que ce site de vid??o sur l'Afrique . Pour comparer les organismes de bienfaisance de parrainage ce est le meilleur lien de parrainage .
Statistique est une science math??matique relative ?? la collecte, l'analyse, l'interpr??tation ou explication, et la pr??sentation des donn??es. Elle est applicable ?? une grande vari??t?? de disciplines universitaires, des naturelles et sociales sciences aux sciences humaines et aux gouvernement et les entreprises.
Des m??thodes statistiques peuvent ??tre utilis??es pour r??sumer ou d??crire une collecte de donn??es; cela se appelle statistiques descriptives. En outre, les mod??les dans les donn??es peuvent ??tre mod??lis?? d'une mani??re qui tient compte de le hasard et l'incertitude dans les observations, et ensuite utilis?? pour tirer des conclusions sur le processus ou de la population ?? l'??tude; cela se appelle inf??rence statistique. Les deux statistiques descriptives et inf??rentielles comprennent statistiques appliqu??es. Il ya aussi une discipline appel??e statistiques math??matiques, qui sont concern??s par la base th??orique du sujet.
Les statistiques de mot est aussi le pluriel de statistique (au singulier), qui fait r??f??rence au r??sultat de l'application d'un algorithme statistique pour un ensemble de donn??es, comme dans statistiques ??conomiques, statistiques de la criminalit??, etc.
Histoire
Statistiques surgi, au plus tard le 18??me si??cle , de la n??cessit?? des ??tats ?? recueillir des donn??es sur leurs populations et les ??conomies, afin de les administrer. Son sens ??largi au d??but du 19??me si??cle pour inclure la collecte et l'analyse des donn??es en g??n??ral. statistiques est aujourd'hui largement utilis??s dans le gouvernement, les entreprises et les sciences naturelles et sociales.
En raison de ses origines au sein du gouvernement et sa vue centr??e sur les donn??es monde, les statistiques sont consid??r??es comme ne ??tant pas un sous-champ des math??matiques, mais plut??t un champ distinct qui utilise les math??matiques. Ses fondations math??matiques ont ??t?? port??es dans les 17e et 18e si??cles avec le d??veloppement de la th??orie des probabilit??s . La m??thode des moindres carr??s , une technique central de la discipline, a ??t?? invent?? dans le d??but du 19e si??cle par plusieurs auteurs. Depuis lors de nouvelles techniques de probabilit?? et statistiques ont ??t?? en d??veloppement continu. Modernes ordinateurs ont acc??l??r?? ?? grande ??chelle d'un calcul statistique, et ont ??galement rendu possible de nouvelles m??thodes qui seraient impossible ?? effectuer manuellement.
Vue d'ensemble
En application des statistiques ?? un probl??me scientifique, industriel, ou soci??tal, on commence par un processus ou population ?? ??tudier. Cela pourrait ??tre une population de personnes dans un pays, de grains cristallins dans une roche ou de produits fabriqu??s par une usine particuli??re au cours d'une p??riode donn??e. Elle peut au contraire ??tre un processus observ?? ?? plusieurs reprises; les donn??es collect??es sur ce genre de ??population?? constituent ce qu'on appelle un s??rie chronologique.
Pour des raisons pratiques, plut??t que de la compilation des donn??es sur toute une population, on ??tudie g??n??ralement un sous-ensemble de la population choisie, appel?? un ??chantillon . Les donn??es sont recueillies ?? propos de l'??chantillon dans un ou observationnelle cadre exp??rimental. Les donn??es sont ensuite soumis ?? une analyse statistique, qui sert deux objectifs connexes: description et inf??rence.
- Les statistiques descriptives peuvent ??tre utilis??s pour r??sumer les donn??es, soit num??rique ou graphique, pour d??crire l'??chantillon. Exemples de base de descripteurs num??riques comprennent la moyenne et l'??cart type . R??capitulations graphiques comprennent divers types de diagrammes et de graphiques.
- Les statistiques d??ductives est utilis?? pour mod??liser les mod??les dans les donn??es, ce qui repr??sente hasard et de tirer des conclusions sur la population en g??n??ral. Ces d??ductions peuvent prendre la forme de r??ponses aux questions oui / non ( tests d'hypoth??ses), les estimations des caract??ristiques num??riques ( estimation), les descriptions de l'association ( corr??lation ), ou la mod??lisation des relations ( r??gression ). Autre techniques de mod??lisation comprennent ANOVA, les s??ries chronologiques, et l'exploration de donn??es.
"... Ce ne est que la manipulation de l'incertitude qui nous int??resse. Nous ne sommes pas pr??occup??s par la question qui est incertain. Ainsi, nous ne ??tudions pas le m??canisme de la pluie; que se il va pleuvoir ".
Le concept de corr??lation est particuli??rement remarquable. L'analyse statistique d'un ensemble de donn??es peut r??v??ler que deux variables (ce est deux propri??t??s de la population ?? l'??tude) ont tendance ?? varier ensemble, comme se ils sont connect??s. Par exemple, une ??tude du revenu annuel et l'??ge de d??c??s chez les personnes pourraient trouver que les pauvres ont tendance ?? avoir une vie plus courte que les personnes riches. Les deux variables sont dits ??tre corr??l??es. Cependant, on ne peut pas d??duire imm??diatement l'existence d'une relation causale entre les deux variables (voir Corr??lation ne implique pas causalit??). Les ph??nom??nes corr??l??e pourrait ??tre caus??e par un troisi??me ph??nom??ne, jusqu'alors n??glig??es, appel?? tapi variable.
Si l'??chantillon est repr??sentatif de la population, alors les conclusions et les conclusions de l'??chantillon peuvent ??tre ??tendues ?? la population dans son ensemble. Un probl??me majeur r??side dans la d??termination de la mesure dans laquelle l'??chantillon choisi est repr??sentatif. Statistiques propose des m??thodes pour estimer et corriger pour al??atoire dans l'??chantillon et dans la proc??dure de collecte des donn??es, ainsi que des m??thodes pour concevoir des exp??riences solides en premier lieu (voir conception exp??rimentale).
Le concept math??matique fondamentale utilis??e dans la compr??hension de tels al??atoire est la probabilit?? . Statistique math??matique (aussi appel??s th??orie statistique) est la branche de math??matiques appliqu??es qui utilise la th??orie et de probabilit?? analyse pour examiner la base th??orique des statistiques.
L'utilisation de toute m??thode statistique ne est valable que lorsque le syst??me ou de la population ?? l'??tude satisfait les hypoth??ses math??matiques de base de la m??thode. Utilisation abusive des statistiques peut produire des erreurs subtiles mais graves dans la description et l'interpr??tation - subtile que m??me les professionnels exp??riment??s font parfois de telles erreurs et graves qu'ils peuvent influer sur la politique sociale, la pratique m??dicale et la fiabilit?? des structures comme les ponts et les centrales nucl??aires. M??me lorsque les statistiques est correctement appliqu??e, les r??sultats peuvent ??tre difficiles ?? interpr??ter pour un non-expert. Par exemple, le signification statistique d'une tendance dans les donn??es - qui mesure la mesure dans laquelle la tendance pourrait ??tre caus??e par une variation al??atoire dans l'??chantillon - peut ne pas ??tre d'accord avec son sens intuitif de son importance. L'ensemble des comp??tences de base (statistiques) et le scepticisme n??cessaires par des personnes ?? traiter des informations dans leur vie quotidienne est appel??e litt??ratie statistique.
M??thodes statistiques
Des ??tudes exp??rimentales et d'observation
Un objectif commun pour un projet de recherche statistique est d'??tudier causalit??, et en particulier de tirer une conclusion sur l'effet des changements dans les valeurs de pr??dicteurs ou variables ind??pendantes sur la r??ponse ou variables d??pendantes. Il existe deux grands types d'??tudes statistiques causales, des ??tudes exp??rimentales et des ??tudes d'observation. Dans les deux types d'??tudes, l'effet des diff??rences d'une variable ind??pendante (ou variables) sur le comportement de la variable d??pendante sont observ??es. La diff??rence entre les deux types est la fa??on dont l'??tude est effectivement r??alis??e. Chacun peut ??tre tr??s efficace.
Une ??tude exp??rimentale consiste ?? prendre des mesures du syst??me ?? l'??tude, manipuler le syst??me, puis prendre des mesures suppl??mentaires en utilisant la m??me proc??dure pour d??terminer si la manipulation peut avoir modifi?? les valeurs des mesures. En revanche, une ??tude d'observation ne implique pas la manipulation exp??rimentale. Au lieu de cela les donn??es sont recueillies et les corr??lations entre les pr??dicteurs et la r??ponse sont ??tudi??es.
Un exemple d'une ??tude exp??rimentale est la c??l??bre Hawthorne ??tudes qui ont tent?? de tester les modifications ?? l'environnement de travail ?? l'usine de Hawthorne de la Western Electric Company. Les chercheurs se sont int??ress??s ?? savoir si l'??clairage accrue augmenterait la productivit?? de la travailleurs de premi??re ligne d'assemblage. Les chercheurs ont d'abord mesur?? la productivit?? dans l'usine alors modifi??es l'??clairage dans une zone de l'usine pour voir si des changements dans l'??clairage seraient affecter la productivit??. Comme il se av??re, la productivit?? am??lior??e dans toutes les conditions exp??rimentales (voir Effet Hawthorne). Cependant, l'??tude est aujourd'hui fortement critiqu?? pour des erreurs dans les proc??dures exp??rimentales, en particulier l'absence d'une groupe t??moin et blindedness .
Un exemple d'une ??tude d'observation est une ??tude qui explore la corr??lation entre le tabagisme et le cancer du poumon. Ce type d'??tude utilise g??n??ralement une enqu??te pour recueillir des observations sur la zone d'int??r??t, puis effectuer une analyse statistique. Dans ce cas, les chercheurs devraient recueillir les observations des deux fumeurs et non-fumeurs, peut-??tre ?? travers une ??tude cas-t??moins, puis de regarder le nombre de cas de cancer du poumon dans chaque groupe.
Les ??tapes de base pour une exp??rience sont les suivants:
- planifier la recherche, y compris la d??termination des sources d'information, la s??lection des sujets de recherche, et ??thiques consid??rations pour la recherche et m??thode propos??e,
- Conception de l'exp??rience se concentrant sur le mod??le du syst??me et de l'interaction de variables ind??pendantes et d??pendantes,
- r??sumer un recueil d'observations ?? pr??senter leur communaut?? en supprimant les d??tails ( statistiques descriptives),
- parvenir ?? un consensus sur ce que les observations nous disent sur le monde que nous observons ( inf??rence statistique),
- document et pr??senter les r??sultats de l'??tude.
Les niveaux de mesure
- Voir: Stanley Stevens '"??chelles de mesure" (1946): nominal, ordinal, intervalle, le rapport
Il ya quatre types de mesures ou ??chelles de mesure utilis??es dans les statistiques. Les quatre types ou niveaux de mesure (nominal, ordinal, intervalle, et le rapport) ont diff??rents degr??s d'utilit?? en statistique recherche. mesures de rapport, o?? ?? la fois une valeur z??ro et les distances entre les diff??rentes mesures sont d??finies, offrent la plus grande flexibilit?? dans les m??thodes statistiques qui peut ??tre utilis?? pour analyser les donn??es. Mesures d'intervalles ont distances significatives entre les mesures, mais aucune valeur significative z??ro (telles que les mesures de QI ou de mesures de temp??rature dans Fahrenheit). Mesures ordinales ont des diff??rences entre les valeurs cons??cutives impr??cises mais un ordre significatif ?? ces valeurs. Mesures nominales ont pas d'ordre de rang significatif parmi les valeurs.
Variables conformes seulement aux mesures nominales ou ordinales sont ainsi parfois appel??s variables cat??goriques, car ils ne peuvent raisonnablement ??tre mesur??s num??riquement, alors que le ratio et par intervalles mesures sont regroup??es sous quantitative ou variables continues en raison de leur nature num??rique.
Les techniques statistiques
Certains bien connus statistiques essais et les proc??dures de recherche observations sont:
- Test de Student
- test du chi carr??
- L'analyse de variance (ANOVA)
- De Mann-Whitney U
- L'analyse de r??gression
- Analyse Factorielle
- Corr??lation
- Coefficient de corr??lation de Pearson
- Corr??lation de Spearman
- Time Series Analysis
Disciplines sp??cialis??es
Certains champs des statistiques d'utilisation d'enqu??te appliqu??es de fa??on extensive qu'ils ont terminologie sp??cialis??e. Ces disciplines sont:
- Actuariat
- Economie Appliqu??e de l'information
- Biostatistique
- Bootstrap & Jackknife
- Statistiques des entreprises
- L'exploration de donn??es (application des statistiques et reconnaissance des formes pour d??couvrir connaissances ?? partir de donn??es)
- D??mographie
- Les statistiques ??conomiques (??conom??trie)
- Statistiques de l'??nergie
- les statistiques d'ing??nierie
- Statistiques de l'environnement
- ??pid??miologie
- G??ographie et Syst??mes d'information g??ographique, plus particuli??rement dans L'analyse spatiale
- Traitement de l'image
- Analyse multidimensionnelle
- Statistiques psychologiques
- Qualit??
- Statistiques sociales
- Alphab??tisation statistique
- La mod??lisation statistique
- Les enqu??tes statistiques
- Analyse des processus et chimiom??trie (pour l'analyse de donn??es provenant de la chimie analytique et g??nie chimique)
- L'analyse de survie
- l'ing??nierie de la fiabilit??
- Statistiques dans divers sports, notamment baseball et cricket
Statistiques constituent un outil de base cl?? dans les affaires et de fabrication ainsi. Il est utilis?? pour comprendre des syst??mes de mesure de la variabilit??, des processus de contr??le (comme dans contr??le statistique du processus ou SPC), pour r??sumer les donn??es et de prendre des d??cisions bas??es sur les donn??es. Dans ces r??les, il est un outil essentiel, et peut-??tre le seul outil fiable.
Calcul statistique
Les augmentations rapides et soutenues dans la puissance de calcul ?? partir de la seconde moiti?? du 20??me si??cle ont eu un impact consid??rable sur la pratique de la science statistique. Les premiers mod??les statistiques ??taient presque toujours ?? partir de la classe de mod??les lin??aires, mais des ordinateurs puissants, coupl??s avec num??riques appropri??s algorithmes , ont provoqu?? un regain d'int??r??t pour mod??les non lin??aires (en particulier les r??seaux de neurones et des arbres de d??cision) et la cr??ation de nouveaux types, tels que mod??les lin??aires g??n??ralis??s et mod??les multiniveaux.
Puissance de calcul accrue a ??galement conduit ?? la popularit?? croissante des m??thodes de calcul intensif bas??es sur des r????chantillonnage, comme les tests de permutation et de la bootstrap, tandis que les techniques telles que ??chantillonnage de Gibbs ont fait des m??thodes bay??siennes plus r??alisable. La r??volution informatique a des implications pour l'avenir des statistiques, avec un nouvel accent sur les statistiques "exp??rimentales" et "empiriques". Un grand nombre de fois ?? usage g??n??ral et sp??cial progiciels statistiques sont maintenant disponibles pour les praticiens.
Abus
Il ya une perception g??n??rale que la connaissance statistique est bien trop souvent intentionnellement abus??, en trouvant des fa??ons d'interpr??ter les donn??es qui sont favorables au pr??sentateur. Une phrase c??l??bre attribu??e ?? Benjamin Disraeli est, " Il ya trois sortes de mensonges:. Mensonges, les sacr??s mensonges et les statistiques ??Et le pr??sident de Harvard Lawrence Lowell a ??crit en 1909 que les statistiques, "comme les tartes de veau, sont bonnes si vous connaissez la personne qui les a rendus, et sont s??rs de les ingr??dients."
Si diverses ??tudes semblent contredire les uns les autres, le public peut venir ?? se m??fier de telles ??tudes. Par exemple, une ??tude peut sugg??rer qu'un r??gime ou une activit?? donn??e soul??ve la pression art??rielle , tandis qu'un autre peut sugg??rer qu'il abaisse la pression art??rielle. L'??cart peut provenir de subtiles variations dans la conception exp??rimentale, telles que les diff??rences dans les groupes de patients ou des protocoles de recherche, qui ne sont pas facilement compr??hensibles par le non-expert. (Rapports des m??dias omettent parfois cette information contextuelle vitale enti??rement.)
En choisissant (ou de rejeter ou modifier) un certain ??chantillon, les r??sultats peuvent ??tre manipul??s; jeter aberrantes est un des moyens de le faire. Ces manipulations ne doivent pas ??tre malveillant ou retors; ils peuvent provenir de pr??jug??s involontaires du chercheur. Les graphiques utilis??s pour r??sumer les donn??es peuvent ??galement ??tre trompeurs.
Critiques profondes proviennent du fait que l'approche de tests d'hypoth??ses, largement utilis?? dans de nombreux cas requis par la loi ou un r??glement, oblige une hypoth??se (la hypoth??se nulle) ?? "favoris??", et peut ??galement sembler exag??rer l'importance de diff??rences mineures dans les grandes ??tudes. Une diff??rence qui est statistiquement tr??s significative peut encore ??tre d'aucune importance pratique. (Voir critique de tests d'hypoth??ses et controverse sur l'hypoth??se nulle.)
Une r??ponse a ??t?? un plus grand accent sur la valeur p plus tout simplement de rapports si une hypoth??se a ??t?? rejet??e au niveau de signification donn??. La valeur p, cependant, ne indique pas la taille de l'effet. Une autre approche de plus en plus courante consiste ?? signaler intervalles de confiance. Bien que ceux-ci sont produits ?? partir des m??mes calculs que les tests d'hypoth??ses ou p -values, ils d??crivent ?? la fois la taille de l'effet et de l'incertitude qui l'entoure.