Le data dredging (littéralement le dragage de données mais mieux traduit comme étant du triturage de données) est une technique statistique qui « consiste à ne publier que les compositions d’échantillon et les périodes d’observation favorables à l’hypothèse testée ». Une des formes du data dredging est de partir de données ayant un grand nombre de variables et un grand nombre de résultats, et de choisir les associations qui sont « statistiquement significatives », au sens de la valeur p (on parle aussi de p-hacking).

Property Value
dbo:abstract
  • Le data dredging (littéralement le dragage de données mais mieux traduit comme étant du triturage de données) est une technique statistique qui « consiste à ne publier que les compositions d’échantillon et les périodes d’observation favorables à l’hypothèse testée ». Une des formes du data dredging est de partir de données ayant un grand nombre de variables et un grand nombre de résultats, et de choisir les associations qui sont « statistiquement significatives », au sens de la valeur p (on parle aussi de p-hacking). Ce phénomène apparaît par exemple en médecine, plus précisément en épidémiologie, où, à partir d'un grand nombre de données (poids, âge de l'éventuelle première cigarette, etc.) et d'un grand nombre de résultat possibles (cancer du sein, cancer du poumon, accident de voiture, etc.) des associations hasardeuses sont faites (a posteriori), et « validées » statistiquement. (fr)
  • Le data dredging (littéralement le dragage de données mais mieux traduit comme étant du triturage de données) est une technique statistique qui « consiste à ne publier que les compositions d’échantillon et les périodes d’observation favorables à l’hypothèse testée ». Une des formes du data dredging est de partir de données ayant un grand nombre de variables et un grand nombre de résultats, et de choisir les associations qui sont « statistiquement significatives », au sens de la valeur p (on parle aussi de p-hacking). Ce phénomène apparaît par exemple en médecine, plus précisément en épidémiologie, où, à partir d'un grand nombre de données (poids, âge de l'éventuelle première cigarette, etc.) et d'un grand nombre de résultat possibles (cancer du sein, cancer du poumon, accident de voiture, etc.) des associations hasardeuses sont faites (a posteriori), et « validées » statistiquement. (fr)
dbo:isPartOf
dbo:wikiPageExternalLink
dbo:wikiPageID
  • 9404337 (xsd:integer)
dbo:wikiPageLength
  • 4564 (xsd:nonNegativeInteger)
dbo:wikiPageRevisionID
  • 187526670 (xsd:integer)
dbo:wikiPageWikiLink
prop-fr:art
  • Data dredging (fr)
  • Data dredging (fr)
prop-fr:date
  • 2015-08-26 (xsd:date)
prop-fr:id
  • 679304462 (xsd:integer)
prop-fr:lang
  • en (fr)
  • en (fr)
prop-fr:site
  • Tout se passe comme si, Blog du C@fé des sciences (fr)
  • Tout se passe comme si, Blog du C@fé des sciences (fr)
prop-fr:url
  • http://toutsepassecommesi.cafe-sciences.org/2015/08/26/introduction-au-bricolage-de-significativite-des-tests-statistiques/|titre=Introduction au bricolage de significativité des tests statistiques (fr)
  • http://toutsepassecommesi.cafe-sciences.org/2015/08/26/introduction-au-bricolage-de-significativite-des-tests-statistiques/|titre=Introduction au bricolage de significativité des tests statistiques (fr)
prop-fr:wikiPageUsesTemplate
dct:subject
rdfs:comment
  • Le data dredging (littéralement le dragage de données mais mieux traduit comme étant du triturage de données) est une technique statistique qui « consiste à ne publier que les compositions d’échantillon et les périodes d’observation favorables à l’hypothèse testée ». Une des formes du data dredging est de partir de données ayant un grand nombre de variables et un grand nombre de résultats, et de choisir les associations qui sont « statistiquement significatives », au sens de la valeur p (on parle aussi de p-hacking). (fr)
  • Le data dredging (littéralement le dragage de données mais mieux traduit comme étant du triturage de données) est une technique statistique qui « consiste à ne publier que les compositions d’échantillon et les périodes d’observation favorables à l’hypothèse testée ». Une des formes du data dredging est de partir de données ayant un grand nombre de variables et un grand nombre de résultats, et de choisir les associations qui sont « statistiquement significatives », au sens de la valeur p (on parle aussi de p-hacking). (fr)
rdfs:label
  • Data dredging (fr)
  • Data dredging (en)
  • P-Hacking (de)
  • P-hacking (pt)
  • Просіювання даних (uk)
rdfs:seeAlso
owl:sameAs
prov:wasDerivedFrom
foaf:isPrimaryTopicOf
is dbo:wikiPageRedirects of
is dbo:wikiPageWikiLink of
is oa:hasTarget of
is foaf:primaryTopic of