Sampling and Estimation from Finite Populations. Yves Tille

Чтение книги онлайн.

Читать онлайн книгу Sampling and Estimation from Finite Populations - Yves Tille страница 15

Sampling and Estimation from Finite Populations - Yves Tille

Скачать книгу

(2007) and for forestry in Mandallaz (2008). Several books are dedicated to unequal probability sampling and sampling algorithms. One can cite Brewer & Hanif (1983), Gabler (1990), and Tillé (2006). The model‐based approach is clearly described in Valliant et al. (2000), Chambers & Clark (2012), and Valliant et al. (2013).

      Many relevant books have been published and are still available in French. One can cite Thionet (1953), Desabie (1966), Deroo & Dussaix (1980), Gouriéroux (1981), Grosbras (1987), Dussaix & Grosbras (1992), Dussaix & Grosbras (1996), Ardilly (1994, 2006), Ardilly & Tillé (2003), and Ardilly & Lavallée (2017). In Italian, one can consult the works of Cicchitelli et al. (1992, 1997), Frosini et al. (2011), and Conti & Marella (2012). In Spanish, there exist also the books of Pérez López (2000), Tillé (2010), and Gutiérrez (2009) as well as a translation of the book of Sharon Lohr (2000). In German, one finds the books of Stenger (1985) and of Kauermann & Küchenhoff (2010). Finally, in Chinese there is a book by Ren & Ma (1996) and in Korean by Kim (2017).

      Recently, new research fields have been opened. Small area estimation from survey data has became a major research topic (Rao, 2003; Rao & Molina, 2015). Recent developments in survey methodology are described in Groves (2004b) and Groves et al. (2009). Indirect sampling involves the selection of samples from a population that is not the population of interest but has links to it (Lavallée, 2002, 2007), for example new sampling algorithms have been developed to select balanced samples (Tillé, 2006). Adaptive sampling consists of completing the initial sample based on preliminary results (Thompson, 1992; Thompson & Seber, 1996). Capture–recapture methods are used to estimate the size of animal populations. Variations of these methods sometimes allow rare population sizes to be estimated or coverage surveys to be carried out (Pollock, 2000; Seber, 2002).

      Resampling methods have been developed for finite populations (Shao & Tu, 1995; Groves, 2004b). Of course measurement errors will always remain a major research topic (Fuller, 1987; Groves, 2004a). Finally, substantial progress has been made in nonresponse methods: reweighting methods or imputation techniques (Särndal & Lundström, 2005; Bethlehem et al., 2011; De Waal et al., 2011; Kim & Shao, 2013).

      One of the challenges that is currently emerging is the integration of data from multiple sources: administrative files, registers, and samples. In a thoughtful article entitled Big data: are we making a big mistake?, Tim Harford (2014) reminds us that the abundance of data is never a guarantee of quality. Access to new sources of data should not make us fall back into the mistakes of the past, as was the case during the 1936 US presidential election (see Section 1.5, page 6).

      There have been methods for decades to integrate data from different sources. However, the multiplication of available sources makes these integration issues more and more complex. There is still a lot of research and development work needed to define the methods for integrating data from multiple sources by appropriately addressing the different measurement errors.

      1 1 Translated from French: “À mon avis, il n'existe qu'un seul moyen de parvenir à une connaissance exacte de la population et des élémens dont elle se compose : c'est celle d'un dénombrement effectif et détaillé ; c'est‐à‐dire, de la formation d'états nominatifs de tous les habitans, avec indication de leur âge et de leur profession. Ce n'est que par ce mode d'opérer, qu'on peut obtenir des documens dignes de confiance sur le nombre réel d'habitans d'un pays, et en même temps sur la statistique des âges dont la population se compose, et des branches d'industrie dans lesquelles elle trouve des moyens d'aisance et de prospérité.”

      2 2 Translated from French: “La Place avait proposé de substituer au recensement d'un grand pays, tel que la France, quelques recensements particuliers dans des départements choisis, où ce genre d'opération pouvait avoir plus de chances de succès, puis d'y déterminer avec soin le rapport de la population soit aux naissances soit aux décès. Au moyen de ces rapports des naissances et des décès de tous les autres départements, chiffres qu'on peut constater avec assez d'exactitude, il devient facile ensuite de déterminer la population de tout le royaume. Cette manière d'opérer est très expéditive, mais elle suppose un rapport invariable en passant d'un département à un autre. [] Cette méthode indirecte doit être évitée autant que possible, bien qu'elle puisse être utile dans certains cas, où l'administration aurait à procéder avec rapidité ; on peut aussi l'employer avec avantage comme moyen de contrôle.”

      3 3 Translated from French: “Ne pas se procurer la faculté de vérifier les documents que l'on réunit, c'est manquer à l'une des principales règles de la science. La statistique n'a de valeur que par son exactitude ; sans cette qualité essentielle, elle devient nulle, dangereuse même puisqu'elle conduit à l'erreur.”

      4 4 Translated from French: “C'est surtout dangereux de se déclarer pour ce système des investigations représentatives au sein d'une assemblée de statisticiens. On comprend que pour des buts législatifs ou administratifs un tel dénombrement restreint peut être utile – mais alors il ne faut pas oublier qu'il ne peut jamais remplacer l'observation statistique complète. Il est d'autant plus nécessaire d'appuyer là‐dessus, qu'il y a parmi nous dans ces jours un courant au sein des mathématiciens qui, dans de nombreuses directions, voudraient plutôt calculer qu'observer. Mais il faut rester ferme et dire : pas de calcul là où l'observation peut être faite.”

      5 5 Translated from French: “Je crois qu'il n'est pas juste de donner par un vœu du congrès à la méthode représentative (qui enfin ne peut être qu'un expédient) une importance que la statistique sérieuse ne reconnaîtra jamais. Sans doute, la statistique faite avec cette méthode ou, comme je pourrais l'appeler, la statistique, pars pro toto, nous a donné ça et là des renseignements intéressants ; mais son principe est tellement en contradiction avec les exigences que doit avoir la méthode statistique, que, comme statisticiens, nous ne devons pas accorder aux choses imparfaites le même droit de bourgeoisie, pour ainsi dire, que nous accordons à l'idéal que scientifiquement nous nous proposons d'atteindre.”

      2.1 Population

      In population images, we are interested in variables (or characters) images or images. The values taken by these variables on the observation unit images are denoted by images and images. In the design‐based approach, images and

Скачать книгу