BazEkon - The Main Library of the Cracow University of Economics

BazEkon home page

Main menu

Author
Roszka Wojciech (Uniwersytet Ekonomiczny w Poznaniu)
Title
Powiększanie zasobów informacyjnych ankietowych baz danych
Source
Roczniki Kolegium Analiz Ekonomicznych / Szkoła Główna Handlowa, 2011, nr 23, s. 138-155, tab., wykr., bibliogr. 10 poz.
Keyword
Bazy danych, Algorytmy, System informacyjny, Badania statystyczne
Databases, Algorithms, Information system, Statistical surveys
Note
streszcz., summ.
Abstract
Celem niniejszego opracowania jest próba zastosowania statystycznych metod integracji danych na podstawie źródeł ankietowych, które nie posiadają wspólnego klucza identyfikacyjnego, nie zawierają informacji o tych samych jednostkach, a zawierają zmienne wspólne. Wynikiem zastosowania tych metod jest syntetyczny zbiór zawierający zmienne ze wszystkich integrowanych źródeł, a także najczęściej posiadający liczebność najliczniejszego z nich. Metodą umożliwiającą tak zdefiniowaną integrację jest parowanie statystyczne (statistical matching). W celu przeprowadzenia empirycznej weryfikacji metody postanowiono połączyć dane ze zbioru Badania Aktywności Ekonomicznej Ludności (106 152 unikalnych rekordów, 130 zmiennych) oraz Polskiego Generalnego Sondażu Społecznego (1 277 unikalnych rekordów, 1 600 zmiennych), żeby wzbogacić PGSS o zmienne z BAEL oraz zwiększyć liczebność zbioru. Efektem zastosowania metody jest nowy zbiór zawierający zmienne z obu baz (1 730 zmiennych) o liczebności 106 152 rekordów.

The purpose of the article is an application of statistical data integration methods based on survey data which do not contain unique id, information on the same units and contain common variables. The result of the application is a synthetic dataset which contain all the variables from integrated sets and a number of units of the largest one. The method which enables such integration is statistical matching. The empirical procedure is based on Polish Labour Force Survey (106152 respondents, 130 variables) and Polish General Social Survey (1277 respondents, 1600 variables). The purpose is to enrich PGSS with LFS variables and to increase the number of units. The effect of the integration is a new synthetic data file with 1730 variables and 106125 units.(original abstract)
Accessibility
The Main Library of the Cracow University of Economics
The Library of Warsaw School of Economics
The Library of University of Economics in Katowice
The Main Library of Poznań University of Economics and Business
The Main Library of the Wroclaw University of Economics
Bibliography
Show
  1. Aktywność ekonomiczna ludności Polski. IV kwartał 2005, red. G. Marciniak, praca zbiorowa, Informacje i opracowania statystyczne, Zakład Wydawnictw Statystycznych, Główny Urząd Statystyczny, Warszawa 2006.
  2. Al P., Bakker B., Re-engineering Social Statistics by Micro-integration of Different Sources; an Introduction, w: Integrating Administrative Registers and Household Surveys, Vol. 15, Netherlands Official Statistics, Voorburg/Heerlen 2000.
  3. Bacher J., Statistisches Matching - Anwendungsmöglichkeiten, Verfahren und ihre praktische Umsetzung in SPSS, ZA-Informationen, 51. Ig., 2002.
  4. Di Zio M., What is Statistical Matching, Course on Methods for Integration of Surveys and Administrative Data, Budapest, Hungary 2007.
  5. D'Orazio M., Di Zio M., Scanu M., Statistical Matching. Theory and Practice, John Wiley & Sons Ltd., England 2006.
  6. D'Orazio M., Di Zio M., Scanu M., Statistical Matching: a Tool for Integrating Data in National Statistical Institute, Italian National Statistical Institute (ISTAT), Roma 2007.
  7. Gołata E., Opracowanie modelu/metody estymacji danych w NSP 2011 z wykorzystaniem danych z systemów informacyjnych i badań statystycznych, Raport podgrupy roboczej ds. metod statystyczno-matematycznych na rzecz spisów: PSR 2010 i NSP 2011, CSR, Poznań - Warszawa, Lipiec 2009.
  8. Polski Generalny Sondaż Społeczny 1992-2008. Dokumentacja badania, red. B. Cichomski, Instytut Studiów Społecznych, Uniwersytet Warszawski, Warszawa 2008.
  9. Raessler S., Statistical Matchjng. A Freąuentist Theory, Practical Applications, and Altemative Bayesian Approaches, Springer, New York, USA 2002.
  10. Winkler W., Overview of Record Linkage and Current Research Directions, U.S. Bureau of the Census, Washington 2005.
Cited by
Show
ISSN
1232-4671
Language
pol
Share on Facebook Share on Twitter Share on Google+ Share on Pinterest Share on LinkedIn Wyślij znajomemu