پایان نامه دانشگاه - موضوع مقاله

متن کامل پایان نامه را در سایت منبع fuka.ir می توانید ببینید

در آمارگیری‌ها عوامل مختلفی باعث بروز خطا می‌شوند از جمله: درک نادرست مصاحبه‌کننده از دستورالعمل‌های طرح آمارگیری، عدم تمایل به شرکت در تکمیل سؤالات طرح آمارگیری به‌دلیل پاسخ‌های نادرست، فهرست نادرست آدرس‌ها، نامفهوم بودن سؤالات و... از عوامل خطا محسوب می‌شوند. خطاها به دو نوع عمده تقسیم می‌شوند. خطاهایی که طی فرآیند اندازه‌گیری و یا جمع‌آوری اطلاعات بوجود می‌آیند (خطاهای غیرنمونه‌گیری) و نوع دیگر خطاهایی هستند که به‌دلیل برقراری ارتباط مستقیم تنها با بخشی از جمعیت بوجود می‌آیند (خطاهای نمونه‌گیری). خطاهای نمونه‌گیری فقط در آمارگیریهای نمونه‌ای دیده می‌شود و خطاهای غیرنمونه‌گیری در سرشماری‌ها و همچنین آمارگیری‌های نمونه‌ای مشاهده می‌شوند.
در زمینه شناخت و رفع خطاهای نمونه‌گیری کتب و مقالات فراوانی تدوین شده است و می‌توان گفت که یکی از منابع عمده خطا در بررسی‌ها که خطاهای غیرنمونه‌گیری می‌باشد تا حدودی به دست فراموشی سپرده شده است و اکثر محققان آمارگیری‌های نمونه‌ای، بر این باورند که خطای بی‌پاسخی که به‌عنوان یکی از منابع خطاهای غیرنمونه‌گیری است، مسئله‌ای اساسی و روبه رشد است. لذا در این رساله به بررسی، شناخت و رفع خطاهای غیرنمونه‌گیری در زمینه بی‌پاسخی که به‌عنوان یکی از منابع خطاهای غیرنمونه‌گیری است، میپردازیم. همچنین برای حذف اریبی ناشی از داده‌های ناقص، روش‌هایی ارایه میدهیم و راهکارهایی برای اصلاح برآوردگرهای ناشی از بی‌پاسخی به‌دست میآوریم.
1-1 مقدمه
همانطور که گفتیم، یکی از خطاهای مهم در بررسیهای آماری، خطای ناشی از بیپاسخی است. تمام محققین تلاش میکنند تا حد ممکن این خطا به حداقل مقدار تقلیل یابد. تاکنون راهکارهای گوناگونی، توسط افراد مختلف ارائه شدهاند. در این پایاننامه به بررسی آنها میپردازیم.
در این فصل اصطلاحات، تعاریف، مفاهیم و سابقه مربوط به بی‌پاسخی و علل بروز آن، فعالیت‌های آماری مرتبط با بی‌پاسخی، راههای جبران بی‌پاسخی و مقایسه نرخ‌های بی‌پاسخی را بررسی میکنیم.
برای جبران بیپاسخی و کاهش اریبی ناشی از بیپاسخی میتوان از دو رویکرد استفاده کرد، رویکرد اول مبتنی بر آمار کلاسیک است که سعی میکند بهنحوی اریبی بیپاسخی را کاهش دهد و محتاج مراجعات مکرر یا نمونهگیریهای مکرر است. رویکرد دوم روش بیزی است که در واقع تصحیح اریبی را بهوسیله شرطی کردن روی بیپاسخیها انجام میدهد.
اریکسون (1976) پیشگام مطالعه به روش بیزی در این زمینه بوده است و بررسی وی در زمینه تشریح روش بیزی در ارتباط با گرفتن زیر نمونه از واحدهای بی‌پاسخ، بوده است. علاوه بر روش‌های بالا، اخیراٌ افراد دیگری از جمله لیتل (2003) رویکرد دیگری، اختیار کرده‌اند. به این شرح که افراد نمونه‌ای به دو زیرنمونه دارای پاسخ و بی‌پاسخ تقسیم می‌شوند و سعی می‌شود که توزیع صفت مورد بررسی برای افراد با پاسخ به‌شرط مقادیر متغیر مورد بررسی برای افراد بی‌پاسخ طبق یک مدل آماری معینی به‌دست آورده شود.بدین ترتیب تصحیح لازم در مقادیر مشاهده شده به‌عمل آید به‌طوری‌که اریبی ناشی از بی‌پاسخی از بین برود.
از آنجایی‌که رویکرد ما در این رساله مبتنی بر اجرای طرح نمونهگیری و استفاده از نتایج آن و روش‌های فراوانیگرا است، از پرداختن به ارائهی مدل آماری برای تعدیل برآوردگرهای ناشی ازدادههای بیپاسخ در تعیین برآورد احتمال حضور شخص در خانه و نیز روش‌های بیزی خودداری می‌کنیم. خواننده علاقهمند میتواند به پاتهاف (1993) و لیتل (2003) مراجعه کند.
در بخش دوم این فصل تعریف بیپاسخی و چند تعریف دیگر مرتبط با آن آورده میشود. در بخش سوم اهمیت و دلایل بروز بیپاسخی بررسی میشود سپس در بخش چهارم اثرات بیپاسخی روی برآوردها و اریبی بیپاسخی روی میانگین و محاسبه میزان آن شرح داده میشود. در بخش پنجم به تاریخچه تحقیق در زمینه بیپاسخی اشاره میشود و در بخش ششم مثال کاربردی در طرح آمارگیری آمریکا، نحوه محاسبه نرخهای بیپاسخی و دلایل اختلاف در معیارهای بیپاسخی توضیح داده میشود. همچنین در بخش هفتم روشهای جبران بیپاسخی و کنترل نرخ بیپاسخی شرح داده میشود و در انتها به نتیجهگیری این فصل در بخش هشتم میپردازیم.
1-2 بیپاسخی

در زیر به تعاریف بیپاسخی، خطاهای بیپاسخی، بیپاسخی سؤال، بیپاسخی واحد آماری و نرخ بیپاسخی میپردازیم.
الف - علت‌های گوناگونی برای عدم توفیق در به‌دست آوردن پاسخ وجود دارد. برای مثال ممکن است واحد آماری در بررسی از قلم بیفتد، یا ممکن است شخص از مصاحبه امتناع ورزد، عدم دسترسی به واحد نمونهگیری و یا گم شدن پاسخنامه در طول مدت نمونه‌گیری (زمان آمارگیری) که باعث میشوند اطلاعات مورد نظر به‌دست نیاید ، باعث بروز "بیپاسخی" میشود.
ب - خطاهای بی‌پاسخی را که یکی از خطاهای غیرنمونه‌گیری است، وبروزآن ناشیازناتوانیواحدنمونه،اعضا جامعه یا داده‌ها در بررسی می‌باشد تعریف میکنیم. اگر اطلاعات جمعآوری شده از یک مکان و یا شخص و یا از یک بخش خاص در پرسشنامه کامل نباشند، بررسی ما تحت تأثیر خطاهای بی‌پاسخی قرار می‌گیرد.
دو نوع بیپاسخی ممکن است رخ دهد یکی بیپاسخی سؤال و دیگری بیپاسخی واحد آماری که در زیر آنها را تعریف میکنیم.
ج - به‌طورکلی ”بی‌پاسخی اقلام اطلاعاتی (سؤال) “ به مواردی اطلاق می‌شود که در زمان تکمیل پرسشنامه، سؤال یا سؤالاتی بی‌پاسخ بمانند.
د - بعضی مواقع که به واحدهای آماری در نمونه مراجعه می‌شود برای بعضی از واحدهای آماری به‌دلیل عدم حضور پاسخگو در منزل، امتناع پاسخگو یا دلایل دیگری، پرسشنامه تکمیل نمی‌شود که در این‌صورت اصطلاحاً میگوییم ” بی‌پاسخی واحد آماری“ رخ داده است.
هـ - از محاسبه نسبت تعداد واحدهای آماری واجد شرایط که بیپاسخاند به تعداد کل واحدهای آماری واجد شرایط، نرخ بیپاسخی به دست میآید.
بی‌پاسخی یکی از منابع بالقوه روابط و خطا در آمارگیری‌هاست که در سال‌های اخیر بسیار مورد توجه قرار گرفته است، به‌گونه‌ای که نرخ بی‌پاسخی به‌علت پژوهش‌های گسترده در بررسی علل بی‌پاسخی در معرفی راهکارهای مواجهه با آن روبه کاهش است. برای به حداقل رساندن مقدار خطای بی‌پاسخی، می‌توان از روش‌های مقابله با آن استفاده کرد،) مشکانی ومشکانی 1377 (.
1-3 اهمیت بی‌پاسخی و علل بروز آن
بی‌پاسخی امری است که هیچ محققی نمی‌تواند به‌طور کامل از آن پرهیز نماید چرا که جامعه مورد بررسی به‌طور کامل دراختیار او نیست و او تنها می‌تواند به قسمتی از آن بهعنوان نمونه‌های تعیین شده دسترسی پیدا کند. در هر آمارگیری، تماس با بعضی افراد، خانوارها، بنگاه‌ها و سایر واحدهای نمونه‌گیری، میسر نمی‌شود. افراد به‌علت اشتغال و یا گذراندن تعطیلات در منزل نیستند، آدرس‌ها و شماره تلفن‌ها اشتباه هستند و یا عدم دسترسی مصاحبه کننده به خانوارهای ساکن در مناطق دورافتاده، از جمله موارد عدم امکان برقراری تماس، محسوب می‌شوند. حتی در صورت برقراری تماس نیز ممکن است بعضی از واحدها به بعضی از سؤالات آمارگیری پاسخ ندهند،)بزرگ نیا وحسینیون1366 ،بزرگ نیا و صادقی 1368 (.
در آمارگیری در سه مرحله ممکن است موضوع بی‌پاسخی مربوط به واحد آماری یا بی‌پاسخی مربوط به اقلام اطلاعاتی اتفاق بیفتد که عبارتند از
تعیین محل واحد آماری یا تماس با واحد آمارگیری
پاسخگیری از واحد آماری
جمعآوری اطلاعات
مرحله تماس با واحد آمارگیری (تعیین محل واحد آماری) به مرحله‌ای اطلاق می‌شود که طی آن مأمور آمارگیری تلاش می‌کند با واحدهای نمونه تماس برقرار کند تا اطلاعات لازم را کسب کند. در صورتی‌که مأمور آمارگیری نتواند با واحد آماری نمونه تماس بگیرد، موضوع بی‌پاسخی مربوط به واحد آماری رخ داده است.
صحیح و کامل بودن آدرس هریک از واحدهای نمونه، عوامل موفقیت در این مرحله هستند. دسترسی به واحدهای نمونه از دیگر عوامل موثر در این زمینه است.
آمارگیری و مصاحبه با افراد ساکن در مناطق تحت کنترل از دیگر مشکلات مربوط به مرحله تماس با واحد آماری می‌باشد. باید به زمان مراجعه و تعداد دفعات مراجعه به واحد آماری برای دریافت اطلاعات مورد نظر جهت تأثیرگذاری در بروز بی‌پاسخی در مرحله تماس با واحد آماری نیز توجه کرد.
پس از تماس با واحد آماری نمونه، در بعضی موارد ممکن است واحد نمونه از دادن پاسخ امتناع کند و پرسشگر موفق به کسب اطلاعات لازم نشود. در این صورت برای این‌گونه واحدهای نمونه نیز موضوع ”بی پاسخی واحد آماری“ رخ داده است.
در آمارگیری‌هایی که از طریق مصاحبه انجام می‌شود میزان موفقیت در جلب همکاری مردم، حس کنجکاوی و داشتن بینش کافی درباره اهداف آمارگیری از دیگر عوامل مثبت برای موفقیت در کسب پاسخ، تلقی می‌شود.
در میان عواملی که موجب کاهش همکاری در ارایه اطلاعات می شود می‌توان به ترس و بیم، عدم اطمینان به محرمانه بودن پاسخ‌ها، داشتن خصومت با مجریان آمارگیری، خستگی، نظارت و آموزش ناکافی، حساسیت داشتن نسبت به هدف از آمارگیری از جمله عوامل منفی به‌حساب می‌آیند.
جمعآوری از اطلاعات نیز به مرحلهای از آمارگیری اطلاق میشود که پرسشنامه آمارگیری تکمیل و پس از ویرایش آماده تجزیه و تحلیل میشود و خطاهایی که به هنگام آمادهسازی دادهها برای تجزیه و تحلیل، بهوجود میآید باعث میشود که بعضی از اقلام اطلاعاتی پرسشنامه، بدون پاسخ بماند مثلاً مصاحبهکننده بهطور تصادفی پاسخ برخی از سؤالها را مشخص نکند.
حال در ادامه دلایل عمده و مهمی که ممکن است باعث بیپاسخی شوند را میآوریم.
- موضوع آمارگیری: در صورتی که موضوعهای مطرح شده در آمارگیری مورد علاقه پاسخگو باشند، می‌توان افزایش نرخ پاسخگویی و در نتیجه کاهش نرخ بی‌پاسخی را انتظار داشت. در حالت کلی به سؤالات دارای ویژگی‌های عمومی، بیشتر از سؤالات شخصی پاسخ داده می‌شود.
- نوع مصاحبه: نوع مصاحبه نیز از جمله مواردی است که روی میزان بی پاسخی تأثیر دارد. مصاحبه‌های حضوری با استفاده از مأموران آمارگیر آموزش‌دیده معمولاً نسبت به آمارگیری‌های پستی، تلفنی و یا اینترنتی از نرخ پاسخگویی بیشتری برخوردار هستند. زیرا در مصاحبههای حضوری آمارگیر میتواند پاسخگو را به نحوی راضی به دادن پاسخ نماید. اما در آمارگیریهای پستی، تلفنی و یا اینترنتی از آنجا که پاسخگو با کسی روبرو نیست اغلب پاسخگویی را به تأخیر انداخته، گاهی آن را فراموش میکند، یا اصلاً به آن اهمیت نمیدهد.
- فرد پاسخگو: در برخی از آمارگیری‌‌های خانوار، اگر فرد پاسخگو سرپرست خانوار تلقی شود، نرخ بی‌پاسخی قلم آماری کمتر میشود، و اگر به‌طور تصادفی یک فرد پاسخگو برگزیده شود، ممکن است نرخ بی‌پاسخی قلم آماری به‌علت اطلاعات کم فرد انتخاب شده، کاهش نیابد.
نرخ‌های بی‌پاسخی برحسب اینکه پاسخگو هر سنی داشته باشد و یا اینکه تعداد تماس‌ها چندبار باشد، متفاوت است. بنابراین برای کاهش نرخ بیپاسخی در طرح‌های نمونه‌گیری میتوان سیاستهای زیر را بهکار برد.
- سعی شود از دیدگاه‌های مختلف تا حد ممکن نرخ بی‌پاسخی کاهش یابد.
- از آنجایی که هیچگاه نرخ بی‌پاسخی علیرغم تمام تلاش‌ها به صفر نخواهد رسید، باید با به‌کارگیری روش‌های علمی مناسب با داده‌های بی‌پاسخ نسبت به جایگزینی یا جانهی آنها اقدام نمود.
1-4 اریبی ناشی از بیپاسخی
هنگامی که مشاهدات را جمعآوری کردیم، با استفاده از آنها به استنباط در مورد پارامترهای جامعه میپردازیم. همانطورکه میدانیم یکی از شاخههای استنباط آماری، برآوردیابی پارامترها است. حال اگر مشاهدات جمعآوری شده حاوی بیپاسخی باشند، این بیپاسخیها قطعاً روی برآوردهای ما تأثیر میگذارند و اریبیهایی را بهوجود میآورند. در این بخش، اریبی حاصل از بیپاسخیها روی برآورد میانگین جامعه را بررسی میکنیم و مقدار این اریبی را محاسبه خواهیم کرد.
موضوع اریبی ناشی از بی‌پاسخی از مفاهیم اساسی در بی‌پاسخی است. این اریبی، به‌دلیل عدم توانایی برای به‌دست آوردن اطلاعات بعضی از واحدهای نمونه برای برآورد پارامترها به ‌وجود می‌آید که آن را اریبی بی‌پاسخی میگویند. اریبی فوق، یک اندازه مهم برای تعیین اثر بی‌پاسخی روی خطای آمارگیری بوده و تعیین مقدار آن لازم است،(یارمحمدی1383).
برای محاسبه اریبی بی‌پاسخی فرض می‌کنیم جامعه‌ای با عضو داریم که به دو طبقه تقسیم میشود. طبقه اول را طبقه بدون پاسخ گفته و دارای عضو و میانگین است و طبقه دوم را طبقه پاسخ دهنده مینامیم و دارای عضو و میانگین است. را نسبت اعضای پاسخ‌دهنده به کل جامعه و را نسبت اعضای بدون پاسخ به کل جامعه درنظر میگیریم. یعنی و و واضح است که . بنابراین میانگین جامعه به‌صورت زیر است:

حال فرض کنید تعداد مشاهده از این جامعه بهدست آوردهایم بهطوریکه در این نمونه فرد پاسخگو و فرد بیپاسخ داریم. میانگین نمونهای افراد پاسخگو را با نشان میدهیم که برآورد اریبی از جامعه خواهد بود زیرا مبتنی بر مقادیر نمونهای افراد پاسخگوست. برای محاسبه میزان اریبی برآوردگر ، دو نتیجه زیر را میآوریم.
نتیجه 1-1. مقدار اریبی و بهترتیب عبارتند از
اریبی
اریبی
اثبات.
برای اثبات قسمت داریم
اریبی

و برای اثبات قسمت با توجه به اینکه است، داریم
اریبی

و اثبات تمام است.
تعریف 1-2. اریبی نسبی را بهصورت زیر تعریف میکنیم
اریبی نسبی
نتیجه 1-3. میانگین توان دوم خطای برابر است با

1-5 سابقهی پژوهش
بیپاسخی، عملیات آمارگیری را دچار نقص میکند و هنگام تهیه طرح و تجزیه و تحلیل دادهها، مشکلات اساسی را بهوجود میآورد و مقالاتی که هرکدام روشی را برای جلوگیری از بروزبیپاسخی، اندازهگیری یا جبران آن ارایه کردهاند، به رشته تحریر درآمده است. طی دهه 90 میلادی تأثیر خطای بی‌پاسخی و اریبی ناشی از آن در برآوردهای یک آمارگیری نمونه‌ای به‌عنوان موضوع مهمی در تحقیقات و پژوهش‌های آماری توسط آتروستیک، بیتس، برت و سیلبرستن در سال 2001 ، مورد بررسی قرار گرفته است. طی سال‌های 1997 تا 2001 میلادی یک گروه درون‌سازمانی مطالعات بی‌پاسخی در طرح‌های آمارگیری خانوار (طولی، پانلی، ...) ایالات متحده آمریکا که با هماهنگی دفتر سرشماری و دفتر آمارهای نیروی کار ایالات متحده در مورد مسائل مربوط به آمارگیری خانوار، مطالعاتی انجام داده‌اند.
هانسن و هورویتز در سال 1946، برای به‌دست آوردن برآوردهای نااریب در بررسی‌های پستی، در زمان وقوع بی‌پاسخی راه‌حلی را پیشنهاد کرده‌اند که در فصل دوم این پایان نامه توضیح داده شده است.
هم‌چنین پولیتز و سیمونز در سال‌های 1950-1949، دمینگ در سال 1953، لسلر و کالسبیک در سال 1992، لوی ولمه شو در سال 1991 نیز در مورد اصول کلی بی‌پاسخی و حل مشکلات آن مطالبی ارایه نموده‌اند.
پاتهاف و همکاران وی (1993) برای تعدیل اریبی ناشی از بیپاسخی مدلی را ارایه کردند که احتمال در خانه بودن پاسخگو را توصیف میکند. آنها این مدل را در مدل دو پارامتری (توزیع بتا)، و دو نوع مدل سه پارامتری بررسی کردند و از روی دادهها احتمال حضور در خانه را برآورد نمودند. سپس با استفاده از این احتمال به تعدیل برآوردگرهایی که از روی دادههای شامل بیپاسخی بودند، پرداختند. در واقع با وزن دادن به نتایج حاصل از مراجعات مکرر به برآوردهای بهتری دست یافتند.
کالتون (1986)، لپکووسکی(1989)، ریزو، کالتون وبریک (1996) راه‌هایی را برای درمان بی‌پاسخی در دفعات نمونه‌گیری در بررسی‌های گروهی، و همچنین وتک (2000) و هاکس (2000) مدل‌بندی ترک اعضای گروه را با مدل‌های معادله ساختاری و با مدل‌های چند سطحی بحث کرده‌اند.
روبین (1976) به تفاوتهای منظم بین واحدهایی که به سوال خاصی پاسخ دادهاند و آنهایی که پاسخ ندادهاند، دست یافت. لیتل و روبین (2002) موضوع تصادفی بودن یا تصادفی نبودندادههای گم شده را تحقیق کردند و به راهبردهایی در تحلیل بعدی دادهها دست یافتند. هم چنین لسلروکالسبیک (1992) و هویسمن (1999) با بررسیها نشان دادند که تحلیلها ممکن است روی مجموعه یا زیرمجموعههای مختلف از دادهها انجام شوند که میتوانند با یکدیگر ناسازگار باشند وهمچنینلسلروکالسبیکبهگمشدگیپرسشنامهیکواحدکههمکاریصورتگرفتهولیدرخلالویرایشدادهها،گمشدهاندتعاریفیارائهنمودهاند.لیتلوروبین(2002)وآربوکلوورمورنت(1996) راهبردهای نوینی برای مقابله با دادههای گم شده ارائه دادهاند که به ترتیب عبارت است از روش جانهی و روش برآورد مستقیم. در روش جانهی به جای مقادیر گم شده، برآوردهای معقول قرار داده میشوند تا مجموعه دادهها کامل شود و در روش برآورد مستقیم همه دادههای موجود با استفاده از یک رویکرد ماکسیمم درستنمایی تحلیل میشوند.
گرووز و کوپر (1998) روشهای لازم برای کارشناسان میدانی و نمونهگیری جهت ارائه اطلاعات مفید به آمارشناسان نمونهگیری و جانهی (تعدیل کنندگان بیپاسخی) دادهاند تا آنهاتعدیلهای خود را براساس آن اطلاعات پایهگذاری کنند به شرط اینکه این افراد احتیاطهای لازم برای بیپاسخی را درنظر گرفته و برای آن برنامهریزی کرده باشند.
دیلمن، التینگ، گرووز و لیتل (2002) مرور کلی بر بیپاسخی واحد را ارائه دادهاند.رات (1994) ابزارهایی را برای کاهش قابل توجه وقوع دادههای گم شده با آگاهی از ساختار و الگوهای دادههای گم شده، برای انتخاب شیوه درمان صحیح، تولید کرده است که این امکان را بوجود آورده است که از طریق به حساب آوردن ساختار و الگوهای دادههای گم شده به روش درست، تحلیل کند. همچنین دلو، هاکس و هویسمن (2003) اقدامات لازم برای پیشگیری از بیپاسخی را انجام داده و روشهای درمان بیپاسخی را مورد بررسی قرار دادند.
هم چنین هویسمن)1999) و زوون (1999) برای دادههای گم شده ای که برای برخی سوالها در مورد همه پاسخگویان مصداق ندارند، بررسی هایی نموده اند.جنسن (1997) از آزمون ناکامل در آزمونهای آموزشی استفاده نموده است.
هم چنین گراهام و دونالدسون (1993) بررسی کردند که اگر مکانیزم گم شدگی دست یافتنی باشد، نتایج بدست آمده نااریب خواهند بود.
بیتی و هرمن (2002) نیز در مورد تمایل پاسخگو به پاسخ که نتواند پاسخ دهد و منجر به بروز دادههای گم شده تصادفی میشود نیز راهحلهایی برای درمان ارائه دادهاند.
تورانگو (1984) ، استراک و مارتین (1987) و شوارز (1997) مراحل فرآیند پرسش و پاسخ برای تمایز بین عوامل تعیین کننده گوناگون بیپاسخی سوال بررسیها و کنترلهایی انجامدادهاند.
یک تحلیل گسترده توسط دلو (1992) نشان داد که آمارگیریهای مصاحبهای (هم چهره به چهره و هم تلفنی) معمولاً منجر به بیپاسخی سؤال کمتری از آمارگیریهای پستی میشوند.
بی‌پاسخی، عملیات آمارگیری را دچار نقص می‌کند و هنگام تهیه طرح و تجزیه و تحلیل داده‌ها، مشکلات اساسی را به‌وجود می‌آورد و مقالاتی که هرکدام روشی را برای جلوگیری از بروز بی‌پاسخی، اندازه‌گیری یا جبران آن ارایه کرده‌اند، به رشته تحریر درآمده است.
1-6 یک مثال کاربردی
در این بخش به کمک یک مثال نرخ‌های بی‌پاسخی در بین طرح‌های آمارگیری مستمر از خانوارها در ایالات متحده آمریکا، مقایسه شده‌اند که این مقایسه‌ها مربوط به سال‌های 1990 تا 1999 می باشد. بررسی معیارهای اساسی بی‌پاسخی دیدگاه‌های تازه‌ای را در مورد روند بی‌پاسخی‌های اخیر، آشکار می‌سازد. در ساختار طرح از آمارگیریهای پانلی و طولی نیز استفاده شده است که در زیر آنها را تعریف میکنیم.
تعریف 1-4. آمارگیری‌هایی که مصاحبه‌های تکراری در مورد یک واحد انجام می‌شود و در آن جابجایی افراد اهمیت ندارد بلکه مکان مورد مراجعه در مصاحبه اول حائز اهمیت است که در مراجعات بعدی، آن مکان مدنظر است را آمارگیریهای پانلی گویند.
تعریف 1-5. آمارگیری‌هایی که واحدها و افراد در آدرس‌های مختلف پیگیری می‌شوند را آمارگیریهای طولی مینامند. در این جدول ساختار طرح برحسب طولی، تعداد مصاحبه، پانلی و یادداشت روزانه، زمان آمارگیری، روش مصاحبه، روش آمارگیری و فراوانی هر مصاحبه در هریک از طرحهای مذکور، درج شده است.
بهدلیل اهمیت نرخ‌های بی‌پاسخی طرح‌های آمارگیری، سازمان‌های مجری طرح‌های آمارگیری از نرخ‌های بی‌پاسخی به‌عنوان ابزاری برای بهبود طراحی و جمع‌آوری اطلاعات طرح‌های آمارگیری استفاده می‌کنند. بنابراین مقایسه نرخ‌های بی‌پاسخی در طرح‌های مختلف، باعث آشکار شدن علل بی‌پاسخی در طرح‌ها می‌شوند. در این مثال، مجموعه‌ای از معیارهای اساسی بی‌پاسخی برای شش طرح آمارگیری خانوار در ایالات متحده، مطرح شده است. این طرح‌ها عبارتند از: طرح آمارگیری جاری جمعیت (CPS) ، طرح آمارگیری از هزینه‌های مصرفی خانوار (CE) که به دو صورت یادداشت روزانه (CED) و فصلی (QCES) انجام می‌شود، طرح آمارگیری بهداشت ملی (NHIS) ، طرح آمارگیری جرائم در سطح ملی (NCVS) و طرح آمارگیری از درآمد و مشارکت خانوار (SIPP) . به‌علت وسعت و تداوم طرح‌های فوق، دفتر سرشماری آمریکا جمع‌آوری داده‌ها را به‌عهده دارد. در این طرح‌ها، اولین مصاحبه به‌صورت مصاحبه حضوری، بعد از فرستادن یک معرفی‌نامه به محل واحد آماری، انجام می‌گیرد.
تفاوت در ویژگی‌های اساسی طرح‌های فوق، در نرخ‌های بی‌پاسخی آنها نیز تأثیر دارد. موضوع طرح، طول زمانی مصاحبه، تعداد کل مصاحبهها، مدت زمان آمارگیری، روش مصاحبه بعد از اولین مصاحبه حضوری از جمله ویژگی‌های اساسی‌اند. نحوه طراحی آمارگیری و جمع‌آوری اطلاعات طرح‌های مذکور در جدول 1-1، فهرست شده است.
از آنجایی‌که اولین مصاحبه براساس مصاحبه حضوری انجام می‌شود، اولین نرخ‌های بی‌پاسخی، تحت‌تأثیر تفاوت‌های موجود بین‌طرح‌ها در نوع روش‌های مصاحبه به‌کار گرفته شده در تماس‌های بعدی با خانوار، قرار نمی‌گیرند. دلایل بی‌پاسخی خانوارها، به چهار طبقه تقسیم شدند که از مؤلفههای بیپاسخیاند: 1) امتناع از پاسخ،2) عدم حضور شخص در خانه، 3) غیبت موقت خانوار و4) سایر موارد.
جدول 1-2، نحوه محاسبه نرخ بی‌پاسخی در مصاحبه اولیه را برای سال‌های 1999-1990 و نمودارهای 1-1 و 1-2 و 1-3 نرخ‌های بی‌پاسخی اولیه را برای سال‌های 1999-1990 نشان می‌دهد.
همچنین نرخ‌های بی‌پاسخی اولیه 6 طرح آمارگیری که در نمودار 1-1، ارایه شده‌اند. از اوایل دهه 1990 تا حدودی در حال افزایش هستند. در نمودار 1-2، نرخ‌های امتناع از پاسخ‌دهی اولیه برای سال‌های1990 الی 1999 نشان داده شده است و نرخ‌های امتناع از پاسخ اولیه، در هریک از 6 طرح مذکور در زمان مورد مطالعه (سال های 1990 تا 1999) افزایش یافته است. همچنین در جدول 1-3، نرخ‌های بی‌پاسخی اولیه در اوایل و اواخر دهه 1990 نشان داده شده‌اند.
همانطورکه انتظار می رود بالاترین نرخ‌های بی‌پاسخی در سال‌های اخیر است، در جداول فوق، طرح SIPP در سال 1999 اجرا نشده و بنابراین از اولین مصاحبه پانلی 2000 این طرح، استفاده شده است. برای طرح NCVS ، نرخ عدم حضور در خانه از سال 1992 موجود می‌باشد. برای طرح‌های CPS و NCVS ، نرخ عدم حضور در خانه از سال 1994 موجود می‌باشد.
جدول 1-3 نرخ‌های امتناع از پاسخ اولیه، در اوایل و انتهای دوره ده‌ساله و امتناع از پاسخ را به‌عنوان درصدی از کل بی‌پاسخی در مصاحبه اولیه نشان می‌دهد. تا سال 1999 امتناع از پاسخ به‌عنوان نسبتی از کل بی‌پاسخی اولیه، برای طرح NCVS و تا حدودی برای طرح‌های CED و SIPP افزایش یافته است. امتناع از پاسخ‌ها تقریباً سه‌چهارم از بی‌پاسخی نخستین را برای طرح‌های CED و SIPP و بیشتر از 50 درصد را برای طرح CED در ابتدا و در انتهای دهه مورد مطالعه شامل می‌شوند.
در مورد طرح NHIS ، به‌نظر می‌رسد که کاهش نسبتاً زیادی در نرخ امتناع از پاسخ به‌عنوان درصدی از کل بی‌پاسخی نخستین (18- درصد) وجود دارد. که در واقع نتیجه افزایش نسبتاً زیاد واحدهای مصاحبه شده به‌صورت ناقص، در سال 1999 می‌باشد.
با توجه به نمودار 1-2 و جدول 1-3، مشاهده می شود که نرخ عدم حضور در خانه به مدت زمان آمارگیری بستگی دارد، هرچه این فاصله زمانی کوتاهتر باشد، احتمال پیدا نکردن شخص در خانه، افزایش می‌یابد.با توجه به نمودار 1-3، در نیمه دوم دهه 1990. نرخ عدم حضور در خانه در 6 طرح آمارگیری افزایش یافته است.
حال به بررسی عوامل اساسی وجود اختلاف بین معیارهای بیپاسخی طرحهای آمارگیری فوق اشاره میکنیم که به صورت زیر هستند.
- عدم تماس با واحدهای آماری
واحدهای آماری که تا پایان آمارگیری، تماس با آنها امکان‌پذیر نمی‌باشد، بر نرخ‌های بی‌پاسخی تأثیر می‌گذارند. مثلاً عملیات میدانی طرح CEQ یک ماه به‌طول می‌انجامد و بی‌پاسخی مربوط به عدم تماس، سهم کمتری در افزایش نرخ بی‌پاسخی دارد.
- روش‌های آمارگیری
به‌دلیل طولانی بودن دوره‌های زمانی آمارگیری‌های پانلی، ممکن است در شرایط عملیات میدانی تغییراتی صورت گیرد. مثلاً نحوه برخورد شخصی که پاسخ میدهد و شخصی که امتناع از پاسخ دارد از یک مصاحبه تا مصاحبه بعدی، فرق کند و یا پرسشگر، در مصاحبه‌ها، تغییر کند و شرایط دیگری که می‌تواند روی نرخ‌های پاسخ، اثرگذار باشد.
موضوع SIPP
درآمد، نیروی کار، مشارکت اجتماعی NHIS
وضعیت سلامت NCVS
ارتکاب جرم CPS
اشتغال، بیکاری خصوصیات نیروی کار CEQ
درآمد و هزینه مصرف‌کننده CED
درآمد و هزینه مصرف‌کننده
ساختار طرح طولی یکبار مصاحبه پانلی پانلی پانلی یادداشت روزانه
واحد مورد مطالعه فرد خانوار ساکن در نمونه خانوار ساکن در نمونه خانوار ساکن در نمونه مصرف‌کننده(ها)ی ساکن در واحد نمونه مصرف‌کننده(ها)ی ساکن در واحد نمونه
تعداد مصاحبه‌ها 12 1 7 8 5 3
زمان آمارگیری متغیر بین 30 تا 48 ماه یک روز، تا تکمیل شدن پرسشنامه 37 ماه 16 ماه 13 ماه 2 هفته متوالی
حداکثر زمان برای تماس مجدد 4 ماه متفاوت: 2 هفته، 3 تا 12 ماه 6 ماه متفاوت: 1 هفته، 1 ماه 1 ماه بعد از مصاحبه اولیه، 3 ماه برای مصاحبه‌های بعدی 1 هفته بعد از جمع‌آوری پرسشنامه‌ها (در صورتی که یادداشت‌ها تکمیل نشده باشند)
روش مصاحبه در مصاحبه اولیه مصاحبه حضوری مصاحبه حضوری مصاحبه حضوری مصاحبه حضوری مصاحبه حضوری مصاحبه حضوری
روش مصاحبه در مصاحبه‌های بعدی مصاحبه حضوری یا تلفنی ندارد مصاحبه حضوری یا تلفنی مصاحبه حضوری یا تلفنی مصاحبه حضوری مصاحبه حضوری
روش آمارگیری مصاحبه حضوری یا تلفنی با کمک کامپیوتر مصاحبه حضوری یا تلفنی با کمک کامپیوتر مصاحبه حضوری یا تلفنی با کمک کامپیوتر و بدون کامپیوتر مصاحبه حضوری یا تلفنی با کمک کامپیوتر مصاحبه حضوری بدون استفاده از کامپیوتر مصاحبه حضوری بدون استفاده از کامپیوتر / یادداشت روزانه
زمان آمارگیری 1 ماه 2 هفته 2 هفته 10 روز 1 ماه 1 هفته
فراوانی هر مصاحبه هر 4 ماه یکبار در سال هر 6 ماه ماهانه برای 4 ماه و بعد از 8 ماه عدم مراجعه، دوباره ماهانه برای 4 ماه هر 3 ماه هفتگی
-342900266700جدول 1-1 . خصوصیات و روش‌های جمع‌آوری اطلاعات شش طرح آمارگیری مورد مطالعه
00جدول 1-1 . خصوصیات و روش‌های جمع‌آوری اطلاعات شش طرح آمارگیری مورد مطالعه

نرخ نحوه محاسبه
نرخ پاسخ مصاحبه اولیه تعداد واحدهای مصاحبه شده تقسیم بر تعداد واحدهای واجد شرایط مصاحبه
نرخ بی‌پاسخی مصاحبه اولیه تعداد واحدهای آماری واجد شرایط مصاحبه که به‌علت مشکلاتی از قبیل زبان، امتناع از پاسخ‌، عدم دسترسی به اعضای خانوار در خانه، غیبت موقت خانوار و سایر موارد پاسخگو نبوده‌اند، تقسیم بر تعداد کل واحدهای آماری واجد شرایط مصاحبه
نرخ بی‌پاسخی به‌علت امتناع از پاسخ در مصاحبه اولیه تعداد واحدهای آماری واجد شرایط مصاحبه که از شرکت در مصاحبه امتناع نموده تقسیم بر تعداد کل واحدهای آماری واجد شرایط مصاحبه
نرخ بی‌پاسخی به‌علت در خانه نبودن خانوار در مصاحبه اولیه تعداد واحدهای آماری واجد شرایط مصاحبه که به‌علت نبودن در خانه در مدت زمان آمارگیری، امکان انجام مصاحبه با آنها میسر نگشته، تقسیم بر تعداد کل واحدهای آماری واجد شرایط مصاحبه
نرخ بی‌پاسخی خانوارهای موقتاً غایب در مصاحبه اولیه تعداد واحدهای واجد شرایط مصاحبه که به‌علت دور بودن موقت خانوار از محل سکونت، با آنها مصاحبه انجام نپذیرفته تقسیم بر تعداد کل واحدهای آماری واجد شرایط مصاحبه
نرخ بی‌پاسخی سایر علل (غیر از علت‌های ذکر شده در موارد قبل) تعداد واحدهای آماری واجد شرایط مصاحبه که به‌دلایلی غیر از دلایل بالا با آنها مصاحبه انجام نپذیرفته، یا در حین انجام ادیت موضوعی، به‌عنوان واحدهای بدون پاسخ تلقی گردیده‌اند، تقسیم بر تعداد کل واحدهای آماری واجد شرایط مصاحبه
جدول 1-2. نحوه محاسبه نرخ‌های بی‌پاسخی و پاسخ در مصاحبه اولیه
SIPP
% NHIS
% NCVS
% CPS
% CEQ
% CED
%
نرخ های بی پاسخی اولیه
1990
1999 3/7
2/11 5/4
4/12 3/4
5/7 7/5
2/9 12
1/18 3/16
28
نرخ‌های امتناع از پاسخ اولیه
1990
1999 3/5
4/8 7/2
2/5 8/1
5/3 2/2
3/3 5/9
1/13 4/8
15
نرخ های عدم حضور خانوار در خانه
1990
1999 1
4/1 8/0
4/2 7/1
8/2 7/2
6/3 2/1
3/3 7/1
5/4
امتناع از پاسخ به عنوان درصدی
از بی پاسخی
1990
1999
تفاوت 73
75
2 60
42
18- 42
47
5 39
36
3- 79
72
7- 52
54
2
عدم حضور در خانه به‌عنوان درصدی
از بی پاسخی
1990
1999
تفاوت 14
13
1- 18
19
1 40
37
3- 47
39
8- 10
18
8 10
16
6
جدول 1-3 . نرخ‌های ”بی‌پاسخی اولیه“، نرخ‌های ”امتناع از پاسخ اولیه“ و نرخ‌های ”عدم حضور در خانه“ در سال‌های 1990 تا 1999

-114300-736600
00

0246380
00

42545139700
00

روش تماس با پاسخگو
بعضی از پاسخگویان به‌علت ترس از وقوع حوادث در جلوی درب منزل، یا از ورود افراد پرسشگر به منزل، معمولاً روش مصاحبه تلفنی را بر مصاحبه حضوری ترجیح می‌دهند. در حالی‌که مصاحبه تلفنی نرخ بی‌پاسخی بیشتری نسبت به مصاحبه حضوری دارد. مثلاً در NCVS در اغلب مصاحبه‌ها پس از اولین مصاحبه، از روش مصاحبه تلفنی استفاده می شود و طرح CPS ، متغیر است.
1-7 روش‌های جبران بی‌پاسخی
محدود کردن اریبی بی‌پاسخی، مستلزم کنترل نرخ بی‌پاسخی است که می‌توان روش جمع‌آوری اطلاعات را به‌گونه‌‌ای طراحی کرد که وقتی فردی به نمونه انتخاب می‌شود، احتمال اینکه فرد جزو گروه بی‌پاسخی‌ها باشد، کاهش بیابد.
به‌طورکلی در روش‌های پیشگیری جهت جبران بی‌پاسخی، هدف افزایش نرخ پاسخ در جامعه است یعنی که نرخ مورد انتظار برای پاسخ است، که N تعداد کل واحدهای جامعه است. بر این اساس تصمیم‌گیری در مورد مقدار قابل قبول برای ، حائز اهمیت است.
موضوع طرح، جامعه مورد مطالعه، نحوه جمع‌آوری اطلاعات و استفاده از روش‌های مختلف برای جبران بی‌پاسخی در میزان نرخ بی‌پاسخی دلالت دارد. از روش‌های جبران‌ بی‌پاسخی می‌توان به روش‌های زیر اشاره کرد:
- مراجعات مکرر جهت دریافت پاسخ
فراهم کردن امکان مراجعات مکرر با برنامه زمان‌بندی مناسب به واحدهای نمونه شانس دریافت پاسخ را افزایش می‌دهد، در زمانی‌که در مراجعه اول پاسخی دریافت نشده باشد.
ممکن است افرادی که در مراجعات قبلی، تمایل به همکاری نداشتند، در مراجعات بعدی، تمایل به پاسخگویی داشته باشند. از طرفی افزایش دفعات مراجعه از یکسو موجب کاهش اریبی بی‌پاسخی می‌شود و از سوی دیگر در افزایش هزینه‌ها، تأثیر دارد که باید تعداد مراجعات به‌گونه‌ای تعیین شود که افزایش هزینه‌ها، کنترل و دراختیار طرح باشد. دمینگ (1953) روش‌های مختلفی را برای تعیین تعداد بهینه دفعات مراجعه، ارایه و بررسی کرده است که در فصل چهارم ذکر شده است.
- دقیق بودن مشخصات جغرافیایی واحدهای نمونه
مشخصات جغرافیایی شامل آدرس دقیق، شماره تلفن منزل، محل کار، نام و آدرس محل کار از جمله اقلامی‌اند که می‌تواند برای کمک پرسشگر جهت تعیین و مراجعه به واحدهای نمونه، مؤثر باشند. بنابراین ابزاری چون نقشه جغرافیایی واحد نمونه بهنگام، می‌تواند کمک مؤثری باشد. بنابراین اگر مشخصات مندرج در فهرست نام و نشان واحد نمونه، دقیق نباشد، احتمال عدم دستیابی به واحدهاینمونه،افزایشمی‌یابدکهدراینصورت مدارک دراختیار پرسشگر، باید شامل اطلاعات کافی باشد.
- یادآوری‌های مجدد
در روش آمارگیری‌های پستی، ارسال کارت پستال یا تلفن زدن، تلگراف، نامه به واحد آماری موردنظرجهتترغیبوتشویقافرادپاسخگودرتکمیلپرسشنامه‌ها، در کاهش میزان بی‌پاسخی، مؤثر است.
- انگیزه
برای جلب همکاری افراد می‌توان با دادن هدیه، پاداش نقدی و تضمین ارسال یک نسخه از نتایج آمارگیری انگیزه آنان را در پاسخ‌دهی، افزایش داد. ایجاد انگیزه به طرق مختلف، باعث کاهش نرخ بی‌پاسخی می‌شود.
- تأییدنامه از افراد معتبر
در آمارگیری‌هایی که با کارگاه‌ها سر و کار دارد، داشتن تأییدنامه از طرف سازمان‌های مربوطه، در میزان افزایش پاسخ‌دهی مؤثر است چرا که باعث کاهش تردید افراد در پاسخ‌دهی می‌شود.
- ارسال نامه قبل از شروع آمارگیری
با توجه به موضوع آمارگیری، قبل از تماس اصلی با واحدهای نمونه، با ارسال نامه از سوی سازمان مجری طرح از انجام مصاحبه افراد پاسخگو را مطلع می‌کنند. این روش، اعتبار پرسشگرها را در زمان تماس اصلی افزایش می‌دهد و باعث افزایش احتمال پاسخگویی می‌شود.
- گرفتن زیرنمونه از واحدهای بی‌پاسخ
ایده اصلی گرفتن زیرنمونه از واحدهای بی‌پاسخ که توسط هانسن و هورویتز (1946) پیشنهادشدهاست،ازشیوهکلاسیکبرایاستنباط آماری استفاده می‌کند. در اکثر تئوری‌های موجود فرض می‌شود که کلیه واحدهای بدون پاسخ که به‌عنوان زیرنمونه انتخاب شده‌اند، بالاخره پاسخ خواهند داد.
انتخاب زیرنمونه از واحدهای بدون پاسخ، اغلب در آمارگیری‌های پستی به‌کار می‌رود و تلاش از طریق تماس تلفنی یا مراجعه می‌تواند منجر به اخذ درصد بالایی از اطلاعات مفید در مورد زیرنمونه انتخابی از واحدهای بدون پاسخ بشود.
1-8 خلاصه و نتیجه‌گیری
همانطورکهازمطالباینفصلبرمیآیدبیپاسخیمشکلیعمدهدرطرحهاینمونهگیریاست. انواع مشکلاتیکهازبیپاسخیناشیمیشوندازقبیلاریبیدربرآورد،افزایشواریانسبرآوردها،موردبحثقرارگرفتند.
علل بروز این مشکل در این فصل بررسی شدند و روشهایی برای جبران آنها در قالب یک مثال که با مقایسه نرخهای بیپاسخی انجام شد، بیان شدند.
بنابراین، برای مقابله با مشکل بیپاسخی باید در درجه اول راههای پیشگیری از آن دقیقتر بررسی شوند و در مرحلهی بعد در صورتیکه با بیپاسخی در دادههای نمونهگیری روبرو هستیم راههای درمان آن با تفصیل بیشتر مورد بحث قرار گیرند. این مطالب را در فصل دوم که با استفاده از روش آمارگیری پستی و مصاحبه حضوری (روش هانسن و هورویتز)، در فصل سوم با استفاده از روش پولیتز – سیمونز، در فصل چهارم با استفاده از روش دمینگ به بررسی کاهش خطای بیپاسخی میپردازیم. البته این روشها را بهدلیل متمایز بودن روش اجرای آمارگیری نمیتوان با هم مقایسه کرد و هر روش دارای معایب و محاسنی میباشد. و در نهایت فصل پنجم با استفاده از راههای پیشگیری و درمان بیپاسخی، پی میگیریم.
2-1 مقدمه
در این فصل یکی از روش های مقابله با بی پاسخی واحدها که ‌ترکیبی از دو روش پستی و حضوری است را بررسی میکنیم. مسئله مورد نظر، تعیین تعداد پرسشنامه‌های پستی فرستاده شده و تعداد مصاحبه‌های حضوری انجام شده است. البته این کار بعد از خاتمه دوره دریافت پرسشنامه‌های پستی (به منظور رسیدن به دقت لازم) با حداقل هزینه انجام می شود.
این روش در هر نوع روش جمعآوری اطلاعات می‌تواند به کار گرفته شود. به‌عنوان مثال، شاید مشکل بی پاسخی در آمارگیری پستی به‌اندازه مراجعات مکرر در مصاحبه‌ها، اهمیت داشته باشد که در حالت اخیر برای حداقل کردن هزینه به ازاء یک دقت معلوم، لازم است که نمونه بزرگتری از مصاحبه‌های اولیه را درنظر گرفته و به کسری از آنها که معمولاً در خانه نیستند، مراجعه شود. در بخش 2-2 بیپاسخی در نمونهگیری پستی را شرح میدهیم و برای توضیح بیشتر مثالی را ذکرمیکنیم و در بخش 2-3 به بحث و نتیجهگیری میپردازیم.
برای تدوین مطالب این فصل از منبع هانسن و هورویتز(1946)، استفاده شده است .
2-2 بیپاسخی در نمونهگیری پستی
روش آمارگیری پستی به‌دلیل نرخ بی‌پاسخی زیاد، معمولاً یک اریبی نامعلومی را وارد نتیجه‌گیری‌ها می‌کند. در مصاحبه‌های حضوری معمولاً پاسخ کامل دریافت می‌شود، اما هزینه هر مصاحبه در مقایسه با روش پستی بسیار بالاست.
ابتدا روش نمونه گیری تصادفی ساده و شیوه‌های برآورد میانگین یا مجموع جامعه را توضیح می‌دهیم و این روش برای نمونه گیری با طبقه بندی و سایر روش‌های برآورد نیز به کار می رود.
برای مثال، فرض کنید می خواهیم تعداد کارمندان مغازه‌های خرده فروشی را طی یک دوره مشخص در یک استان، برآورد کنیم. فرض کنید فهرستی از آدرس همه موسسات و مغازه‌هایی که دارای یک یا چند کارمند هستند دراختیار داریم. شیوه ای که گاهی اوقات اجرا می‌شود این است که نمونه ای از آدرس‌ها را از این فهرست انتخاب و پرسشنامه‌ها را برای آنها از طریق پست ارسال میکنیم. سپس پرسشنامههائی که به‌دست ما رسیده را بررسی میکنیم. حال اگر تعداد کارمندان را برای همه مغازه‌های خرده‌فروشی در استان به کمک این پرسشنامهها، برآورد کنیم، این برآورد، اریب خواهد بود.
اگر نرخ بی پاسخی خیلی زیاد باشد، اریبی خیلی جدی است. از طرفی دیگر به همه آدرس‌ها مأمور آمارگیری بفرستیم، هزینه جمعآوری داده‌ها خیلی زیاد خواهد بود. برای مثال فرض کنید هزینههای آمارگیری نمونهای به قرار زیر باشند:
هزینه ارسالی هر پرسشنامه، 10 واحد پولی (مثلاً ریال، دلار، هزار ریال).
هزینه فرآوری پرسشنامههای برگشتی، 40 واحد پولی.
هزینه مصاحبههای میدانی هر پرسشنامه، 410 واحد پولی.
ولی فرض کنیم که هزینه فرآوری هر پرسشنامه ای که با عملیات میدانی پر شده، 450 واحد پولی باشد. بنابراین اگر60 درصد پاسخ داشته باشیم به ازاء هزینه یک بار مراجعه در عملیات میدانی باید تعداد 13پرسشنامه ارسال کردکه ازبین آنها 8 پرسشنامه برمی گردد. در حالی که اگر فقط 20 درصد نرخ پاسخگویی داشته باشیم، میتوانیم 5 پرسشنامه دریافت کنیم.
بنابراین به ازای یک مقدار هزینه ثابت میتوان ‌اندازه نمونه را بین 5 تا 8 برابر بزرگتر از زمانی گرفت که از طریق مصاحبه حضوری انجام میشود. البته این به معنای آن نیست که باید همه نمونه‌ها را با روش پستی جمعآوری کنیم.
در صورتیکه طرح نمونهگیری مناسب به کار رود و دادهها با دقت ثبت شوند معمولاً با افزایش نمونه خطای برآورد کم میشود. اما در مواردی که بیپاسخی وجود داشته باشد. خطای برآورد با افزایش نمونه زیاد کاهش نمییابد.
مثال 2-1. فرض کنید پرسشنامه‌ها به یک نمونه 1000 تایی که به تصادف از یک فهرست 40000 تایی از مغازه‌ها استخراج شده‌اند، فرستاده شوند. همچنین فرض کنید 500 تا از آنها(50 % نمونه‌ها)، جواب می دهند و 500 تای دیگر، بی پاسخ‌اند. 10% مواردی که بی‌پاسخ بوده‌اند، انتخاب شده و به آنها مراجعه حضوری می‌شود. میتوان فرض کرد که این نمونه ایی معرف از جامعه پرسشنامههای پستی بیپاسخ هستند.
حال با استفاده از 550 پرسشنامه جمعآوری شده که 500 تای آنها از طریق پست و 50 تای بقیه حضوری بودهاند، میتوان یک برآورد نااریب از تعداد کل کارکنان مغازههای خردهفروشی بهدست آورد. این برآورد برابر است با
(2-1)
که در آن
40000 = : تعداد آدرس‌های موجود در فهرست .
1000 = : تعداد پرسشنامه‌های ارسال شده .
: متوسطتعداد‌کارکنان در هر مغازه برای مغازه‌هایی که به پرسشنامه پستی پاسخ داده‌اند.
500 = : تعداد مغازه‌هایی که به پرسشنامه پاسخ داده‌اند.
: متوسط تعداد کارکنان در هر مغازه که از مراجعات حضوری به دست آمده است.
500 = : تعداد پرسشنامه‌هایی که از بین پرسشنامه‌های اولیه، فرستادیم ولی به پرسشنامه پستی جواب نداده‌اند .
قضیه 2-1. واریانس نمونه ای ، در صورتی که روش نمونه گیری و شیوه برآورد مشخص شده باشند بهصورت زیر است
(2-2)
که:
: واریانس کل جامعه مغازه‌های اولیه است.
: واریانس کل مغازه‌هایی که به پرسشنامه پستی پاسخ نداده‌اند.
: تعدادی از مغازه‌های جامعه، که پرسشنامه پستی را جواب نمی‌دهند و آن تعدادی که در نمونه میافتند را با s نشان میدهیم.
: تعداد‌مغازه‌هایموجوددرنمونهکهبهپرسشنامهپستیپاسخندادهاند و از آنها مصاحبه حضوری به عمل آمده است و کسری از s است، یعنی میباشد که در آن عددی صحیح از بین اعداد است.
اثبات. چون

که در آن میانگین جامعه پاسخدهندگان و میانگین جامعه بیپاسخهاست. پس

از آنجایی که

که متوسط بیپاسخهای s است. درمطالب زیرفرض می کنیم به ازای و ثابت ، محاسبه شده است وبنابراین موقتا ثابت است ، یعنی محاسبات را به شرط ثابت بودن انجام می دهیم و نهایتا نسبت به تغییرات امید می گیریم .پس از جایگذاری رابطه فوق در معادله اصلی داریم

(1-2-2)
که در این معادله ، و ثابتاند و پس جمله وسطی برابرصفراست ، و جمله سوم برابر است با

با توجه به تعاریف و ازرابطه بالا امیدریاضی می گیریم وداریم

مجددا ازرابطه شرطی بالا به شرط امیدریاضی می گیریم تانتیجه غیرشرطی به دست آید،بنابراین حاصل امیدریاضی برابراست با
(2-2-2)
از طرفی داریم
(3-2-2)
بنابراین با جایگذاری روابط (2-2-2) و (3-2-2) در معادله (1-2-2) خواهیم داشت

و اثبات تمام است.
به کمک فرمول (2-2)، به راحتی می توان نشان داد اندازه‌های متفاوتی از نمونه‌ها وجود دارند که قابلیت اعتماد آنها با هم برابرند. همچنین می توان به نقطه ای رسید که‌ اندازه نمونه به‌تنهایی شاخص ضعیفی از قابلیت اعتماد نمونه گیری خواهد بود.
فرض کنید یعنی بخش بی پاسخ جامعه بخشی تصادفی ازکل جامعه باشد(بی پاسخی ربطی به صفت مورد اندازه گیری نداشته باشد) . اندازههای N و S به قدر کافی بزرگ اند که و را بتوان برابر یک درنظر گرفت. هم چنین فرض کنید دقتی که لازم است آن قدر باشد که متوسط خطای نمونه گیری که از 1000 نمونهحاصلمیشود با فرض نرخ پاسخ دهی 100% ، برابر باشد. در این موقعیت اگر پرسشنامه‌ها را به نمونه تصادفی به حجم مغازه ارسال کنیم و نرخ پاسخ دهی 100% باشد، واریانس برآورد مجموع جامعه برابر است با:

که مانند بالا محاسبه می شود. بنابراین داریم

با مراجعه به جدول 2-1 ستون 5 آن برای ‌اندازه‌های نمونه متفاوت، دقت لازم در برآورد نمونه ای را به دست می دهد. مثلاً اگر 1500 پرسشنامه ارسال کنیم و بعد از فرآوری این پرسشنامهها تعداد 1125 پرسشنامه تکمیل شده بهدست آوریم، آنگاه خطاینمونهگیریحاصلازاین تعداد نمونه برابر حالتی است که اگر 10000 پرسشنامه را ارسال کنیم و 5263 پرسشنامه تکمیل شده بهدست آوریم (5000 پستی و 263 حضوری). بنابراین نتیجه میگیریم، بهتر است بودجه اختصاص یافته به طرح نمونهگیری را از طریق مصاحبه حضوری صرف بهدست آوردن پرسشنامههای تکمیل نشده پستی کنیم.
ستون 6 جدول 2-1، هزینه کل برای هریک از‌اندازه‌های نمونه را تحت هزینه‌های واحد پولی (ریال، دلار، هزار ریال، ...) نشان می دهد. این جدول طوری تنظیم شده است که برحسب تعداد متغیرهای واحدهای نمونهای، همه دقیقاً به یک مقدار از دقت در برآورد نمونهای (خطای استاندارد) منتهی می شوند. بنابراین ‌اندازه نمونه را طوری اختیار میکنیم که به حداقل هزینه منجر شود. همانطور که در جدول میبینیم، حداقل هزینه وقتی حاصل خواهد شد که 2000 پرسشنامه ارسال کرده و 1000 پرسشنامه تکمیل و برگشت داده شود (فرض کردهایم نرخ بی‌پاسخی 50% است) و همچنین333 پرسشنامهازبیپاسخی‌هاراباعملیات میدانی و مصاحبه حضوری تکمیل و جمعآوری کنیم.
از این مثال میتوان مقدار هزینه برای تعداد نمونه نهایی ستون 5 جدول 2-1 را با استفاده از تابع هزینه بهدستآورد. این هزینهها را در ستون 6 جدول 2-1 آوردهایم. حال برای مقدار معلوم نرخ بیپاسخی، در بین انواع مختلف ترکیبهای ، و ترکیبی را اختیار میکنیم که هزینه حداقل شود.

هزینه برحسب دلار تعدادنمونهنهایی
s m
(6) (5) (4) (3) (2) (1)
2550 1000 500 500 500 1000
2138 1125 375 750 750 1500
2099 1333 333 1000 1000 2000
2159 1563 313 1250 1250 2500
2250 1800 300 1500 1500 3000
2487 2286 286 2000 2000 4000
2751 2778 278 2500 2500 5000
4184 5263 263 5000 5000 10000
جدول 2-1. نمونههای با اندازههای متفاوت که منجر به یک مقدار از دقت میشوند. این نمونهها مربوط به ترکیب آمارگیری پستی و مصاحبه حضوری با فرض 50% نرخ بیپاسخیاند.
که در آن
هزینه ارسال هر پرسشنامه برحسب دلار : 10/0 =
هزینه فرآوری هر پرسشنامه برگشتی : 40/0 =
هزینه گردآوری و فرآوری اطلاعات پرسشنامههایی که از طریقه مصاحبه تکمیل شدهاند : 50/4 =
تعداد پرسشنامههایی که ارسال شدهاند :
تعداد پرسشنامههایی که پاسخ دادهاند :
تعداد بیپاسخها در نمونه :
تعداد مصاحبههای حضوری از بین بیپاسخها :
حال در ادامه، تعداد بهینه پرسشنامههای پستی و تعداد مراجعات حضوری را در یک قضیه میآوریم.
قضیه 2-2. با توجه به تعاریف جدول 2-1 و تابع هزینه مفروض، تعداد بهینه پرسشنامههای پستی و حضوری، و ، عبارتند از

و
(2-3)
که در آن
(2-4)
و
(2-5)
که در آن نرخ بیپاسخی و نرخ پاسخدهی به پرسشنامههای پستی هستند.
اثبات.
در این قضیه میخواهیم هزینه را با توجه به واریانس ثابت، حداقل کنیم. برای این منظور با توجه به تابع هزینهای که قبلاً تعریف کردیم و بهصورت

است که در آن میباشد، و با استفاده از روش لاگرانژ مقادیر بهینه و را بدستمیآوریم. برای این منظور داریم

که در آن را قبلاً تعریف کردهایم و است. حال معادلات مشتقات جزئی مربوط به پارامترهای و را به صورت زیر بدست میآوریم

از معادله داریم

حال ی به دست آمده را در معادله قرار میدهیم و خواهیم داشت

حال با محاسبات لازم داریم

ویا

ویا

بنابراین

که در این صورت مقدار بهینه بهصورت زیر خواهد بود

حال برای بهدست آوردن مقدار بهینه از معادله استفاده میکنیم و با انجام محاسبات لازم داریم

ویا

بنابراین

حال با ساده کردن و از طرفین تساوی فوق داریم

ویا

بنابراین

از آنجایی که است با حل معادله فوق برحسب و در نتیجه مقدار بهینه به صورت زیر خواهد بود

که اثبات را کامل می کند.
حالت خاص. در قصیه فوق اگر و باشند، آنگاه مقادیر بهینه و برابرند با
(2-6)
و
(2-7)
نکته. البته تعداد پرسشنامه‌های پستی و مصاحبه‌های حضوری که لازم است تا به یک دقت از پیش تعیین شده ای برسیم، با نرخ پاسخ دهی تغییر خواهد کرد. در عمل ممکن است حتی به طور تقریبی ندانیم نرخ پاسخ دهی چقدر است. در حالی که برای برآورد مقادیر بهینه از روی روابط بالا، نرخ پاسخ‌دهی تقریبی باید قبل از شروع آمارگیری معلوم باشد. وقتی نرخ پاسخ‌دهی قبل از شروع آمارگیری، معلوم باشد باز هم ممکن است بخواهیم طرح آمارگیری را طوری طراحی کنیم که حداقل به دقت از پیش تعیین شده یعنی به حداقل هزینه ممکن برسیم. و علاوه بر این میخواهیم هزینه آمارگیری را نیز محاسبه کنیم.
حتی در چنین شرایطی نیز میتوان تعداد بهینه پرسشنامه‌های پستی و تعداد بهینه مصاحبه‌های حضوری که از بین بی پاسخی‌ها صورت می گیرد، را تعیین کرد.
جدول 2-1 با فرض نرخ پاسخدهی 50% حساب شده است. (نرخ پاسخدهی قبل از ارسال پرسشنامه فرض میشود) گیریم مقادیر بهینه و را برای نرخ‌های پاسخ دهی متغیر از 10 % تا 90 % حساب کنیم در حالی که هنوز هم می خواهیم واریانس به همان میزان قبل باشد.
مقادیر بهینه و از روی روابط (2-6) و (2-7) و هزینه‌های مربوط به آنها را در جدول2-2 آوردهایم. ستون 1 معرف نرخهای پاسخدهی و ستون 4 معرف هزینه‌های یک آمارگیری عملیات توأم بهینه ارسال پستی و مصاحبه حضوری هستند.
اگر نرخ پاسخدهی نامعلوم باشد، دو روش برای تعیین تعداد بهینه پرسشنامههای پستی و مصاحبه حضوری وجود دارد. در ادامه به بررسی این دو روش میپردازیم.
روش اول. در این روش از صرفهجویی ارسال پرسشنامه پستی استفاده میکنیم که درستون 5 جدول 2-2 به عنوان هزینه روش 1 درج شده است . به این صورت که 1000 پرسشنامه ارسال میکنیم و از تمام بیپاسخیها، بدون درنظر گرفتن نرخ بیپاسخی، مصاحبه حضوری بهعمل میآوریم. (تعداد 1000 پرسشنامه، بهعنوان مثال انتخاب شده برای هر تعداد دیگر نمونه، روش محاسبه به همین ترتیب است)
حال فرض کنیم P برابر 10 % است. در این صورت خطای نمونه گیری عبارت است از :

به ازای هر نرخ پاسخ دهی مفروض، هزینه این روش همواره بیشتر از هزینه روش بهینه است. نتیجه میگیریم زمانیکه بیپاسخی وجود دارد برای رسیدن به این دقت حتماً باید تعداد نمونه بیشتری از 1000 بگیریم. زیرا به واسطه بیپاسخی باید تعداد دیگری را اضافه کرد تا کمبود دقت ناشی از بیپاسخی را جبران کند.
هزینه روش 1 برحسب دلار هزینه بهینه برحسب دلار r P
5 4 3 2 1
4.190 4.110 860 1.714 -6413563500010/0
3.780 3.558 711 1.989 20/0
3.370 3.035 575 2.034 30/0
2.960 2.544 451 1.979 40/0
2.550 2.096 341 1.870 50/0
2.140 1.690 245 1.727 60/0
1.730 1.328 163 1.564 70/0
1.320 1.010 95 1.386 80/0
910 731 40 1.197 90/0
جدول 2-2. نمونههایی که منجر به دقت یکسان از طریق ترکیب نمونهگیری پستی و مصاحبه حضوری از بیپاسخها میشوند به ازای نرخهای بیپاسخی متفاوت.
جدول 2-2 نشان میدهد به ازای مقادیر مختلف نرخهای پاسخدهی، این روش چقدر پرهزینه‌تر از روش بهینه است. ستونهای 4 و 5 نشان می دهند افزایش هزینه نسبت به روش بهینه برای نرخ‌های پاسخ‌دهی خیلی پایین ، کمترین مقدار است. زیرا تعداد پرسشنامه پستی کافی به دست نیامده است تا از مزایای اقتصادی پرسشنامه‌های پستی، بهره بگیریم. برای نرخ‌های پاسخ دهی 30% یا بیشتر اگر از روش 1 استفاده شود، افزایش هزینه ای معادل 10% تا 24 % خواهیم داشت.
روش محاسبه هزینهها براساس روش محاسبه هزینه در جدول 2-1 ولی به ازای نرخهای پاسخدهی متفاوت، میباشد.
روش دوم. در این روش از صرفهجوییهای ارسال پرسشنامههای پستی بیشتر بهره میگیریم. برای تعیین تعداد بهینه پرسشنامههای پستی و مصاحبههای حضوری،طی دو مرحله این کار را انجام میدهیم.
مرحله اول. بدون درنظر گرفتن نرخ پاسخدهی، ماکزیمم تعداد پرسشنامههای ارسالی را تعیین میکنیم. (فرض میکنیم پاسخدهی کامل است و به روش تعیین حجم نمونه در آمارگیریهای نمونهای، مقدار نمونه را تعیین میکنیم)
مرحله دوم.تعیین تعدادی است که باید مصاحبه حضوری شوند تا به دقت مطلوب برسیم. پس از آنکه تعداد ماکزیمم پرسشنامه‌ها را ارسال کردیم، نرخ پاسخ دهی از روی نمونه‌های برگشتی تعیین میشوند. بنابراین تعدادی که باید مصاحبه شوند با نرخ پاسخ دهی که عملاً به دست آمده، متغیر خواهد بود.
با مراجعه به ستون 2 در جدول 2-2، ملاحظه می کنیم برای مسئله مورد بررسی ماکزیمم تعداد پرسشنامه‌هایی که (صرف نظر از نرخ پاسخ دهی) باید ارسال شود برابر 2034 پرسشنامه است. اگر 40% پاسخ داده باشند با استفاده از فرمول (2-3) می بینیم تعدادی که باید مصاحبه حضوری از آنها به عمل آید 448 خواهد بود.
جدول 2-3 به ازای مقادیر متغیر نرخ‌های پاسخ به پرسشنامه‌های پستی، تعداد مصاحبه‌های حضوری که باید انجام شوند تا به دقت مطلوب برسیم در صورتی که 2034 پرسشنامه پست شده باشند و هزینه کل برای هر کدام از این نرخ‌های پاسخ‌دهی را نشان می دهد.
هزینه بهینه برحسب دلار هزینه روش 1 برحسب دلار هزینه روش 2 برحسب دلار r p
6 5 4 3 2 1
4.110 4.190 4.119 852 203 10/0
3.558 3.780 3.561 710 407 20/0
3.035 3.370 3.035 575 610 30/0

پاسخ دهید

نشانی ایمیل شما منتشر نخواهد شد. بخش‌های موردنیاز علامت‌گذاری شده‌اند *