پایایی(reliability)، قسمت دوم: نگاهی دوباره به مفهومی قدیمی

***

توجه: چند مطلب آینده در مورد مفهوم «پایایی» یا reliability است. این مطلب مورد علاقه کسانی است که در زمینه پژوهش های مرتبط به آموزش و نظرسنجی فعالیت میکنند و یا دستی در ساختن ابزارهای تشخیص و سنجش دارند. اگر به این موضوعات علاقه ای ندارید احتمالن حوصله تان سر میرود!

اگر این مقالات رو مفید یافتید و احیانن خواستید در مقاله ای جایی از محتواش استفاده بکنید لطفن لطفن به این وبلاگ رفرنس بدید. در غیر این صورت دزدی علمی محسوب میشود!

***

قسمت اول را اینجا بخوانید.

پایایی(reliability)، قسمت دوم: نگاهی دوباره به مفهومی قدیمی

نگاه همبستگی-محور به مفهوم پایایی (Reliability):

مفهوم پایایی (reliability) از عرصه پژوهش همبستگی-محور برخاسته است؛  عرصه‌ای که به جای گشتن به دنبال اثر اصلی مداخلات به سنجش روابط و همبستگی‌ها (منظور از همبستگی در این بحث مفهومی گسترده است که آنالیزهای آماری همبستگی تنها بخشی از آن است) و تفاوتهای بین فردی می‌پردازد. در این نگاه نتایج حاصل از به‌کارگیری مکرر یک تست یا ابزار سنجش بر روی یک جامعه، در تک‌تک افراد جامعه با هم تفاوت‌هایی دارند. این تفاوتها (یا واریاسیون بین فردی) از دو منبع منشاء می‌گیرند: خطای تصادفی و تفاوتهای واقعی بین فردی (true scores). فرض کنید سه مشاهده‌گر مختلف در یک امتحان OSCE مهارت شرح‌حال گیری ۵ دانشجوی پزشکی را اندازه می‌گیرند. نتایج در جدول شماره ۱ ارائه شده‌اند.

جدول ۱: نمرات مهارت شرح‌حال‌گیری که توسط ۳ مشاهده‌گر به ۵ دانشجو در یک امتحان OSCE داده شده است. (مقیاس نمره بین ۰ تا ۱۰)

مشاهده‌گر۳

مشاهده‌گر۲

مشاهده‌گر۱

دانشجو

۸

۵

۶

۱

۵

۵

۴

۲

۵

۲

۳

۳

۹

۷

۹

۴

۴

۳

۲

۵

این ۵ دانشجو از لحاظ مهارت شرح‌حال گیری تفاوتهایی با هم دارند، و نمره واقعی آنها لزوما یکسان نیست. اما نکته اینجاست که کسی به این نمره واقعی (true score) واقف نیست. همه آنچه که در دستان ماست ۳ سری نمره توسط سه مشاهده‌گر مستقل است که قرار است ما را به آن تفاوت واقعی بین فردی رهنمون شوند. می‌بینید که این سه مشاهده‌گر هم لزوما در مورد هر دانشجو با هم هم‌عقیده نیستند و نمراتشان تفاوتهایی با هم دارد. سه منشاء برای تفاوتهای بین این ۱۵ خانه جدول ۱ (که ما آن را واریانس کل یا  2 total.σ می‌نامیم) وجود دارد: تفاوتهای واقعی بین مهارت دانشجوها (که ما آن را واریانس بین فردی یا subjects.σ2 مینامیم)، تفاوتهای تصادفی (که ما آن را واریانس خطا error.σ2 می‌نامیم)، و تفاوت واقعی بین مشاهده‌گرها (که ما آن را واریانس بین‌مشاهده‌گران observers.σ2 می‌نامیم). به سخن دیگر:

فرمول شماره۱:

error.σ2+observers.σ2+subjects.σ2=total.σ2

وقتی می‌توانیم بگوییم که پایایی ابزار فوق الذکر بالاست که قسمت عمده واریانس کل ناشی از واریانس بین‌فردی باشد و سهم تفاوتهای تصادفی  و تفاوت مشاهده‌گران حداقل باشد. از این فرض می‌توان فرمول مناسب برای پایایی را نتیجه گرفت. پایایی نتایج یک ابزار، کسری است که سهم تفاوتهای واقعی بین فردی را از کل تفاوتهای مشاهده‌شده نشان می‌دهد (۳). یا:

فرمول شماره ۲

Reliability=

این فرمول کلی محاسبه پایایی است که توسط رونالد فیشر در سال ۱۹۲۵ ابداع شد، و وی آن را برای افتراق از ضریب همبستگی پیرسون (که به بررسی رابطه دو متغیر متفاوت میپ‍رداخت) ضریب همبستگی درون گروهی یا (Intraclass Correlation Coefficient (ICC نامید (۴). در محاسبه پایایی، واریانس اصلی تفاوتهای بین فردی است، یعنی همان هدفی که از ابتدا ابزار را برای دست‌یابی به آن به کار گرفته‌ایم، مثلا افتراق دانشجوی خوب از بد از لحاظ مهارت شرح‌حال‌گیری. وجود یا عدم وجود واریانس بین مشاهده‌گران در مخرج کسر به نوع نگاه ما به مشاهده‌گران این مطالعه بستگی دارد. همانطور که در جدول ۱ دیده می‌شود مشاهده‌گر سوم در مجموع نسبت به مشاهده‌گر اول دست و دلبازتر است، اما اگر بخواهیم دانشجویان را به ترتیب نمره مرتب کنیم نتیجه برای هر دو مشاهده‌گر یکسان است. این بدان معناست که اگر هدف این مطالعه رتبه‌بندی دانشجویان از لحاظ مهارت شرح‌حال‌گیری باشد و نمره خام هر دانشجو اهمیتی نداشته باشد، آنچه مهم است همخوانی (consistency) بین مشاهده گران است و نه توافق (agreement) میانشان. برای بررسی همخوانی، جهت محاسبه پایایی بین مشاهده‌گران می‌توان واریانس بین‌مشاهده‌گران (observers.σ2) را از مخرج کسر حذف نمود، و تفاوت بین نمرات را تنها به دو عامل تفاوتهای واقعی و خطای تصادفی نسبت داد. فرمول ICC برای همخوانی بین مشاهده‌گران به این صورت درمی‌آید:

فرمول شماره ۳:

Reliability=

جالب اینجاست که این فرمول همچنان پایایی بین‌مشاهده‌گران را می‌سنجد، هرچند که هیچ جزئی از واریانس مستقیما به تفاوتهای مشاهده‌گران نمی‌پردازد. نگاه مجدد به فرمول شماره ۳ نشان می‌دهد که اگرچه ما در این مثال به دنبال پایایی بین‌مشاهده‌گران یا inter-observer reliability هستیم، برخلاف آنچه که ممکن است در نگاه اول به نظر برسد تفاوت و رابطه بین مشاهده‌گران در محاسبه پایایی نقش مستقیمی ندارد.

تفاوت دو فرمول شماره ۲ و ۳ را می‌توان از نگاه دیگری نیز تفسیر کرد.  فرمول پایایی برای همخوانی (شماره ۳) زمانی به کار می‌رود که برای پژوهشگر تنها سه مشاهده‌گر حاضر و میزان پایایی میان آنها اهمیت دارد. پژوهشگر از ویژگیهای تک‌تک آنها مطلع است و مثلا میداند که شماره ۱ سخت‌گیر تر و شماره ۳ دست‌ودل‌بازتر است. اما فرمول شماره ۲ (پایایی برای توافق) زمانی استفاده می‌شود که از نظر پژوهشگر ۳ مشاهده‌گر حاضر تنها نمونه‌ای (تصادفی) از جامعه مشاهده‌گران هستند و وی قصد دارد نتایج پایایی نمرات را به جامعه‌ای بزرگتر تعمیم دهد. در این حالت قضاوت در مورد سخت‌گیری و دست و دل‌بازی این سه مشاهده گر لزوما به جامعه بزرگتر قابل تعمیم نیست، و فی نفسه اهمیتی ندارد. در نتیجه برای پژوهشگر توافق (agreement) و نه همخوانی (consistency) میان نمرات اهمیت می‌یابد.

ادامه در مطلب بعد….

پاسخی بگذارید

در پایین مشخصات خود را پر کنید یا برای ورود روی شمایل‌ها کلیک نمایید:

نشان‌وارهٔ وردپرس.کام

شما در حال بیان دیدگاه با حساب کاربری WordPress.com خود هستید. بیرون رفتن / تغییر دادن )

تصویر توییتر

شما در حال بیان دیدگاه با حساب کاربری Twitter خود هستید. بیرون رفتن / تغییر دادن )

عکس فیسبوک

شما در حال بیان دیدگاه با حساب کاربری Facebook خود هستید. بیرون رفتن / تغییر دادن )

عکس گوگل+

شما در حال بیان دیدگاه با حساب کاربری Google+ خود هستید. بیرون رفتن / تغییر دادن )

درحال اتصال به %s


%d وب‌نوشت‌نویس این را دوست دارند: