پایایی (Reliability) یک اصطلاح مهم در تحقیقات کیفی بوده که شامل انواع متفاوتی است. هر یک از انواع پایایی بعد متفاوتی از ثبات ابزار اندازه گیری را نشان می دهند.در این مقاله، به بررسی مختصر پایایی تحقیق: تعاریف، انواع و نحوه اندازه گیری آنها پرداخته می شود.
یکی از بخش های مهم هر پژوهشی گردآوری اطلاعات و انتخاب ابزار مناسب آن است. برای گردآوری داده های پژوهش می توان از ابزارهای مختلفی مانند پرسشنامه، مصاحبه، یا سایر آزمون های علوم اجتماعی استفاده کرد. پایایی یکی از ویژگی های ابزار گردآوری اطلاعات است که به میزان ثبات و یکسانی در نتایج اندازه گیری های یک ابزار اطلاق می شود.
به عبارت دیگر اگر در یک بازه زمانی طی چندین مرحله بر روی گروه یکسانی با ابزار واحدی به گردآوری اطلاعات بپردازیم و نتایج حاصل در هر مرحله با نتایج مراحل قبل مشابهت داشته باشند، ابزار به کار گرفته شده پایا و قابل اعتماد است.
اهمیت اصل پایایی در انتخاب ابزار گردآوری داده
ضریب پایایی ابزار اندازه گیری نشان دهنده میزان کارایی آن ابزار در سنجش ویژگی های با ثبات و ویژگی های متغیر گروه آزمودنی است.
بر این اساس ضریب پایایی یک ابزار اندازه گیری در موقعیت های گوناگون و بر روی گروه های مختلف می تواند متفاوت باشد. به همین دلیل برای محاسبه ضریب پایایی و اعتماد یک ابزار اندازه گیری از روش های متفاوتی استفاده می شوند. از جمله می توان به شیوه های زیر در تعیین ضریب اعتماد یک ابزار اندازه گیری اشاره کرد:
روش های دستیابی به ضریب پایایی ابزار اندازه گیری پژوهش
پایایی ارزیابی ها (Interrater Reliability) یکی از انواع پایایی است که از طریق آن می توان به میزان توافق و اتفاق نظر میان تعداد دلخواهی ارزیاب در مورد اطلاعات یکسانی دست یافت.
پایایی ارزیابی ها یک روش مهم در تعیین پایایی ابزارهای اندازه گیری
به عبارت دیگر در این نوع پایایی تعداد داده های یکسانی در اختیار تعداد نامحدودی ارزیاب گذاشته می شوند و سپس با بررسی میزان توافق نظر ارزیابان در مورد مشاهده یا ارزیابی داده های واحد، به تعیین ضریب پایایی ارزیابی ها پرداخته می شود.
دستیابی به پایایی ارزیابی با کمک توافق نظر ارزیاب ها
با یک مثال ساده می توان درک بهتری از مفهوم پایایی ارزیابی ها به دست داد. فرض کنید اطلاعات پزشکی مربوط به تعداد واحدی از بیماران را در اختیار دو یا چند پزشک (ارزیاب) قرار می دهیم و از هر کدام آن ها می خواهیم ارزیابی خود را درباره علت و دلیل بیماری افراد مورد بررسی بیان کنند.
در صورتی که درباره علت و زمینه بیماری افراد مورد بررسی بین پزشکان اتفاق نظر و توافق وجود داشته باشند، نتیجه حاصل از ارزیابی ها قابلیت اطمینان و پایایی لازم را دارد. در غیر این صورت نتیجه به دست آمده از نظر پایایی ارزیابی ها پایا و قابل اعتماد نیست.
پایایی ارزیابی داده های پژوهش در نتیجه توافق و اتفاق نظر ارزیاب ها است.
استفاده از پایایی ارزیابی ها به دلیل این واقعیت است که افراد متعددی که به جمع آوری اطلاعات می پردازند ممکن است پدیده های مورد علاقه را به شکل متفاوتی تجربه کرده و تفسیر کنند. این امر باعث می شود نتایج متفاوتی از جمع آوری داده ها حاصل شوند؛ زیرا ارزیاب ها (Raters) رتبه بندی، امتیاز یا دسته بندی را به یک یا چند متغیر اختصاص می دهند.
با کمک پایایی ارزیابی ها میزان توافق بین ارزیاب ها یا جمع آوری کنندگان اطلاعات سنجیده می شود.
نقش ارزیاب ها (Raters) در تأیید پایایی داده های پژوهش
سنجش پایایی از طریق پایایی ارزیابی ها برای انواع داده ها متفاوت است. در این روش ارزیابی پایاییبرای داده های اسمی از ضریب کاپای کوهن (Cohen’s kappa coefficient)، برای داده های ترتیبی از کاپای وزنی (Weighted Kappa) و برای داده های کمی از همبستگی درون رده ای (Intraclass correlation coeficient) استفاده می شود.
ابزارهای اندازه گیری پایایی ارزیابی ها در انواع داده ها
به منظور سنجش پایایی از طریق پایایی ارزیابی ها برای داده های اسمی از شاخص کاپای کوهن (Cohen’s kappa coefficient) استفاده می کنند. کاپای کوهن یک روش اندازه گیری توافق یا پایایی است که با کمک آن می توانید میزان توافق بین دو ارزیاب بر روی یک صفت دو حالتی را به دست آورید.
به صورت کلی مقادیر بین 0.4 تا 0.6 این شاخص توافق متوسط بین ارزیاب ها را نشان می دهد. در صورتی که مقادیر کاپای کوهن بین 0.6 تا 0.8 باشد میزان توافق ارزیاب ها قابل قبول و مقادیر بالاتر از 0.8 نشان دهنده توافق عالی بین ارزیاب ها است.
استفاده از ضریب کاپای کوهن در سنجش پایایی ارزیابی داده های اسمی
در داده های ترتیبی توافق بین دو ارزیاب با استفاده از ضریب کاپای وزنی (Weighted Kappa) اندازه گیری می شوند. کاپای وزنی همانند کاپای کوهن عمل می کند اما توافق بین دو ارزیاب را که هر یک به صورت جداگانه دو کمیت اصلی ما را مورد ارزیابی قرار داده اند با اندازه عددی بین صفر و یک نشان می دهد.
به این معنی که هر چه اندازه کاپای وزنی به عدد 1 نزدیک تر باشد نشان دهنده توافق متناسب ارزیاب ها و هر چه به صفر نزدیک تر باشد بیانگر عدم توافق بین ارزیاب ها است.
کاربرد ضریب کاپای وزنی در اندازه گیری پایایی ارزیابی داده های ترتیبی
برای بررسی میزان توافق تعداد نامحدودی از ارزیاب ها در اندازه گیری متغیرهای کمی از شاخص همبستگی درون رده ای (Intraclass Correlation Coefficient) استفاد می شود.
از آنجایی که در این روش پایایی ارزیاب ها بر اساس الگوی مشابهی اقدام به امتیاز دهی می کنند با کمک ضریب همبستگی درون رده ای واریانس (Variance) درون ارزیاب ها (intra-observer) به دست می آید که نشان دهنده پراکندگی و نحوه امتیاز دهی یک ارزیاب در بین امتیازات خودش است. با استفاده از واریانس های درون ارزیاب ها و تکرار اندازه گیری ها به واریانس کل دست می یابیم.
داده های کمی و شاخص همبستگی درون رده ای
افزون بر این ها شاخص همبستگی درون رده ای برای بررسی پایایی اندازه گیری های متعدد یک مفهوم واحد در زمان های مختلف از سوی ارزیاب ها نیز کاربرد دارد.
ضریب همبستگی درون رده ای با مقادیر بین 0.5 تا 0.75 نشان دهنده پایایی متوسط و اندازه 0.75 تا 0.9 بیانگر پایایی خوب است. در صورتی که این مقدار از 0.9 بالاتر باشد پایایی عالی را نشان می دهد.
همبستگی درون رده ای مهم ترین شاخص در اندازه گیری پایایی ارزیابی ها است.
توجه داشته باشید که در تعیین پایایی از طریق پایایی ارزیابی ها در صورتی که داده های یکسانی را در اختیار دو ارزیاب گذاشته و بخواهیم نتایج حاصل از اندازه گیری دو ارزیاب را بررسی کنیم می توانیم ضریب کاپا را به کار گیریم. در غیر این صورت اگر تعداد ارزیاب ها و امتیاز دهنده ها بیش از دو نفر باشند می توانیم از شاخص همبستگی درون رده ای استفاده کنیم.
پایایی ارزیابی ها و تعداد ارزیاب ها
مواردی که در ضریب پایایی ارزیابی ها اثر گذار هستند
نوع متغیرها و روش اندازه گیری
بررسی آیتم های پژوهش
آموزش ارزیاب ها در فرآیند پایایی ارزیابی ها
انتخاب معیار های مناسب برای طبقه بندی
آموزش ارزیاب ها برای درک اهداف اندازه گیری داده ها
روش پایایی ارزیابی ها یک فرایند شناخته شده در پژوهش های کمی (Quantitative research) محسوب می شود اما کاربرد آن در پژوهش های کیفی (Qualitative research) سابقه چندان طولانی ندارد. در تحقیقات کیفی به منظور کنترل تعصب و کاهش اثرات آن بر روی نتایج پژوهش از روش پایایی ارزیابی ها استفاده می شود.
جایگاه روش پایایی ارزیابی ها در تحقیقات کمی و کیفی
با توجه به مطالبی که بیان شدند پایایی ارزیابی ها یک روش سنجش پایایی در پژوهش ها است که براساس آن ثبات اندازه گیری ها به وسیله یک ابزار بر روی مجموعه داده های واحدی توسط دو یا چند ارزیاب بررسی می شوند.
این روش پایایی به کمک 3 ابزار اندازه گیری قابل دستیابی هستند. ضریب کاپای کوهن، کاپای وزنی و همبستگی درون رده ای ابزارهای سنجش پایایی ارزیابی ها در پژوهش ها هستند که براساس نوع داده های هر پژوهش از هر یک از این ابزارهای اندازه گیری استفاده می کنند.
استفاده از روش پایایی ارزیابی ها به انجام پژوهش ها به دور از سوءگیری، تعصبات و تفاسیر شخصی افراد دخیل در رتبه بندی و امتیاز دهی داده ها کمک می کند.
این مقاله در گروه ترجمه، ویرایش، و رفع سرقت ادبی ادیت95 تهیه شده است. استفاده بدون ذکر منبع مجاز نمی باشد.