پژوهه » پایایی یا اعتماد و اطمینان سازی (Dependability or Reliability)
پایایی یا اعتماد و اطمینان سازی (Dependability or Reliability)

پایایی با این امر سروکار دارد که ابزار اندازه گیری در شرایط یکسان تا چه اندازه نتایج یکسانی بدست می دهد. بعبارت دیگر: «همبستگی میان یک مجموعه از نمرات و مجموعه دیگری از نمرات در یک آزمون معادل که بصورت مستقل بر یک گروه آزمودنی بدست آمده است» چقدر است.
پایایی یک وسیله اندازه گیری به دقت آن اشاره می کند،‌یک آزمون در صورتی دارای پایایی است که اگر آن را در یک فاصله زمانی کوتاه چندین بار به گروه واحدی از افراد بدهیم نتایج حاصل نزدیک بهم باشند بعبارت دیگر باید نتایج مشابه ای را فراهم نماید و این نشان می دهد که سایر متغیرها تغییری نکرده اند.
به بیان دیگر اگر ابزار اندازه گیری را در یک فاصله زمانی کوتاه چندین بار به یک گروه واحدی از افراد بدهیم نتایج نزدیک بهم باشد و برای اندازه گیری پایایی شاخصی به نام ضریب پایایی استفاده می کنیم. دامنه ضریب پایایی از صفر تا ۱+ است. ضریب پایایی صفر معرف عدم پایایی و ضریب پایایی یک معرف پایایی کامل است. “پایایی کامل” واقعاً به ندرت دیده می شود و در صورت مشاهده قبل از هر چیز باید به نتایج شک کرد. برای محاسبه ضریب پایایی ابزار اندازه گیری، شیوه های مختلفی بکار برده می شود.
اعتبار یک وسیله اندازه گیری به میزان دقت ان ابزار مربوط می گردد. یعنی یک وسیله اندازه گیری در صورتی دارای اعتبار است که اگر آن را در یک فاصله ی زمانی کوتاه چندین بار ارائه نماییم نتیجه چندین بار اجرای مشابه و یا نزدیک به هم باشد به همین جهت هر آزمون که محقق میخواهد انجام دهد باید قبل از اجرا ضریب اعتبار ان مشخص شده باشد.
پایایی یک ابزار اندازه‌ گیری، عبارت است از درجه ثبات، همسانی و قابلیت پیش‌بینی آن در اندازه­ گیری هر آنچه اندازه می­گیرد. این کیفیت، در هر نوع اندازه‌گیری، یک امر اساسی است. اکثر سازندگان آزمون و محققان اگر ضریب پایایی ۰٫۹یا بیشتر را به دست آورند، احساس رضایت می­کنند اما از ضریب کمتر از ۰٫۷ ناراضی می­شوند. پایایی یک آزمون تا حدی تابع طول آزمون است. هر چه طول آزمون بیشتر باشد، پایایی آن بیشتر است. پایایی تا حدی تابع ناهمگنی گروه نیز است. ضریب پایایی با افزایش گستردگی یا ناهمگنی آزمودنی‌هایی که در آزمون شرکت می­کنند، افزایش می­یابد. بر عکس، هر چه گروه نسبت به ویژه­گی­ای که اندازه­گیری می­شود، همگن­تر باشد، ضریب پایایی کمتر خواهد بود.

رابطه بین روایی و پایایی
یک آزمون باید پایا باشد تا بتواند روا باشد. اگر آزمونی در هر بار اجرا بر روی تعدادی دانش آموز نتایج مختلفی را بدست بدهد آن آزمون پایا نخواهد بود و در واقع هیچ چیز را به درستی اندازه نخواهد گرفت و اگر یک آزمون چیزی را به درستی اندازه گیری نکند هیچ اطلاع مفیدی به ما نخواهد داد. پس برای اینکه یک آزمون روا باشد نخست پایا باشد اما روایی برای پایایی ضروری نیست.
شیوه های تعیین پایایی:
برای تعیین ضریب پایایی روشهای مختلفی وجود دارد:
۱- روش پایایی مصححان Examiners Reliability
۲-روش بازآزمایی یا آزمون مجددtest-retest
۳-روش تصنیف یا دو نیمه کردن آزمون یا همسانی درونی Split-half
۴- روش فرم های های موازی یا آزمون های همتا Equivalence
۵- روش کودر-ریچاردسون Kuder-Richardson
۶-روش استفاده از مشخصه های آماری—آلفای کرونباخ

۱- روش پایایی مصححان :
برای تعیین پایانی آزمون های تشریحی یا به طور کلی آزمون های غیر عینی که نمرات آنها تحت تأثیر مصححان قرار می گیرد. باید از ۲ یا چند مصحح که مستقلا پاسخ های آزمون شنوندگان را تصحیح می کنند استفاده کرد .
۲- روش باز آزمایی یا آزمون مجدد:
ساده ترین روش تعیین پایایی است. در این روش، آزمون را در دو نوبت به گروه واحدی از آزمون شوندگان می دهند و نمرات حاصل را با هم مقایسه می کنند. ضریب همبستگی بین نمرات حاصل از دوبار اجرای آزمون ضریب پایایی آزمون است. در این روش تمام محاسبات و اندازه­گیری­ها را در مورد افراد گروه نمونه در یک زمان و اجرای مجدد آن در مورد همان گروه در زمانی دیگر انجام می­دهیم و قاعدتا نباید اختلافی بین نتایج به دست آمده وجود داشته باشد. به عبارتی در این روش پس از اجرای آزمون ، آزمودنی ها را در فاصله زمانی ۲ تا چهار هفته دوباره تحت آزمون قرار می دهند ، سپس ضریب همبستگی بین نمرات ۲ بار اجرای آزمون را محاسبه می کنند به این ضریب ، ضریب اعتبار می گویند. این روش گرچه ساده به نظر می رسد اما مورد انتقاد صاحب نظران است زیرا ممکن است تجربه اول شرکت در آزمون باعث آشنایی با سؤالات و یادگیری آنها در بار دوم آزمون شود معمولا این ضریب بین ۱- تا ۱ به دست می آید . که هرچه عددش بالاتر و مثبت باشد بهتر است .

۳- روش تصنیف یا دو نیمه کردن آزمون یا همسانی درونی
در این روش، یک آزمون واحد بعد از اجرا به دو قسمت مساوی تقسیم شده سپس با توجه به فرمول‌های آماری محاسبه می­گردد که ضریب همبستگی دو آزمون باید بالا باشد. در این روش یک آزمون واحد بعد از اجراء ( جواب ها ) ، به دو قسمت مساوی تقسیم می شود . بهترین راه دو نیمه کردن این است که سؤالات فرد در یک گروه و سؤالات زوج در گروه دیگری قرار گیرد. سپس رابطه بین آنها سنجیده شود اگر ضریب همبستگی بالا باشد یعنی دارای پایایی لازم می باشد. این روش محدودیت هایی دارد و مثلا این روش برای آزمون هایی که سرعت در آن نقش دارد مناسب نیست ، مثل آزمون کنکور.
این شیوه مستلزم فقط یک بار اجرای آزمون است در محاسبه پایایی دو نیمه کردن ، سوالات آزمون به دو نیمه تقسیم می شود که از نظر محتوی و دشواری با یکدیگر منطبق است و سپس دو نیمه ها مستقل از یکدیگر نمره گذاری می شود .اگر آزمون پایایی داشته باشد نمره های دو نیمه همبستگی مثبت بالایی خواهد داشت . فردی که در یک نیمه نمره بالایی آورده باشد در نیمه دیگر نیز نمره اش بالا خواهد بود
آزمون موردنظر را یکبار با گروه واحدی از آزمون شوندگان اجرا می کنیم و پس از اجرا، آن را به دو نیمه تقسیم می نماییم. بهترین راه دو نیمه کردن آزمون اینست که همه سوالهای فرد را یک آزمون به حساب آوریم، و همه سوالهای زوج را نیز آزمون دیگری بدانیم. ضریب همبستگی حاصل از نمرات دو نیمه آزمون ضریب پایایی هر یک از دو نیمه خواهد بود.

۴- روش فرم های معادل یا موازی یا همتا:
در این روش دو آزمون معادل یا موازی برای یک مطلب یا موضوع تهیه می کنند و آنها را در فاصله زمانی کوتاهی به یک گروه واحد از آزمون شوندگان می دهند. دو فرم یک آزمون در صورتی هم ارز یا معادل هستند که میانگین و واریانس آنها برابر باشند. در این روش، به جای اینکه تنها به یک روش توسل جوییم، از راه‌های مختلف اندازه­گیری را انجام می­دهیم و به کمک نتایج به‌دست آمده، اختلافات و اشتباهات را تصحیح می­کنیم. غالبا برای انجام این منظور از طبقه‌بندی­های مختلف استفاده می­شود.

۵- آلفا کرونباخ :
ضریب آلفای کرونباخ توسط کرونباخ در سال ۱۹۵۱ ابداع شده و یکی ازمتداولترین روشهای اندازه گیری اعتماد پذیری و یا پایائی (Reliability) پرسش نامه ها است. ضریب آلفای کرونباخ برای سنجش میزان تک بعدی بودن نگرشها ، قضاوت ها ، عقاید و سایر مقولاتی که اندازه گیری آنها آسان نیست به کار می رود. در واقع می خواهیم ببینیم تا چه حد برداشت پاسخگویان از سؤالات یکسان بوده است. اساس ضریب آلفای کرونباخ نیز پایه طیف ها یا مقیاس هاست. مقیاس عبارت است از دسته ای از اعداد که بر روی یک پیوستار به افراد، اشیاء یا رفتار در جهت به کمیت کشاندن کیفیتها اختصاص داده می شود. وانگهی مقیاسها جهت اندازه گیری گرایش و نگرشها به کار می رود.
رایج ترین مقیاسی که در تحقیقات اجتماعی به کار برده می شود لیکرت است و آن مقیاسی است که بر سطح سنجش در مقیاس ترتیبی که دارای تعدادی گویه ، معمولا بین ۵ تا ۷ گویه می باشد که به صورت منفی و مثبت سازمان یافته وتعدادآنها با هم برابر است. به هر یک از گزینه ها نمراتی، مثلاً از ۷-۱ ویا ۶-۰ یا هرشکل دیگري كه با ملاحظه مثبت و منفی بودن سئوال ترتیب نیز مراعات گردد داده می شود.
مثال: نظر شما در باره سياست خودكفايي گندم كه در سال سه دهه اخير در ايران دنبال مي شود چیست؟
کاملا موافقم … موافقم… نظری ندارم.. مخالفم.. کاملا مخالفم..
چون فرمول آلفای کرونباخ مبتنی بر واریانس است، بنابراین طبق خواص واریانس به هر ترتیبی نمره داده می شود مقدار آن تغییر پیدا نمی کند.
هرقدر شاخص آلفای کرونباخ به ۱ نزدیکترباشد، همبستگی درونی بین سؤالات بیشتر و در نتیجه پرسشها همگن ترخواهند بود. کرونباخ ضریب پایایی۴۵% را کم، ۷۵% را متوسط و قابل قبول، و ضریب ۹۵% را زیاد پیشنهاد کرده (کرونباخ۱۹۵۱) . در بسياري از منابع نيز مقادیر به دست آمده بالای ۷/۰ در اين آزمون مطلوب تلقی می‌شود‌. بدیهی است درصورت پایین بودن مقدارآلفا، بایستی بررسی شود که با حذف کدام پرسشهاي پرسشنامه مقدارآن را می توان افزایش داد.

آلفاي كرونباخ با استفاده از رابطه زير قابل محاسبه است:
در این رابطه K تعداد پرسش‌ها و Si انحراف معیار امتیاز کل پرسش‌ها است.
هرقدرهمبستگی مثبت بین سؤالات بیشتر شود، میزان آلفای کرونباخ بیشتر خواهد شد و بالعکس
هر قدر واریانس میانگین سؤالات بیشتر شود آلفای کرونباخ کاهش پیدا خواهد کرد
افزایش تعداد سؤالات تاثیرمثبت و یا منفی (بسته به نوع همبستگی بین سؤالات) بر میزان آلفای کرونباخ خواهد گذاشت
افزایش حجم نمونه باعث کاهش واریانس میانگین سؤالات در نتیجه باعث افزایش آلفای کرونباخ خواهد شد.
لازم به ذکر است در صورتیکه پرسشنامه مورد بررسی دارای سوالات ۵ گزینه ای و ۲ گزینه ای باشد، باید برای هر کدام از حالتها ضریب آلفای جداگانه ای محاسبه گردد، چرا که ممکن است برای سوالات ۵ گزینه ای آلفا مورد قبول باشد ولی برای برای ۲ گزینه ای مورد قبول واقع نگردد.
اغلب در مقالات و تحقيقات انجام شده در ايران توضيح كافي در مورد بررسي پايايي پرسشنامه ارائه نمي گردد. حتي در مواردي كه نحوه بررسي پايايي ، استفاده از آلفاي كرونباخ بيان مي گردد شرح كافي در مورد آن ارائه نمي شود. اين در حالي است كه در بعضي از همين گزارشات تحقيقي يا مقالات و يا پايان نامه ها شرح مفصلي از بعضي موارد غير لازم ارائه شده است. در بسياري از اين تحقيقات نيز اصل پرسشنامه ي تحقيق ، كه مي تواند مبنا و معياري براي ارزيابي نتايج تحقيق توسط بهره برداران باشد؛ ارائه نمي شود. همچنين اين پرسشنامه ها براي بسياري از بهره برداران و محققيني كه پس از آن قصد انجام تحقيق يا ادامه آن را دارند مي تواند به اندازه خود نتايج تحقيق اهميت داشته باشد. پنهان كاري در ارائه پرسشنامه تحقيق و عدم تشريح كافي در مورد نحوه بررسي روائي و پايائي پرسشنامه مي تواند شك بر انگيز باشد. در شرايطي كه محققين ما غالباً خود به طراحي پرسشنامه ها اقدام مي كنند و پرسشنامه هاي استاندارد شده ي از پيش آماده در اكثر موارد موجود نيست، تهيه پرسشنامه و آزمون هاي اوليه مربوط به آن اهميت تعيين كننده اي در نتايج تحقيق دارد و قسمت عمده اي از چنين تحقيقاتي را شامل مي شود و لذا لازم است همراه با معرفی روش ، نتايج و مستندات آن نیز ارائه گردد.
اگر چه ضرایب پایایی بر آوردهایی از همسانی آزمون است ، نوع همسانیها با یکدیگر متفاوت است . شیوه هایی که مشتمل بر اجرای فقط یک بار آزمون است ( دو نیمه کردن و آلفای کرونباخ) ضرایب همسانی درونی را بدست می دهد.
اگر از آزمودنها یا پرسشنامه های چاپ شده استفاده شود راهنمای آنها درباره اطلاعات لازم در مورد پایایی ، مانند پایایی و اندازه ضریب آنها خواهد بود. ولی هنگام استفاده از ابزارهایی که در محل ساخته شده است باید ضریب پایایی محاسبه شود . برای مثال فرض کنید گروهی از معلمان در مورد گزارش دانش آموزان نسبت به مدرسه تحقیق می کنند. این بر آورد از طریق پرسشنامه نگرش سنج که در محل ساخته شده است انجام می شود پایایی مورد نظر به احتمال زیاد، پایایی همسانی درونی خواهد بود. اگر پرسشنامه شامل چهار سوال باشد می توان آن را به دو نیمه بیست سوالی تقسیم کرد و نمره های دو نیمه همبستگی را بدست آورد.
۶- روش کودر- ریچاردسون:
آزمون تنها یکبار اجرا می شود، اما در این روش همه ماده های آزمون تحلیل می شوند. کودر و ریچاردسون برای بررسی همسانی درونی آزمون و تعیین پایایی آن دو فرمول مورد استفاده قرار داده اند که به KR21,KR20 شهرت دارند.

عوامل موثر در اعتبار یک آزمون:

۱:افزایش تعداد سوالات یک آزمون باعث افزایش میزان اعتبار ان میشود.
۲:حذف سوالهای ناممکن باعث افزایش اعتبار آزمون میگردد.
۳:افزودن سوالهایی که از نظر دشواری در حد متوسط باشند میزان اعتبار بالا میرود.
۴:افزایش تعداد سوالهایی که افراد را از نظر ویژگیهای مورد نظر اندازه گیری و بخوبی از همدیگر متمایز سازد.