پایان نامه نهایی_۳- قسمت ۱۳
Landscape of particles and lines.

پایان نامه نهایی_۳- قسمت ۱۳

برای اینکه نتایج به دست آمده ارزشمند بوده و بتوان از این نتایج در تصمیم گیری ها استفاده کرد، باید ابزاری که برای جمع آوری داده ها استفاده می شود دارای پایایی واعتبار کافی باشد بنابراین در هر تحقیقی باید این موضوعات مورد بررسی قرار گیرند.
پایایی
پایایی[۷۱]یک وسیله اندازه گیری عمدتاً به دقت نتایج حاصل از آن اشاره دارد. کاپلان و ساکوزا (۲۰۰۱) می گویند “پایایی، دقت، اعتمادپذیری، ثبات، یا تکرار پذیری نتایج آزمون اشاره می کند” (سیف، ۱۳۸۲).
همسانی[۷۲]و ثبات اندازه ها را پایایی گویند هر گاه آزمونی فاقد پایایی باشد، در اندازه گیری ثبات ندارد و فاقد دقت و معناست و قادر به پیش بینی عملکرد آزمودنی ها نیست (ون، ۲۰۰۰، به نقل از شکوهی یکتا، ۱۳۸۵). در مبحث پایایی موضوع مورد نظر درجه دقت اندازه گیری است، می خواهیم بدانیم که اگر فردی را دو بار با روش مورد نظر بسنجیم، نتایجی که به دست می آید با چه دقتی تکرار می شود. به زبان ساده تر مقصود از پایایی یک وسیله اندازه گیری آن است که اگر خصیصه مورد نظر را به همان وسیله یا وسیله مشابه و قابل مقایسه با آن در شرایط مشابه دو بار اندازه بگیریم، نتایج حاصل تا چه حد مشابه، دقیق[۷۳] ، پیش بین پذیر[۷۴] و بازیافتنی[۷۵] است (هومن، ۱۳۸۵) .
پایایی آزمون با مفهوم خطای اندازه گیری رابطه دارد. نمره های حاصل از اجرای یک آزمون، مجموعه نمره های واقعی و خطا هستند. هر چه نمونه انتخاب شده به حیطه مورد نظر در اندازه گیری نزدیک تر باشد خطای اندازه گیری کمتر و پایایی بیشتر می شود.
در برآورد پایایی محقق با خطاهای اندازه گیری و متغیرها مزاحم سرو کار دارد و می خواهد گرچه دخالت و مقاومت آنها را در جریان سنجش تعیین کند، و این موارد اساس محاسبه ضریب پایایی آزمون ها را تشکیل می دهند. این خطاها دارای منابع متعددی هستند از جمله؛ گذشت زمان، تغییرات فرد، تغییرات نمونه سوالات و همسانی درونی پایین سوالات آزمون.
روش های برآورد پایایی
برای برآورد اعتبار روشهای مختلفی وجود دارد، مهم ترین این روشها عبارتند از:
۱) بازآزمایی
در این روش، آزمون را به طور پیاپی یا با فاصله زمانی روی گروه واحدی اجرا کرده و ضریب همبستگی بین نمره های حاصل از دو بار اجرای آزمون محاسبه می شود. ضریب همبستگی به دست آمده برآوردی از پایایی تست است. که این ضریب نشانگر دقت[۷۶] اندازه گیری است و در اجرای با فاصله زمانی نشانگر ثبات[۷۷] و قابلیت پیش بینی آزمون نیز می باشد. با این روش اثرات حافظه و تمرین و توجه و دقت، فراموش کاری و خستگی آزمودنی ها می تواند تأثیر گذار باشد. در اجرای با فاصله اثرات گذشت زمان و تغییرات فرد دخالت می کند.
۲) اجرای آزمون های همتا یا معادل[۷۸]
برای برآورد پایایی آزمون های همتا، دو فرم آزمون را یکی پس از دیگری و بدون فاصله زمانی یا با فاصله زمانی اجرا کرده، همبستگی نمره های حاصل از دو آزمون محاسبه می شود. مطلوب ترین روش برآورد پایایی آزمون، اجرای فرم های همتای آزمون با فاصله چند روز یا چند هفته است. زیرا به همه منابع خطا فرصت دخالت می دهد.
۳) روش دو نیمه کردن آزمون
در این روش، ابتدا آزمون روی گروه نمونه واحدی از آزمودنی ها اجرای می شود. سپس آزمون به دو نیمه مساوی تقسیم شده، هر نیمه آن جداگانه نمره گذاری می شود. ضریب همبستگی دو نیمه آزمون شاخصی از پایایی هر یک از دو نیمه آن است. که برای برآورد پایایی کل تست از فرمول اسپیرمن براون استفاده می شود.

ضریب پایایی برآورد شده برای کل تست، و  همبستگی واقعی بین دو نیمه آزمون است. ولی ضریب پایایی که بدین طریق به دست می آید دارای محدودیت هایی است که از جمله اینکه تغییراتی که در طول زمان در فرد به وجود می آید را منعکس نمی کند. زیرا هر دو نمره حاصل از اجرای یک تست واحد است، همچنین درباره تست های سرعت معنای خود را دست می دهد. ضریبی که از این روش به دست می آید هماهنگی درونی [۷۹] است (هومن، ۱۳۸۵).
در بعضی موارد به ویژه هنگامی که واریانس نمره های دو نیمه آزمون یکسان نباشد نمی توان از فرمول اسپیرمن براون استفاده کرد؛ در این مورد می توان از ضریب، آلفای کرانباخ استفاده کرد (شریفی، ۱۳۸۳).
ضریب آلفای کرونباخ[۸۰] به صورت استاندارد خود تنها درباره تست هایی به کار می رود که مجموعه پرسش های تشکیل دهنده آن همگون و متجانس بوده و همه آنها برای سنجش یک نوع خصیصه مکنون مشترک طرح شده باشد (هومن، ۱۳۷۵). این روش بستگی به کارکرد آزمودنی از یک سوال به سوال دیگر دارد و محاسبه آن مبتنی بر انحراف استاندارد سوالات است. فرمول مربوطه که در کلی ترین شکل خود ضریب آلفای کرونباخ نام دارد، بدین صورت است:

در اینجا  برآورد پایایی تست، n تعداد سوالات،  انحراف استاندارد تست و  انحراف استاندارد سوال i است. ضریب به دست آمده در واقع شاخص هماهنگی درونی تست یعنی میزان تداخل همه سوال ها از لحاظ سنجش یک ویژگی مشترک است.
عوامل موثر در پایایی تست

 

برای دانلود متن کامل پایان نامه به سایت tinoz.ir مراجعه کنید.

 

 

    1. دامنه گروه (یکنواختی گروه): ضریب پایایی حاصل از اجرای تست روی گروه های ناهمگون بیشتر از گروه های همگون است.

 

    1. سطح توانایی در گروه: دقت اندازه گیری هر تست ممکن است با سطح توانایی آزمودنی ها بستگی داشته باشد. چنانچه سوالات برای افراد دشوار باشند در نتیجه بسیاری از پاسخ ها را حدس می زنند و در این صورت تغییر پذیری پاسخ ها کاهش می یابد و ضریب پایایی پایین می آید، هم چنین اگر تست برای گروهی خیلی آسان باشد، چنین تستی نمی تواند نیز برای تشخیص افراد از یکدیگر موثر باشد.

 

    1. طول تست: معمولاً با افزایش تعداد سوالات، پایایی تست بالا می رود.

 

    1. عملیات برآورد پایایی: مفهوم پایایی دارای وجه ها و جنبه های گوناگون است و مقدار ضریب پایایی بستگی به این دارد که کدام وجه پایایی مورد مطالعه قرار گیرد و از کدام روش برآورد استفاده شود (هومن ، ۱۳۸۵).

 

  1. زمان و سرعت اجرای تست: در تست هایی که محدودیت زمانی دارند، به دلیل بدون پاسخ ماندن تعدادی از سوال های تست، پایایی به صورت تصنعی بالا می رود.

 

اعتبار [۸۱]
با آنکه پایایی تست شرط لازم برای اعتبار آن است اما به تنهایی تضمین کننده آن نیست. بنابراین، ماهیت تست تنها از طریق مطالعه و بررسی اعتبار آن مشخص می شود. مهم ترین سوالی که باید درباره هر نوع روش سنجش پرسیده شود این است که آن روش تا چه حد اعتبار دارد؟ این که آیا روش مورد نظر می تواند در عمل، به درستی همان چیزی را که مدعی است مورد سنجش قرار دهد؟ اگر چنین است میزان موفقیت آن در این کار تا چه حد است؟ آیا احتمال ندارد که به همراه خصیصه مورد نظر عوامل مخل وارد حوزه سنجش شده باشد؟ در این صورت آن عوامل کدامند و درجه ترکیب آنها به چه میزان است؟
در واقع اعتباریعنی میزان توانایی ابزار مورد نظر در اندازه گیری آنچه که برای آن ساخته شده است. وقتی مجموعه سوالی برای اندازه گیری نمونه ای از رفتار فرد به کار می رود، معنا و مفهوم آن مجموعه فقط با نامگذاری آن مشخص نمی شود بلکه ماهیت آن تنها از راه مطالعه و بررسی اعتبار آن معلوم می گردد. چنانچه معلوم شود وسیله اندازه گیری مورد مطالعه چه چیزی را انداه می گیرد و بین نمره حاصل از اجرای این ابزار و آنچه به واقع اندازه می گیرد، هماهنگی و توافق وجود داشته باشد در این صورت نتایج حاصل از اجرای آن اطلاعاتی به دست می دهد که در تصمیم گیری مفید واقع می شود. بدین ترتیب مهم ترین ویژگی که در ارزشیابی یک ابزار سنجش باید به آن توجه شود، اعتبار آن است و مقصود از آن، مناسب بودن[۸۲]، با معنا بودن[۸۳] و مفید بودن [۸۴] استنباط های خاصی است که از روی نمره های حاصل از آن به عمل می آید (هومن، ۱۳۸۱).
به طور کلی در روش های تعیین اعتبار با این مساله سرو کار داریم که بین کارکرد در تست و واقعیت های قابل مشاهده و مستقل درباره ویژگی های رفتار مورد نظر چه روابطی وجود دارد. روش های اختصاصی که برای بررسی اینگونه رابطه ها به کار می رود، متعددند و به سه طبقه اصلی تقسیم می شوند: ۱) اعتبار محتوایی[۸۵] ۲) اعتبار ملاکی یا وابسته به ملاک [۸۶]، ۳) اعتبار سازه[۸۷] . البته مفهوم کاربرد ضمنی این برچسب ها آن نیست که برای اعتبار انواع متمایزی وجود دارد. اعتبار یک مفهوم بسیط و یگانه است، و ممکن نیست بین این مقوله ها تفاوت های روشن و مشخصی قائل شد. مثلاً شواهدی که معمولاً با مقوله های وابسته به ملاک یا محتوا همراه است، برای مقوله وابسته به سازه نیزه شواهدی مربوط و مناسب محسوب می شود (هومن، ۱۳۸۵).
ارزیابی هوش
هوش، یکی از مباحث بحث برانگیز در روان شناسی است. اغلب مطالعات مربوط به هوش را می توان در چهار حیطه قرار داد: ۱) نظریه هایی که در مورد ماهیت هوش مطرح شده اند؛ ۲) روش های اندازه گیری هوش ؛ ۳) تفاوت های گروهی هوش بر اساس متغیرهای مانند سن، جنسیت ، نژاد، سطح اجتماعی – اقتصادی و ۴) تاثیر عوامل ارثی و محیطی در رشد هوش.
هوش چیست؟
در گذشته، آزمون های هوش با عناوینی مانند توانایی ذهنی و استعداد نیز به کار می رفتند که برخی از آنها با همان نام هنوز هم کاربرد دارند. در سال های اخیر اصطلاحات جایگزین دیگری برای آزمون های هوش رواج یافته است. به دلیل آنکه روانشناسان در تعریف و اندازه گیری هوش با مشکل مواجه اند، بنابراین سازندگان آزمون های تلاش کرده اند تا در طول زمان از اصطلاحات مناسب تر و واضح تری برای آزمون های هوش استفاده کنند. بر همین اساس، نام بعضی از آزمون ها تغییر پیدا کرده است. برای مثال آزمون توانایی ذهنی اُتیس- لنون[۸۸] به آزمون توانایی مدرسه اُتیس- لنون[۸۹] تغییر نام یافت . عبارت توانایی مدرسه عینی تر و مشاهده پذیرتر از توانایی ذهنی و اندازه گیری آن نیز آسان تر است.
نکته دیگری که مطرح بود، شایع شدن این باور بود که هوش و استعداد ذاتی و ارثی است، به همین دلیل طراحان آزمون ها و متخصصان بر آن شدند تا با تأکید بر توانایی های رشد یافته و نه استعدادهای ذاتی، این باور غلط را از بین ببرند. برای مثال آزمون استعداد تحصیلی به آزمون ارزیابی تحصیلی (SAT) تغییر نام یافت. از این رو به خوانندگان توصیه می شود اصطلاحات “هوش” ، ” توانایی ذهنی” و “استعداد” را با در نظر گرفتن ملاحظات یاد شده به کار ببرند.
نظریه های هوش
ارزیابی هوش بیش از دیگر زمینه های ارزیابی های مطرح شده در زمینه هوش تأثیر پذیرفته است، بنابراین قبل از توصیف آزمون های هوش باید مهم ترین نظریه های هوش بررسی شود.
نظریه های کلاسیک
نظریه های کلاسیک اغلب بر ماهیت هوش تأکید دارند. نظریه اسپیرمن ، نظریه توانایی های ذهنی اولیه ترستون[۹۰] و نظریه سه بعدی گیلفورد[۹۱]، از نظریه های کلاسیک محسوب می شوند.
نظریه اسپیرمن
چارلز اسپیرمن (۱۹۲۷) اولین نظریه رسمی را در مورد توانایی ذهنی انسان ارائه داد. او نظریه خود را بر اساس روابط میان آزمون هایی که برای ارزیابی کارکردهای حسی طراحی شده بودند، مطرح کرد. او متوجه شد همبستگی میان آن آزمون ها به اندازه ای زیاد است که می توان نتیجه گرفت عملکرد افراد در این آزمون ها به توانایی عمومی[۹۲] بستگی دارد. اسپیرمن این توانایی عمومی را “g” نامید که حرف اول کلمه “general” است. البته همبستگی میان آزمون های یاد شده کامل نبود و هر آزمون دارای واریانس ویژه و مستقل از “g” نیز بود. اسپیرمن نتیجه گرفت آزمون های هوش، هم عامل “g” و هم عوامل اختصاصی دیگری را ارزیابی می کنند. او این عوامل اختصاصی و واریانس توانایی عمومی دانست. اسپیرمن در پژوهش های خود به این نتیجه رسید که هوش
انسان از دو عامل تشکیل شده است:
۱) توانایی عمومی و ۲) توانایی های اختصاصی.[۹۳] شکل بیانگر نظریه اسپیرمن است.
شکل۲-۱٫ نظریه اسپیرمن
همان گونه که در شکل ملاحظه می کنید، هر یک از بیضی ها مبین یک آزمون است. میزان همپوشی میان بیضی ها بیانگر همبستگی بین آزمون هاست. سطح بزرگ وسط عامل عمومی موثر در توانایی ذهنی را نشان می دهد. هر بیضی دارای سطح های است که با دیگر بیضی ها همپوشی ندارد و عامل “g” و “s” مختص به هر آزمون را نشان می دهد. از آنجا که در نظریه اسپیرمن دو نوع عامل مطرح شده، آن را نظریه دو عاملی[۹۴] نامیده اند. نظریه او نخستین الگویی است که برای ارزیابی فعالیت های شناختی ارائه شد (هوگان، ۲۰۰۳).
همزمان با مطالعات اسپیرمن برای تعیین ساختار صفات ذهنی، بینه و همکارانش سالها در زمینۀ اندازهگیری هوش تلاش کردند.نخستین بررسیهای بینه برای یافتن شاخص کمی و ملموس از هوش در سال ۱۸۹۶ صورت گرفت وسرانجام مطالعات مشترک اوبا سیمون در فرانسه به تهیۀ نخستین ابزار علمی ارزشیابی تواناییهای ذهنی انسان منجر شد.
اگر چه فعالیتهای علمی بینه و نظریهپردازی اسپیرمن همزمان با یکدیگر رخ داد، ولی شواهدی وجود ندارد که نشان دهد بینه و همکارانش از نظریۀ اسپیرمن تأثیر پذیرفته باشند. همچنین دلایلی نیز درست نیست که نشان دهد اسپیرمن هنگام تدوین نظریۀ خود از فعالیتهای بینه تأثیر گرفته باشد.فعالیتهای بینۀ اساساً بر جنبه آزمایشی وعلمی متمرکز بوده و با هدف تدوین مجموعهای سودمند از پرسشها صورت گرفته است؛ در حالی که اسپیرمن توانست الگویی مفهومی ومتناسب با مجموعۀ پرسشهای بینه پدید آورد وبرای تجزیه وتحلیل ارزشیابی دادههای حاصل از اجرای آزمونهای نظریۀ آماری ارائه دهد.
هدف ارزیابی تواناییهای شناختی بر پایۀ نظریۀ دوعاملی این بود که مقدار عامل «g» در همۀ تواناییها دخالت دارد، آن را تنها مبنای پیشبینی کارکردهای افراد در موقعیتهای مختلف تلقی میکنیم . به همین دلیل اندازهگیری عاملهای اختصاصی کار بیهودهای خواهد بود، زیرا هر یک از این عاملها بنا به تعریف فقط در فعالیت واحد و خاصی مؤثر است. بر این اساس، اسپیرمن پیشنهاد کرد آزمونی با حداکثر اشباع از عامل «g » جایگزین مجموعهای از مادههای ناهمگون که دراغلب آزمونهای هوش مشاهده میشود، شود.
به نظر میرسد در آزمونهایی که در آنها روابط انتزاعی مطرح است، بهترین شاخص g است. اسپیرمن در پژوهشهای خود متوجه شد که علاوه بر عوامل عمومی و اختصاصی، طبقهای از عوامل درحد وسط وجود دارند که نه مانند «g »کاملاً عمومی ونه مانند «s »کاملاً اختصاصیاند. اواین عوامل را که تنها در گروهی از فعالیتها مشاهده میشوند، «عوامل گروهی» نامید.
نظریۀ اسپیرمن با مخالفتها و موافقتهایی مواجه شد، از جمله ثراندیک همبستگیهای مطرح شده از سوی اسپیرمن را کماهمیت تلقی کرد و معتقد بود که این همبستگیها نمیتوانند دلیل قاطعی برای اثبات وجود عامل عمومی یا کلی در هوش باشند. ثراندیک فعالیتهای هوشی را به سه دسته تقسیم کرد:

 

نتیجه تصویری برای موضوع هوش

دیدگاهتان را بنویسید

نشانی ایمیل شما منتشر نخواهد شد. بخش‌های موردنیاز علامت‌گذاری شده‌اند *

*