استراتيجيات أداء الاختبار وتأثيرها على مستوى الأداء والخصائص السيکومترية للاختبار وبنوده

نوع المستند : المقالة الأصلية

المؤلف

أستاذ علم النفس التربوي المساعد کلية التربية بقنا -جامعة جنوب الوادي أستاذ مشارک -کلية التربية -جامعة القصيم

10.12816/0042478

المستخلص

هدف البحث الحالي إلى دراسة استراتيجيات أداء الاختبار لدى الطلاب والتعرف على أکثر هذه الاستراتيجيات استخداماً أثناء الموقف الاختبار وتأثيرها على درجات الطلاب في الاختبار، کذلک التعرف على تأثير استخدام هذه الاستراتيجيات على صعوبة وتمييز بنود الاختبار وصدقه وثباته، ولتحقيق هذه الأهداف تم بناء مقياس لاستراتيجيات أداء الاختبار يتضمن خمس استراتيجيات تمثلت في استراتيجية تخطيط وتنظيم وقت الإجابة واستراتيجية تحليل الأسئلة واستراتيجية تنظيم وتخطيط الإجابة واستراتيجية الضبط والسيطرة واستراتيجية ما بعد الاختبار، وتم کذلک بناء اختبار تحصيلي في مقرر القياس والتقويم، وتکونت عينة الدراسة من 181 طالب من طلاب الدبلوم العام في التربية، وباستخدام الأساليب الإحصائية المناسبة توصل البحث للعديد من النتائج منها:
-         تستخدم استراتيجيات أداء الاختبار من قبل الطلاب عينة الدراسة بدرجة متوسطة ماعدا استراتيجية الضبط والسيطرة فکانت بدرجة ضعيفة.
-         تتأثر درجات الطلاب في الاختبار التحصيلي بدرجة استخدامهم لاستراتيجيات أداء الاختبار، حيث تزيد الدرجات بزيادة استخدام تلک الاستراتيجيات.
-         يمکن التنبؤ بدرجات الطلاب في الاختبار التحصيلي من خلال درجاتهم في استراتيجيات أداء الاختبار وکانت أکثر الاستراتيجيات اسهاماً في التنبؤ هما استراتيجيتي الضبط والسيطرة وتحليل أسئلة الاختبار.
-         تزيد معاملات صعوبة البنود (تزداد سهولتها) بزيادة استخدام تلک الاستراتيجيات بينما تقل معاملات تميز البنود.
-         يتحسن الصدق التنبؤي والصدق التلازمي للاختبار التحصيلي بزيادة استخدام استراتيجيات أداء الاختبار، وکذلک يتحسن الثبات، لکن تأثر الثبات باستخدام استراتيجيات أداء الاختبار أقل من تأثر الصدق باستخدام هذه الاستراتيجيات.
The aim of this research is to examine students' test taking strategies, identify the most frequently used during the test situation, and their effect on test scores, Also, the effect of using these strategies on the difficulty and discrimination of the test items and its validity and reliability, To achieve these objectives, a measure of test taking strategies has been developed, including five strategies, such as response time planning, question analysis, response planning, control and management, post-test strategy, And achievement test in the measurement and evaluation course was also developed,The sample consisted of 181 students of the general diploma in education, the research reached many results, including:
-      Test taking strategies used by students in a medium degree, except the control and management strategy used in poor degree.
-      The scores of students in the test affected by the degree to which they use the test taking strategies, where the use of these strategies increase, the scores increase.
-      Students' scores in the test can be predicted through their test taking strategies, The most important strategies for predicting are the control and management and the questions analysis.
-      Item difficulty coefficients increased by the increased use of these strategies, while the item discrimination decreased.
-      Improved test predictive and congenital validity by increased of the test taking strategies, as well as improved reliably, but the effect of test taking strategies on  reliably is less than the effect of this strategies on test validity.

الكلمات الرئيسية

الموضوعات الرئيسية


 

           کلیة التربیة

        کلیة معتمدة من الهیئة القومیة لضمان جودة التعلیم

        إدارة: البحوث والنشر العلمی ( المجلة العلمیة)

    =======

 

 

استراتیجیات أداء الاختبار وتأثیرها على

مستوى الأداء والخصائص السیکومتریة للاختبار وبنوده

 

 

إعــــداد

د/ ربیع عبده أحمد رشوان

أستاذ علم النفس التربوی المساعد

کلیة التربیة بقنا -جامعة جنوب الوادی

أستاذ مشارک -کلیة التربیة -جامعة القصیم

 

 

}     المجلد الثالث والثلاثین– العدد السادس– أغسطس 2017م  {

http://www.aun.edu.eg/faculty_education/arabic

 

ملخص:

هدف البحث الحالی إلى دراسة استراتیجیات أداء الاختبار لدى الطلاب والتعرف على أکثر هذه الاستراتیجیات استخداماً أثناء الموقف الاختبار وتأثیرها على درجات الطلاب فی الاختبار، کذلک التعرف على تأثیر استخدام هذه الاستراتیجیات على صعوبة وتمییز بنود الاختبار وصدقه وثباته، ولتحقیق هذه الأهداف تم بناء مقیاس لاستراتیجیات أداء الاختبار یتضمن خمس استراتیجیات تمثلت فی استراتیجیة تخطیط وتنظیم وقت الإجابة واستراتیجیة تحلیل الأسئلة واستراتیجیة تنظیم وتخطیط الإجابة واستراتیجیة الضبط والسیطرة واستراتیجیة ما بعد الاختبار، وتم کذلک بناء اختبار تحصیلی فی مقرر القیاس والتقویم، وتکونت عینة الدراسة من 181 طالب من طلاب الدبلوم العام فی التربیة، وباستخدام الأسالیب الإحصائیة المناسبة توصل البحث للعدید من النتائج منها:

-         تستخدم استراتیجیات أداء الاختبار من قبل الطلاب عینة الدراسة بدرجة متوسطة ماعدا استراتیجیة الضبط والسیطرة فکانت بدرجة ضعیفة.

-         تتأثر درجات الطلاب فی الاختبار التحصیلی بدرجة استخدامهم لاستراتیجیات أداء الاختبار، حیث تزید الدرجات بزیادة استخدام تلک الاستراتیجیات.

-         یمکن التنبؤ بدرجات الطلاب فی الاختبار التحصیلی من خلال درجاتهم فی استراتیجیات أداء الاختبار وکانت أکثر الاستراتیجیات اسهاماً فی التنبؤ هما استراتیجیتی الضبط والسیطرة وتحلیل أسئلة الاختبار.

-         تزید معاملات صعوبة البنود (تزداد سهولتها) بزیادة استخدام تلک الاستراتیجیات بینما تقل معاملات تمیز البنود.

-         یتحسن الصدق التنبؤی والصدق التلازمی للاختبار التحصیلی بزیادة استخدام استراتیجیات أداء الاختبار، وکذلک یتحسن الثبات، لکن تأثر الثبات باستخدام استراتیجیات أداء الاختبار أقل من تأثر الصدق باستخدام هذه الاستراتیجیات.

الکلمات المفتاحیة: استراتیجیات أداء الاختبار، الخصائص السیکومتریة للاختبار، الخصائص السیکومتریة لبنود الاختبار، الصدق، الثبات، الصعوبة، التمییز

Abstract:

The aim of this research is to examine students' test taking strategies, identify the most frequently used during the test situation, and their effect on test scores, Also, the effect of using these strategies on the difficulty and discrimination of the test items and its validity and reliability, To achieve these objectives, a measure of test taking strategies has been developed, including five strategies, such as response time planning, question analysis, response planning, control and management, post-test strategy, And achievement test in the measurement and evaluation course was also developed,The sample consisted of 181 students of the general diploma in education, the research reached many results, including:

-      Test taking strategies used by students in a medium degree, except the control and management strategy used in poor degree.

-      The scores of students in the test affected by the degree to which they use the test taking strategies, where the use of these strategies increase, the scores increase.

-      Students' scores in the test can be predicted through their test taking strategies, The most important strategies for predicting are the control and management and the questions analysis.

-      Item difficulty coefficients increased by the increased use of these strategies, while the item discrimination decreased.

-      Improved test predictive and congenital validity by increased of the test taking strategies, as well as improved reliably, but the effect of test taking strategies on  reliably is less than the effect of this strategies on test validity.

Key Words: test taking strategies, test psychometric properties, items psychometric properties, validity, reliably, difficulty and discrimination

مقدمة:

الفهم العمیق للفروق الفردیة بین المتعلمین یلقى مزیداً من الاهتمام بین التربویین بصفة عامة وبین المتخصصین فی علم النفس التربوی بصفة خاصة، وفی الآونة الأخیرة تزاید الاهتمام بدراسة الکیفیة التی یؤدى بها الطلاب فی الاختبارات المعرفیة المختلفة وبصفة خاصة الاختبارات التحصیلیة، بافتراض أن الاختلافات فی طریقة الأداء فی الاختبار تعد مصدراً من مصادر التباین فی نتائج هذه الاختبارات بجانب السمة موضوع القیاس؛ فإذا کانت الاختبارات من أهم وسائل تقییم الأداء الأکادیمی للطالب والتعرف على قدراته وإمکانیاته المختلفة، فیجب أن تتمتع بقدر کبیر من الصدق والثبات، ومن هذا المنطلق یولی التربویون بصفة عامة اهتماماً کبیراً بالکشف عن العوامل المؤثرة على أداء الطالب فی الموقف الاختباری، والتی یمکن أن تؤثر على صدق تعبیر درجات الاختبار عن السمات المقاسة.

کذلک فی حالة استخدام الاختبارات المعرفیة فی الأغراض البحثیة فإن أداء الطالب فی الموقف الاختباری قد لا یترتب علیه قرارات تخص الطالب ومستقبله الأکادیمی والمهنی، وهو ما یتسبب فی عدم توافر دافعیة أداء الاختبار لدى العدید من الطلاب، والذی ینتج عنه عدم الجدیة فی الاجابة وعدم استخدام الاستراتیجیات المناسبة فی أداء الاختبار وعدم بذلهم للجهد الکافی فی الوصول إلى الإجابة الصحیحة واعتماد البعض منهم على التخمین العشوائی؛ وفی النهایة لا تتسم نتائج القیاس بالدقة المطلوبة ولا تعبر الدرجات بصدق عن السمة المقاسة، وبالتالی تکون القرارات المترتبة على نتائج تلک البحوث غیر دقیقة (Wolf, Smith & Birnbaum, 1995, 349; Parham, 1996, 3; Volante, 2006, 131; Xu & Wu, 2012, 176; Cui & Roberts, 2013, 41; Pohl, Sudkamp, Hardt, Carstensen & Weinert, 2016, 4)؛

ویشیر Reise and Flannery (1996, 10)إلى أن اهتمام علماء علم النفس التربوی والقیاس النفسی بقضیة جودة الأداء فی الموقف الاختباری ترجع لثلاثة دوافع رئیسیة تتمثل فی الحاجة العامة للتأکد من صدق نتائج القیاس وقابلیة النتائج للتفسیر، وفی تحدید السلوکیات الشاذة للممتحنین فی الموقف الاختباری والتی من المحتمل أن تنتج من نقص استخدام استراتیجیات أداء الاختبار أو استخدام استراتیجیات غیر مناسبة کالغش والتخمین العشوائی أو عدم الرغبة فی إبداء الاستجابة أو من البناء السیء للاختبار، وأخیراً فی تحدید العملیات النفسیة المسؤولة عن الخطأ فی الاستجابة بخلاف مستوى السمة موضوع الاهتمام، وهذه الأمور تؤثر کثیراً على جودة نتائج القیاس فی ظل القیاس جماعی المرجع.

فالتوجهات المعاصرة فی القیاس تحاول تحدید مصادر التباین فی درجات الأداء على أدوات القیاس بخلاف مستوى السمة موضوع القیاس والتی منها خصائص الممتحنین وذلک من منطلق أن تحیید أثر هذه المصادر یسهم فی زیادة جودة القیاس وصدق تعبیر الدرجات عل المستوى الحقیقی للسمة المقاسة (Takallou, Vahdany, Araghi & Tabrizi, 2015, 119).

فإذا کانت نتائج الاختبار أهم محکات المفاضلة بین الأفراد، فیجب أن نتساءل هل تعکس درجات الاختبار المعارف والمهارات المتعلقة بالمحتوى المستهدف فقط، وهل تعبر بصدق عن المستوى الحقیقی للسمة موضوع القیاس؟ وهل هناک عوامل أخرى تؤثر فی درجات الاختبار؟ وتکمن الإجابة فی أن الأداء على الاختبار یتأثر بالعدید من المتغیرات المعرفیة والنفسیة بجانب ما وضع الاختبار لقیاسه، مثل المحتوى، وقلق الاختبار والاتجاهات نحو موضوع الاختبار والاتجاهات نحو الاختبارات بصفة عامة، واستراتیجیات الأداء فی الاختبار، فعلى الرغم من أهمیة أن تتحدد درجة الفرد فی أداة القیاس بمحتوى الأداة ومستوى الصعوبة وکفاءة الفرد إلا أنه توجد العدید من العوامل الأخرى التی تؤثر على أداء الفرد فی الموقف الاختباری (Ellis & Ryan, 2003; Dodeen, 2008; 2009; Wise & DeMars, 2010; Bicak, 2013; Banks & Eaton, 2014; Takallou, Vahdany, Araghi & Tabrizi, 2016; Stenlund, Eklof & Lyren, 2016).

ویکاد یکون هناک اتفاق على أن جودة الأداء على أدوات القیاس المختلفة تحدد مدى تعبیر الدرجات فیها عن المستوى الحقیقی للفرد فی السمة موضوع القیاس (Blerkom, 2009; Cui & Roberts, 2013; Wise & Kingsbury, 2016; Lon & Iliescu, 2017; Wolf et al., 1995).

ولذا فقد أکدت الجمعیة الأمریکیة لعلم النفس فی عام 2004 فی معاییر الاختبارات النفسیة والتربویة على ضرورة توافر دوافع قویة لأداء المشارکین للاختبار (Barry & Finney, 2009, 11)؛ فالاختبارات المعرفیة بصفة عامه تعد من اختبارات الأداء الأقصى والتی تحتاج من المختبر ومؤدی الاختبار بذل أقصى جهد یضمن تعبیر الدرجات عن المستوى الحقیقی للسمة المقاسة (Oakland, Callueng & Harris, 2012, 140)؛ وتعد استراتیجیات أداء الاختبار من أهم مؤشرات الأداء الجید والجاد فی الاختبار  (Waskiewicz, 2011; Penk, Pohlmann & Roppelt, 2014; Robie, Mueller & Campion, 2001; Xu & Wu, 2012; Arsal, 2014) .

ویؤکد Wise, Wise and Bhola (2006, 66) على أن هذه القضیة تؤثر على جودة أدوات القیاس حتى فی حالة استخدام النظریة المعاصرة فی تطویرها وتدریج بنودها؛ وهو ما أکدته نتائج دراسة بلال الشواقفة (2011) حیث اختلفت معالم بنود الاختبار والمقدرة باستخدام النموذج اللوغاریتمی ثلاثی البارامتر باختلاف مستوى مهارات الحکمة الاختباریة؛ والبحث الحالی یحاول التعرف على تأثیر درجة استخدام استراتیجیات أداء الاختبار على مستوى الأداء فی الاختبار والخصائص السیکومتریة لکل من الاختبار وبنوده.

مشکلة البحث:

تتأثر مصداقیة تعبیر الدرجات عن المستوى الحقیقی للأفراد فی السمة المقاسة باثنین من العوامل الجوهریة، یتعلق الأول منهم بالبناء الجید لأداة القیاس والثانی بأداء المشارکین، والعامل الأول یمکن التحکم فیه من قبل واضع الاختبار من خلال اتباع الإجراءات العلمیة لبناء أدوات القیاس، أما الثانی فیتوقف على العدید من المتغیرات والتی منها المعتقدات الذاتیة للممتَحنین والاستعداد للاختبار والتنافسیة والقرارات المترتبة على نتائج الاختبار، والجهد المبذول ووقت الاستجابة واستراتیجیات الأداء فی الموقف الاختباری، والسیاق الذی یحدث فیه الاختبار ومعتقدات الممتَحنین عن أهمیة الأداء الجید فی الاختبار وأن درجاتهم یتوقف علیها قرارات ذات أهمیة بالنسبة لهم، ومثل هذه القضایا والتی تتناول العوامل التی تؤثر فی جودة أو مطابقة أداء الفرد Person Fit نادراً ما تلقى الاهتمام الکافی سواء من الناحیة البحثیة أو الناحیة العملیة (Reise & Flannery, 1996, 12; Wise, Ma, Kingsbury & Hauser, 2010, 15; Lon & Iliescu, 2017, 1) .

فافتراض أن أدوات القیاس بصفة عامة تعمل بطریقة جیدة باختلاف خصائص من تطبق علیهم هو افتراض غیر کافی ولذا یجب الحذر عند استخدام أدوات القیاس فی سیاقات قد لا تمثل أهمیة بالنسبة لمن تطبق علیهم؛ ویعبر Wise et al. (2006, 67, 73) Barry and Finney (2009, 3-4); عن هذه القضیة بصورة أکثر توضیحا بأن عدم وجود حافز لدى مؤدی الاختبار لکی یبذل أقصى جهد ممکن فی الإجابة ویستخدم استراتیجیات مناسبة لتحقیق ذلک، یتسبب فی العدید من النتائج السلبیة المهددة لدقة تعبیر درجات الاختبار عن المستوى الحقیقی للسمة موضوع القیاس؛ ویشیر Amer (2007, 14) إلى أن التوجهات الحدیثة فی مجال القیاس النفسی تؤکد على ضرورة أن تتضمن إجراءات تقنین الاختبارات على معلومات عن کیفیة أداء الأفراد على الاختبار وربط تلک المعلومات بمحتوى الاختبار ومستوى الأداء فیه.

بل وذهبت بعض الأدبیات إلى أن الاختبار التحصیلی یوفر نتائج عن نمطین مستقلین من المعرفة الأول وهو المعرفة بموضوع الاختبار والثانی وهو المعرفة بکیفیة أداء الاختبار، فامتلاک الطالب للمعرفة المطلوبة فی الاختبار ومألوفیته بها لا یضمن الأداء الجید فیه (Orth, 1995, 4; Dodeen, 2009, 36)؛ ویشیر Guion (1998, 478) إلى ضرورة وضع استراتیجیات أداء الاختبار على أجندة البحث العلمی فی مجال القیاس والتقویم باعتبارها متغیر غیر مقاس یؤثر فی دقة التنبؤات حول السمة المقاسة ویتوسط علاقتها بالمتغیرات الأخرى، وربما یکون السبب فی ظهور الفروق بین المجموعات فی تلک السمات.

وفی محاولة تحدید الأنماط السلوکیة التی تتسبب فی الاستجابات غیر المناسبة على أدوات القیاس أکدت الدراسات أن هذه الأسباب منها عدم الاستجابة بجدیة للبنود الأخیرة، والأداء غیر المناسب على البنود المتقدمة نظراً لعدم الألفة بنوعیة الأسئلة، والغش فی الاستجابة، وضعف استخدام استراتیجیات أداء الاختبار (Rudner, Bracey & Skaggs, 1996, 92)؛ وعلى الرغم من أهمیة الکشف عن مدى مطابقة الأفراد وجدیتهم فی الأداء على الاختبار إلا أن البحوث التطبیقیة لهذه النتائج البحثیة والتأکیدات النظریة فی مواقف اختباریة عملیة نادرة للغایة (Cui & Roberts, 2013, 40).

فعلى الرغم من التأکیدات السابقة إلا أن الباحث الحالی وفی حدود اطلاعه لم یتوصل إلى دراسات تناولت تأثیر استراتیجیات الأداء فی الموقف الاختباری باعتبارها مؤشر لدافعیة الفرد للمشارکة فی الاختبار وتعبر عن مستوى الجهد المبذول للوصول لأفضل وأقصى أداء على الخصائص السیکومتریة للاختبار والبنود بصورة صریحة.

ففی البیئة العربیة ترکزت معظم الجهود البحثیة فی الکشف عن العوامل المؤثرة على الخصائص السیکومتریة للاختبار والبنود فی دراسة تأثیر عدد البدائل فی اختبارات الاختیار من متعدد وموقع المشتت الجید مثل دراسات (جابر عبدالله، 2014، نعمان الموسوی، 1997؛ مایسة أبومسلم، 2016) أو صیاغة المفردات وبدائل الإجابة بطریقة غیر جیدة مثل دراسة (إبراهیم یعقوب وباسل أبوفودة، 2012؛ بندر الأمیر، 2016)؛ ووجود أکثر من بدیل صحیح مثل دراسة (عصام الجبة، 2012)؛ وهنا تساءل یطرح نفسه مفاده هل وجود درجات غیر جیدة ولا تعبر عن المستوى الحقیقی للسمة لدى بعض الأفراد والمترتب على عدم جدیة المشارکین فی الإجابة یهدد صدق بعض النتائج التی توصلت لها الدراسات السابقة؟ وما هو تأثیر هذه الدرجات على الخصائص السیکومتریة لأدوات القیاس؟ وهل لو    تم استبعاد الأفراد غیر الجیدین فی الأداء على الاختبار تتحسن الخصائص السیکومتریة للاختبار وبنوده؟.

فقد لاحظ الباحث شکوى العدید من طلاب الدراسات العلیا ومن یستخدمون اختبارات الأداء الأقصى من وجود بعض المشکلات فی الخصائص السیکومتریة لهذه الأدوات على الرغم من أن العدید منها اختبارات سبق تقنینها والتأکد من کفاءتها السیکومتریة، وتبین من مراجعة الدراسات السابقة المرتبطة بموضوع البحث الحالی أن هناک ندرة فی الدراسات التی تناولت تأثیر بعض المتغیرات النفسیة المرتبطة بالموقف الاختباری على تباین الخصائص السیکومتریة لأداة القیاس، فدراسة هدى العریفی (2008) أکدت نتائجها أن موضع الضبط یؤثر على الخصائص السیکومتریة للاختبار بینما لا تختلف تلک الخصائص باختلاف الفاعلیة الذاتیة، وأشارت الدراسة إلى أن عدم جدیة الطلاب فی الإجابة عن الاختبار ربما أسهم فی عدم وضوح الفروق فی خصائصه السیکومتریة الراجعة لاختلاف الفاعلیة الذاتیة؛ ودراسة فریح العطوی (2013) أکدت نتائجها على تأثیر المخاطرة على الخصائص السیکومتریة للاختبار التحصیلی فبزیادة المخاطرة تحدث زیادة مصطنعة فی معامل الثبات وصعوبة البنود والتمییز، ودالة معلومات الاختبار.

وأکدت نتائج دراسة بلال الشواقفة (2011) تأثیر تعلیم الحکمة الاختباریة وبصفة خاصة التخمین الذکی على خصائص فقرات اختبارات الاختیار من متعدد حیث کانت فقرات الاختبار أسهل وأقل تمییزاً بالنسبة لطلاب المجموعة التجریبیة عنها لدى طلاب المجموعة الضابطة، وتتعارض نتائج الدراسة السابقة مع نتائج دراسة باسل أبوفودة (2008) والتی أکدت نتائجها عدم تأثیر تعلیم الطلاب لحکمة الاختبار على ثبات الاختبار والخصائص السیکومتریة للفقرات (صعوبة وتمییز).

کذلک أشارت نتائج دراسة Wise et al. (2006) إلى أن جودة الخصائص السیکومتریة للاختبار تتوقف على جدیة الأفراد فی الإجابة؛ بینما أشارت دراسة Rogers (1984) إلى عدم اختلاف الخصائص السیکومتریة (صدق، ثبات) لأداة القیاس باختلاف تعلیمات الاستجابة والتی تمثلت فی ضرورة بذل الجهد الکافی للوصول للاستجابة الصحیحة ممثلا فیما یمکن اعتباره باستراتیجیة مراجعة الإجابة واستراتیجیة إدارة الوقت هذا بالنسبة للمجموعة التجریبیة بینما تمثلت التعلیمات بالنسبة للمجموعة الضابطة فی أن الإجابة الصحیحة هی أول إجابة تخطر بذهن الفرد وأنه یجب الانتهاء من الإجابة فی أقصر وقت ممکن؛ ودراسة Robie et al. (2001) أشارت نتائجها إلى عدم اختلاف الخصائص السیکومتریة لبنود الاختبارات المعرفیة (الصعوبة والتمییز) باختلاف دافعیة أداء الاختبار، کذلک أشارت نتائج الدراسة إلى عدم اختلاف الخصائص السیکومتریة للاختبار (التمییز والثبات، وتباین الخطأ، والصدق البنائی باستخدام التحلیل العاملی الاستکشافی والتوکیدی) باختلاف مستوى دافعیة أداء الاختبار؛ وباستخدام بیانات مولدة عن طریق المحاکاة أکدت نتائج دراسة Clause (1996) أن استبعاد الاستجابات غیر الجادة لم یؤثر کثیراً فی ثبات الدرجات وصدقها.

وأشارت نتائج دراسة Maspons and Llabre (1983) إلى تأثیر نقص استراتیجیات أداء الاختبار لدى بعض المشارکین على خصائصه السیکومتریة حیث أن التدریب على هذه الاستراتیجیات یسهم فی تحسین الصدق التنبؤی للاختبار ولکن لا یؤثر فی ثباته؛ وأشارت نتائج دراسة Rudner et al. (1996) إلى ان استبعاد الأفراد منخفضی استخدام استراتیجیات أداء الاختبار یسهم فی دقة تقدیر السمة؛ وأشارت نتائج دراسة Westfall and D'Costa (1987) إلى أن استبعاد الأفراد غیر المطابقین باستخدام نموذج راش وهم الذین یؤدون بطریقة غیر متسقة على الاختبار أسهم فی زیادة دقة تقدیر السمة وقدرتها التنبئیة؛ وأشارت نتائج دراسة Wise et al. (2006) إلى أن استبعاد الطلاب غیر الجادین فی الإجابة على الاختبار نتج عنه نقصان فی الاتساق الداخلی للدرجات کمؤشر لثبات الدرجات وکذلک نقص فی الخطأ المعیاری المترتب على نقص الانحراف المعیاری للدرجات وزیادة فی الصدق التقاربی لدرجات الاختبار. 

ومن العرض السابق یتضح أن هناک تعارض بین نتائج الدراسات السابقة فیما یتعلق بتأثیر التباین فی استخدام استراتیجیات أداء الاختبار ومعدل الجهد المبذول فی الوصول لأفضل أداء فی الاختبار على خصائصه السیکومتریة وفقراته والذی یرجع فی جزء کبیر منه إلى تباین الاستراتیجیات موضوع الاهتمام فی هذه الدراسات والخلط بینها وبین الحکمة الاختباریة فی کثیر من الدراسات.

ومن ناحیة أخرى وبمراجعة الدراسات التی تناولت تأثیر استراتیجیات أداء الاختبار على مستوى الأداء فی الاختبار؛ اتضح للباحث أنه هذه الدراسات توصلت إلى نتائج متناقضة فی بعض الأحیان، والناتج من عدم وضوح مفهوم استراتیجیات أداء الاختبار فی الکثیر من الدراسات السابقة واعتباره مرادف لمهارات الحکمة الاختباریة بمفهومها الشائع فی بعض الأحیان فمهارات الحکمة الاختباریة وکما یذکر Xu and Wu (2012, 176) تناسب فقط أسئلة الاختیار من متعدد؛ کذلک هذا التعارض ناتج لعدم التمییز بین الاستراتیجیات العامة لأداء الاختبارات والاستراتیجیات الخاصة التی تناسب أنواع معینة من الاختبارات کاختبارات الاختیار من متعدد أو اختبارات الکفاءة اللغویة.

فاستراتیجیات الأداء فی الاختبار لا تتضمن فقط السلوکیات الصریحة للطالب أثناء الموقف الاختباری ولکن أکثر من ذلک تتضمن القرارات المعرفیة والأفکار الإیجابیة وضبط التأثیر السلبی للقلق (Holzer, Madaus, Bary & Kehle, 2009, 46; Zhang, Liu, Zhao & Xie, 2011, 165)؛ فبملاحظة أداء الطلاب فی الاختبارات نجد أن بعض الطلاب ممن لدیهم المعرفة الجیدة بأسئلة الاختبار واستعدوا جیداً له، قد لا یحققون المستویات المتوقعة منهم والذی یرجع إلى تأثر أداء الفرد فی الاختبار بالعدید من المتغیرات النفسیة والمعرفیة والشخصیة بجانب السمة موضوع القیاس (Dodeen, 2015, 109)؛ وهو ما یجب أخذه بعین الاعتبار عند تفسیر نتائج الاختبارات حتى لا تبنى علیها قرارات غیر دقیقة (إیاد حمادنة، 2011، 297).

فقد أکدت العدید من نتائج الدراسات السابقة على أن من یستخدم استراتیجیات أداء الاختبار تزداد احتمالیة نجاحه فی الاختبار وأن هذه الاستراتیجیات تعد من العوامل الممیزة بین مرتفعی ومنخفضی الأداء (Hong, Sas & Sas, 2006; Lancaster, Schumaker, Lancaster & Deshler, 2009; Dodeen, 2015; Takallou et al., 2016)؛ وأن التدریب على هذه الاستراتیجیات یحسن دافعیة أداء الاختبار ویخفض من قلق الاختبار (Maspons & Llabre, 1983; Orth, 1995; Ellis & Ryan, 2003) إلا أن غالبیة هذه الدراسات تناولت الدرجة الکلیة لاستراتیجیات أداء الاختبار ولم تحاول تحدید الأهمیة النسبیة لهذه الاستراتیجیات؛ هذا من جهة ومن جهة أخرى تناولت بعض هذه الدراسات استراتیجیات أداء الاختبار کمرادف لمهارات الحکمة الاختباریة وفی اختبارات الاختیار من متعدد بصفة خاصة.

فدراسة مجدی الشحات (2007) أکدت نتائجها فاعلیة التدریب على مهارات الحکمة الاختباریة على تحسین تحصیل الطلاب وخفض قلق الاختبار، کذلک توصلت دراسة Holzer et al. (2009) إلى أن نقص استراتیجیات أداء الاختبار یمکن اعتباره من أسباب تدنی تحصیل الطلاب ذوی صعوبات التعلم، والذی یظهر فی نقص قدرتهم على إظهار معارفهم الحقیقیة فی الاختبار والبرهنة على الاتقان.

ولکن هناک بعض النتائج البحثیة التی لم تدعم النتائج السابقة وتتعارض معها؛ فقد انتهت دارسة Arsal (2014) إلى أن استراتیجیات أداء الاختبار تربطها علاقة ضعیفة بقلق الاختبار؛ وانتهت نتائج دراسة Zhang et al. (2011) إلى أن استراتیجیات الأداء فی الاختبار تربطها علاقات ضعیفة بالأداء فی اختبارات اللغة الإنجلیزیة؛ وانتهت دراسة محمد عبدالوهاب (2007) إلى أن التدریب على مهارات الحکمة الاختباریة لا یسهم کثیراً فی خفض قلق الاختبار؛ والبحث الحالی یحاول التعرف على اسهامات استراتیجیات أداء الاختبار فی التنبؤ بدرجات الطلاب فی الاختبار التحصیلی؛ وتتحدد مشکلة البحث فی محاولة الإجابة عن الأسئلة التالیة:

1-       ما استراتیجیات أداء الاختبار الأکثر استخداماً لدى الطلاب عینة البحث الحالی؟

2-       هل توجد فروق دالة إحصائیاً فی درجات الطلاب عینة البحث الحالی فی الاختبار التحصیلی راجعة لاختلاف درجة استخدامهم لاستراتیجیات أداء الاختبار؟

3-       هل یمکن التنبؤ بدرجات الطلاب عینة البحث الحالی فی الاختبار التحصیلی من خلال درجاتهم فی استراتیجیات أداء الاختبار؟

4-       هل تختلف الخصائص السیکومتریة لبنود الاختبار التحصیلی (الصعوبة، التمییز) باختلاف استراتیجیات أداء الاختبار لدى الطلاب عینة البحث الحالی؟

5-       هل تختلف الخصائص السیکومتریة للاختبار التحصیلی (الصدق، الثبات) باختلاف استراتیجیات أداء الاختبار لدى الطلاب عینة البحث الحالی؟

مصطلحات البحث:

-    استراتیجیات أداء الاختبار:

تشیر إلى المهارات والفنیات المتعلقة بکیفیة الأداء فی الاختبار والتی تمکن الفرد من إدارة وقت الاختبار والسیطرة على مشاعره السلبیة وعرض وتنظیم إجاباته فی الاختبار بالطریقة التی تتیح له الحصول على أعلى درجة ممکنة بما یتفق مع مستواه فی السمة موضوع القیاس، ویمکن تطبیقها فی کافة أنواع الاختبارات ولا تقتصر على اختبارات الاختیار من متعدد، وتتحدد إجرائیاً بالدرجة التی یحصل علیها الطالب فی المقیاس المستخدم فی البحث الحالی وأبعاده الفرعیة.

-    الاختبار التحصیلی:

یرى "براون" أن الاختبار التحصیلی أداة لقیاس التعلم الذی یحدث نتیجة الخبرة       فی موقف تعلم یتم التحکم فیه مثل الصف الدراسی أو البرنامج التدریبی (صلاح علام، 2012، 122-123) ؛ ویقصد به فی البحث الحالی الاختبار التحصیلی لمقرر القیاس  والتقویم الذی یقوم الباحث بتدریسه لطلاب الدبلوم العام فی التربیة بجامعة القصیم بالمملکة العربیة السعودیة.

-    مستوى الأداء فی الاختبار التحصیلی:

ویُعرف إجرائیاً بالدرجة التی یحصل علیها الطالب فی الاختبار التحصیلی المستخدم فی البحث الحالی.

-    الخصائص السیکومتریة للاختبار وبنوده:

وتشیر إلى الکفاءة السیکومتریة للاختبار التحصیلی المستخدم فی البحث الحالی متمثلة فی ثبات الاختبار باستخدام معادلة کیودر وریتشاردسون KR-20 وصدق الاختبار التحصیلی باستخدام الصدق التلازمی والصدق التنبؤی، وبالنسبة لبنود الاختبار یقصد بها معاملات صعوبة البنود ومعاملات التمییز کما تقاس بالطرق المعتادة المستخدمة لهذا الغرض.

أهداف البحث:

یهدف البحث الحالی إلى التعرف على:

1-      استراتیجیات أداء الاختبار الأکثر استخداماً، ودرجة استخدام الطلاب لهذه الاستراتیجیات.

2-      مدى اختلاف درجات الطلاب فی الاختبار التحصیلی باختلاف درجة استخدامهم لاستراتیجیات أداء الاختبار.

3-      استراتیجیات أداء الاختبار التی تسهم فی التنبؤ بدرجات الطلاب فی الاختبار التحصیلی وأکثر هذه الاستراتیجیات تأثیراً على مستوى الأداء فی الاختبار.

4-      مدى اختلاف الخصائص السیکومتریة لبنود الاختبار التحصیلی (الصعوبة، التمییز) باختلاف استخدام الطلاب لاستراتیجیات أداء الاختبار.

5-      مدى اختلاف الخصائص السیکومتریة للاختبار التحصیلی (الصدق، الثبات) باختلاف استخدام الطلاب لاستراتیجیات أداء الاختبار.

أهمیة البحث:

من الممکن وأن تسهم نتائج البحث الحالی فی:

-          توجیه مستخدمی اختبارات الأداء الأقصى ومطوری هذه الاختبارات لضرورة توفیر الظروف التی تضمن بذل المشارکین لأقصى جهد ممکن فی الوصول للإجابة الصحیحة، فقد تسهم النتائج فی توضیح تأثیر التباین فی استخدام هذه الاستراتیجیات على الخصائص السیکومتریة للاختبار وبنوده.

-          توجیه من یستخدمون الاختبارات المعرفیة لأغراض بحثیة لأهمیة وجود دوافع قویة لدى المشارکین لأداء الاختبار، وأنه یمکن تدریب المشارکین على استراتیجیات أداء الاختبار قبل تطبیق هذه الاختبارات للحد من تأثیر التباین بینهم فی هذه الاستراتیجیات على الخصائص السیکومتریة للاختبار وبنوده.

-          توضیح الأهمیة النسبیة لاستراتیجیات أداء الاختبار من حیث تأثیرها على أداء الطلاب فی الاختبار التحصیلی وهو ما یمکن الاستفادة منه فی تحسین أداء الطلاب بالتدریب على هذه الاستراتیجیات.

-          لفت نظر المهتمین بتطویر المناهج وطرق التدریس لأهمیة هذه الاستراتیجیات وأهمیة تضمینها فی مقررات الإعداد العام، وضرورة أن تؤخذ بعین الاعتبار من قبل القائمین بالتدریس.

الإطار النظری والدراسات السابقة:

أولاً: استراتیجیات أداء الاختبار: Test Taking Strategies

فضل الباحث ترجمة هذا المصطلح على انه استراتیجیات أداء الاختبار بدلاً من استراتیجیات أخذ الاختبار أو استراتیجیات تناول الاختبار، وذلک لأن هذه الترجمة توضح المقصود بالمفهوم بصورة أدق حیث تصف ما یقوم به مؤدی الاختبار قبل وأثناء وبعد الاختبار، وهو ما یتفق مع ما یؤکد علیه Dodeen, Abdelfatah and Alshumrani (2014, 1) حیث تعبر هذه الاستراتیجیات عن مهارات الطالب المعرفیة التی تتیح له الأداء فی الاختبار بطریقة مناسبة ومعرفة ما علیه فعلة قبل وأثناء وبعد الاختبار، وتمکنه من ترجمة ما تعلمه من معارف ومهارات والاستفادة منها فی الإجابة على أسئلة الاختبار وتسهم إیجابیاً فی کفاءة الأداء فی الاختبار وبالتالی الإنجاز الأکادیمی.

ویعرفها Kim and Goetz (1993, 212) بأنها "العملیات المعرفیة وما وراء المعرفیة التی یعتمد علیها الفرد أثناء قراءة أسئلة الاختبار والإجابة عنها"؛ وتعرفها Parham (1996, 3) بأنها "أی فنیات أو قواعد أو إجراءات تستخدم لتفسیر أسئلة الاختبار والإجابة عنها، ویمکن استخدامها فی العدید من المواقف الاختباریة باختلاف أنماط الاختبارات"؛ ویعرفها Nguyen (2003, 37, 38) بأنها "مهارات ومعارف الفرد المتعلقة بکیفیة الأداء فی الاختبار والتی تمکنه من عرض وتنظیم إجاباته بما یتفق مع مستوى قدراته، ویمکن تطبیقها فی کافة أنواع الاختبارات"؛ ویعرفها Dodeen (2015, 108) بأنها "القدرات المعرفیة التی تمکن الفرد من التعامل مع أی موقف اختباری بطریقة جیدة ومعرفة ما الذی یجب فعله أثناء الاختبار"؛ ویعرفها Stenlund et al. (2016, 5) بأنها "مجموعة من الإجراءات التی تستخدم لفهم أسئلة الاختبار والإجابة عنها بطریقة صحیحة".

والتعریفات السابقة لاستراتیجیات أداء الاختبار تؤکد على عمومیة هذه الاستراتیجیات ومناسبتها لکافة أنواع الاختبارات، کذلک تؤکد على أن هذه الاستراتیجیات تساعد الفرد فی فهم أسئلة الاختبار وعرض وتنظیم إجابته علیها، بما یتیح له تحقیق درجة مناسبة تعبر عن مستواه فی السمة موضوع القیاس.

التداخل بین مفهوم استراتیجیات أداء الاختبار ومفهوم الحکمة الاختباریة:

لاحظ الباحث من خلال الاطلاع على البحوث والدراسات المتاحة فی البیئة العربیة الاهتمام بمصطلح الحکمة الاختباریة بشکل واسع ولم یتوصل لأی دراسة تناولت مفهوم استراتیجیات أداء الاختبار، وعلى الرغم من اعتبار أن مصطلح الحکمة الاختباریة مرادف لمصطلح استراتیجیات أداء الاختبار فی العدید من الدراسات السابقة (Maspons & Llabre, 1983; Orth, 1995; Eme & Udoh, 2011) إلا أنه یمکن اعتبار استراتیجیات أداء الاختبار جزء من الحکمة الاختباریة بمعناها الشامل ولیس معناها التقلیدی الشائع فی الدراسات ذات الصلة؛ أما الحکمة الاختباریة بمعناه الشائع فی الدراسات السابقة وکما یشیر Stenlund et al. (2016, 5) فهی تناسب بدرجة کبیرة اختبارات الاختیار من متعدد ولیس لها صفة العمومیة.

فالحکمة الاختباریة فی معظم الدراسات السابقة عرفت بأنها قدرة الفرد على الاستفادة من خصائص ومواصفات الاختبار والموقف الاختباری للحصول على درجة مرتفعة نتیجة الإفادة من خبرة التعامل مع الاختبارات وأنها قدرة الطالب على تخمین ما یهدف إلیه واضع الاختبار وفحص ورقة الامتحان للبحث عن مفاتیح إجابة إضافیة تسهم فی الوصول للإجابة الصحیحة (أحمد عودة، 1989، 128؛ إیثار الخصاونة، 1994، 5؛ مجدی الشحات، 2007، 4؛ باسل أبوفودة، 2008، 27؛ دیانا حماد، 2010، 302؛ بلال الشواقفة، 2011، 20؛ إبراهیم یعقوب وباسل أبوفودة، 2012، 438؛ Amer, 2007, 3).

وهنا یجب أن نتساءل هل تحرى مؤدی الاختبار للثغرات الممکنة فی الاختبار والاستفادة منها ومن أخطاء بناء الاختبار فی تحسین درجته بغض النظر عن مستوى السمة یعتبر حکمة أو حنکة اختباریة؟.

فإذا کانت الحکمة الاختباریة هی مجرد محاولة الطالب الاستفادة من أخطاء القیاس المتمثلة فی الأدلة والمفاتیح الممکن الاستفادة منها فی الإجابة على بعض أسئلة الاختبار لکان من الأولى توجیه الاهتمام لتدریب واضعی الاختبارات على تحری الدقة فی بناء الاختبارات وعدم وجود مثل هذه الأخطاء؛ فعلى الرغم من اعتبار أن الحکمة الاختباریة مصدراً من مصادر الفروق فی الأداء على الاختبار، وأن اللجوء إلیها یعتبر حقیقة ثابته، إلا أن هناک العدید من المهتمین أکدوا على أن أصحاب الحکمة الاختباریة یحصلون على درجات أعلى غیر مستحقة، خاصة فی الاختبارات الموضوعیة؛ وهو ما یتضح من مفهوم میلمان وبیشوب وإبل Millman, Bishop and Ebel فی 1965 عن الحکمة الاختباریة والذی یعد هو المفهوم الأساسی المعتمد علیه فی معظم الدراسات السابقة المتعلقة بالحکمة الاختباریة حیث یؤکد هذا المفهوم على أن الحکمة الاختباریة تعنی مقدرة المفحوص على الاستفادة من الموقف الاختباری وخصائص الاختبار والصیاغات غیر الجیدة للأسئلة وما تحویة من مؤشرات تدل على الإجابة الصحیحة فی الحصول على درجات أعلى دون الإتقان الفعلی للمحتوى (دیانا حماد، 2010، 297؛ فاطمة مطلک، 2009، 566، 571؛ سامی العنزى، 2014، 350؛ Rogers & Harley, 1999, 345; Chittooran & Dorothy, 2001, 11; Xu & Wu, 2012, 176).

فقد توصلت دراسة Ghafournia and Afghari (2014, 91) إلى أن مهارات الحکمة الاختباریة کما یعبر عنها فی تلک الدراسة باستراتیجیات أداء الاختبار تفسر حوالی 18% من التباین فی درجات طلاب الدراسات العلیا فی اختبار الفهم القرائی فی اللغة الإنجلیزیة بجانب الکفاءة اللغویة، وهو ما تم اعتباره دلیلاً على عدم صدق درجات الاختبار فی التعبیر عن الکفاءة اللغویة، وأشارت الدراسة إلى أن استراتیجیات أداء الاختبار یمکن اعتبارها من أهم مصادر خطأ القیاس التی لا یمکن تجاهلها فی تفسیر نتائج القیاس؛ بل وفسرت دراسة دیانا حماد (2010) عدم وجود علاقات دالة إحصائیاً بین الحکمة الاختباریة والتحصیل بأن ذلک راجع لجودة بناء الاختبار وفق نموذج راش وهو ما أسهم فی الحد من تأثیر الحکمة الاختباریة، وهو ما یؤکد صراحة على أن الحکمة الاختباریة أمر یجب الحد من تأثیره على درجات الأفراد فی الاختبار؛ على عکس ما هو شائع فی البحوث والدراسات ذات الصلة؛ وأشارت لنفس النتائج تقریبا دراسة Rogers and Harley (1999) فی تفسیرها لممیزات الاعتماد على ثلاثة بدائل بدلاً من أربعة بدائل فی أسئلة الاختیار من متعدد بأن الاعتماد على ثلاثة بدائل یقلل من تأثیر الحکمة الاختباریة.

وتوصلت لنفس النتیجة السابقة تقریباً دراسة سعود العنزی (2014) بأنه لیست هناک علاقة بین مهارات الحکمة الاختباریة والتحصیل فی الاختبارات التی یُعدها المرکز الوطنی للقیاس والتقویم بالمملکة العربیة السعودیة وأن طبیعة هذه الاختبارات وطریقة البناء المحکم لها لا تتیح الفرصة للطلاب للاستفادة من خصائص الاختبار وصیاغاته للتعرف على الإجابة الصحیحة دون معرفة.

ویتأکد من ذلک أن الحکمة الاختباریة قد تسهم فی أن یحصل بعض الطلاب على درجات غیر مستحقة نتیجة للاستفادة من بعض الأخطاء المرتبطة ببناء الاختبار والتخمین الذکی، وهو ما یترتب علیه عدم صدق الدرجات فی التعبیر عن المستوى الحقیقی للسمة.

         بل وتذکر فاطمة مطلک (2009، 569) أن اکتساب استراتیجیات الحکمة الاختباریة من شأنه إتاحة الفرصة للتلامیذ أن یجیبوا عن بعض الأسئلة الامتحانیة التی لیس لدیهم معرفة عنها؛ وهو ما یتنافى مع فکرة صدق الاختبار والعدالة فی تقدیر السمة والحد من مشکلة تحیز الاختبار؛ وکذلک تتضح المشکلة فی مفهوم الحکمة الاختباریة من التعریف الذی وضعه جیب Gibb فی عام 1964 بأن الحکمة الاختباریة هی قدرة المفحوص على الإجابة الصحیحة عن بعض المفردات اعتماداً على أدلة خارجیة من أجل الحصول على درجة أعلى دون معرفة حقیقیة بموضوع الاختبار (زین ردادی، 2001، 5)؛ ویذکر إیاد حمادنة (2011، 293) أن عدم معرفة بانی الاختبار بالأسس الصحیحة لبناء الاختبار یسهم فی زیادة تأثیر استراتیجیات حکمة الاختبار، حیث یستفید بعض الطلاب فی هذه الحالة من الثغرات فی بناء الأسئلة فی معرفة الإجابة الصحیحة.

وبالتالی الدرجة الإضافیة التی یحصل علیها أصحاب الحکمة الاختباریة بجانب الدرجات المتوقعة والراجعة لمستوى السمة الفعلی لا تعکس تحصیلاً أفضل وإنما تعتبر من أنوع خطأ القیاس؛ وهو ما دعا الاتحاد الکندی للمعلمین فی 1999 إلى اعتبار أن مهارات أداء الاختبار کمرادف للحکمة الاختباریة من المهارات غیر الأخلاقیة والتی یجب تدریب الطلاب على تجنب استخدامها (Volante, 2006, 133)؛ ویری Banks and Eaton (2014, 212) أنه یجب الانتقال من ثقافة الامتحان إلى ثقافة التقویم والتی تؤکد على مفهوم التقویم الأصیل لمعارف الطالب ومهاراته وحتى نصل إلى هذه المرحلة یجب أن تکون مهارات واستراتیجیات أداء الاختبار جزء مکمل للممارسات التدریسیة للحد من التحیز الناتج عن الفروق فی هذه الاستراتیجیات.

ووجهة النظر السابقة تؤکد الخطر الذی یسببه اللجوء إلی الحکمة الاختباریة على صدق درجات الاختبار فی التعبیر عن المستوى الحقیقی للسمة موضوع القیاس، وهناک وجهة نظر أخرى على عکس وجهة النظر السابقة تؤکد على الخطر الذی یسببه غیاب مثل هذه الاستراتیجیات على مستوى أداء الفرد فی الاختبار حیث یسبب النقص فی هذه الاستراتیجیات تدنی فی مستوى درجات بعض الطلاب وعدم تعبیرها عن المستوى الحقیقی للسمة فی بعض الأحیان، وذلک لسببین یتمثل الأول فی ظهور فروق بین الممتحنین لا ترتبط بالفروق الحقیقیة فی السمة وإنما ترتبط بالفروق فی الاستراتیجیات والمهارات التی یلجأ لها بعض الأفراد أثناء الأداء فی الاختبار هذا من جهة ومن جهة أخرى یتمثل السبب الثانی فی أن عدم توافر هذه الاستراتیجیات لدى الفرد قد یعوق إظهاره لمستوى معرفته الحقیقیة فی الاختبار وعدم قدرته على البرهنة على الإتقان.   

وفی هذا الصدد یؤکد السید أبوهاشم (2008، 215) أنه یجب ألا یفهم أبداً أن امتلاک مهارات الحکمة الاختباریة وحده یکون کافیاً لکی ینجح الطالب دون استعداد جید للاختبار فهذه المهارات تساعد فی الحصول على أقصى درجة تسمح بها معلومات الفرد ودرجة استعداداه للاختبار؛ وفی مراجعة زین ردادی (2001، 11) للدراسات التی تناولت الحکمة الاختباریة أشار إلى أن بعض الدراسات أکدت على أن فاعلیة استخدام الحکمة الاختباریة مرتبط بالمعرفة موضوع الاختبار وعلق الباحث على هذه النتیجة بأنها متعارضه مع مفهوم الحکمة الاختباریة والذی یؤکد على أنها مستقلة عن محتوى الاختبار وفسر ذلک بأن الطالب المتفوق هو الذی یستطیع الاستفادة من هذه المهارات أکثر من غیره، وهو ما یؤکد مرة أخرى على أن مهارات الحکمة الاختباریة لیست مجرد الاستفادة من قدرات الطالب ومهاراته فی الحصول على درجات غیر مستحقة، وأن هذه المهارات غیر مستقلة عن المعرفة بمحتوى الاختبار؛ ویتفق ذلک مع ما أکد علیه Rogers and Harley (1999, 235) بأن فاعلیة الحکمة الاختباریة مرتبطة بالمعرفة الجزئیة بالإجابة المطلوبة للبند فی حالة عدم التیقن من الإجابة.

استراتیجیات أداء الاختبار والحکمة الاختباریة بمعناه الشامل:

وفی محاولة لتحدیث مفهوم الحکمة الاختباریة لیدل على البنیة المقصودة بمعناها الشامل اقترح Nguyen (2003, 25-28) النموذج التالی الذی یوضح بصورة قاطعة علاقة استراتیجیات أداء الاختبار بالحکمة الاختباریة بمعناه الشامل ولیس المعنى الشائع فی الدراسات السابقة والذی یتضح من الشکل التالی: 

الحکمة الاختباریة

قبل الاختبار

أثناء الاختبار

   

 

 

 

 

  

شکل (1): استراتیجیات أداء الاختبار کمکون من مکونات الحکمة الاختباریة (Nguyen, 2003, 27)

وفی هذا النموذج تعتبر استراتیجیات أداء الاختبار مکون من مکونات الحکمة الاختباریة بمعناها الشامل والذی یصف توظیف الممتحن لکل جهوده للوصول لأقصى أداء ممکن، وفی مرحلة ما قبل الاختبار یؤکد النموذج أهمیة تعلیم هذه الاستراتیجیات والتدریب على استخدامها أثناء الاختبار.

أما أثناء الاختبار فتظهر استراتیجیات أداء الاختبار فی قراءة الطالب لکل الخیارات قبل الإجابة عن أسئلة الاختیار من متعدد، وتقریر الإجابة الصحیحة قبل قراءة الخیارات المعروضة واستبعاد الإجابات الخاطئة أثناء الاختیار وقراءة جمیع الأسئلة قبل البدء فی الإجابة، وکذلک تکوین توقعات عن الأسئلة المحتملة والتدریب على الإجابة، والبحث عن الإجابات الإضافیة، ویمیز الکلمات المفتاحیة ویقوم بعمل المخططات والرسومات التوضیحیة إن کان ذلک ممکناً (Holzer et al., 2009, 44; Ghafournia & Afghari, 2014, 90).

کذلک من یستخدمون استراتیجیات أداء الاختبار یقومون بقراءة التعلیمات والتخطیط وفهم السؤال جیداً وتأخیر الإجابة عن الأسئلة الصعبة أو غیر المفهومة (Arsal, 2014, 307)؛ فمن أهم خصائص هذه الاستراتیجیات الوعی والهدف، بمعنى وعی مؤدی الاختبار بها وبکیفیة تطبیقها والهدف من تطبیقها (Takallou et al., 2016, 178)؛ ویؤکد زین ردادی (2001، 25) فی تفسیر الفروق بین الطلاب العادیین والمتفوقین فی مهارات الحکمة الاختباریة بأن الطلاب المتفوقین یتمیزون بالمهارات المتعلقة بالتعامل مع ورقة الإجابة حیث أنهم لا یُضیعون الکثیر من الوقت فی قراءة الأسئلة ویرکزون جهودهم فی کیفیة عرض المعلومة التی لدیهم بطریقة منظمة ومرتبة ومنطقیة، وهو ما یؤکد أن استراتیجیات أداء الاختبار ترتبط أکثر بطریقة الأداء.

ویتفق الباحث الحالی مع وجهة النظر التی ترى أن استراتیجیات أداء الاختبار من أهم المتغیرات التی یساعد امتلاکها على إظهار الطالب لدرجته الحقیقیة فی السمة وذلک من خلال بذل الجهد الکافی للوصول للإجابة الصحیحة وعرض الإجابات بالطریقة التی تؤکد وتبرهن معرفته بالمطلوب من أسئلة الاختبار، فهی تساعد الطالب على الوصول لأقصى درجة ممکنه تأهله لها معارفه ومهاراته المرتبطة بمحتوى الاختبار؛ ولذا یؤکد Bicak (2013, 279) أننا بحاجة للترکیز على هذه الاستراتیجیات لتحسین الأداء فی الاختبارات.

ویمکن اعتبار استراتیجیات أداء الاختبار تمثل الجانب الإجرائی للحکمة الاختباریة، ولا تعنى حصول الطالب على درجات غیر مستحقة أو أن درجة الطالب لا تعبر عن المستوى الحقیقی للسمة المقاسة، بل على العکس من ذلک فهذه الاستراتیجیات تساعد الطالب على إظهار مستواه الحقیقی فی السمة وذلک بمساعدته على تنظیم الإجابة والبرهنة على امتلاکه للمعلومات والمهارات المطلوبة والتحلیل العمیق لما هو مطلوب فی السؤال وخاصة الأسئلة المرکبة والجدیدة والحد من التأثیر السلبی لقلق الاختبار، فهی بمثابة التخطیط للأداء الجید فی الاختبار، وتطبیق مهارات ما وراء المعرفة لتحقیق الفرد لأهدافه التی یسعى لتحقیقها من الاختبار.  

أهمیة استراتیجیات أداء الاختبار:

أکدت معظم الدراسات التی تناولت علاقة استراتیجیات أداء الاختبار بمستوى ونتائج الاختبار إلى تأکید العلاقة الإیجابیة بینهما (Orth, 1995; Parham, 1996;  Hong et al., 2006; Eme & Udoh, 2011)؛ ولذا فهناک تأکیدات على أهمیة تدریس هذه الاستراتیجیات للمتعلمین وتدریبهم على استخدامها حتى یتم اتقانها وتطبیقها بدقة أثناء الموقف الاختباری (Blerkom, 2009, 174)؛ ولا یعتبر امتلاک الطلاب لهذه الاستراتیجیات شرطاً کافیاً لاستخدامها وتطبیقها فی الموقف الاختباری وإنما یتوقف کذلک على المتغیرات الدافعیة والتی من أهمها الفاعلیة الذاتیة (Bicak, 2013, 280)؛ بل ویقترحBanks and Eaton (2014, 212) أنه یجب أن تکون مهارات واستراتیجیات أداء الاختبار جزء مکمل للمنهج الدراسی حتى تصبح بمثابة عادات یلجأ لها الفرد أثناء الموقف الاختباری.

وهذه الاستراتیجیات منها ما یتمیز بإمکانیة تطبیقها فی مدى واسع من الموضوعات والاختبارات والشروط والإجراءات بل ویمکن أن یستفید منها الفرد فی حیاته العملیة کالقدرة على إدارة الوقت بفاعلیة ووضع الأهداف والتخطیط والعمل بجد ودقة وسرعة وإیجاد الأدلة للبرهنة على صحة الأفکار والمعلومات، وهناک من یعتبر أن امتلاک الطالب لهذه الاستراتیجیات والمهارات لا یقل أهمیة عن امتلاکه للمعرفة والمهارات المطلوبة للإجابة عن أسئلة الاختبار نظراً لدورها فی مساعدة الطالب على الأداء الجید فی الاختبار وبالتالی تحقیق مستوى مرتفع من الإنجاز الأکادیمی(Dodeen et al., 2014, 1,3)؛ کذلک ترتبط استراتیجیات أداء الاختبار بالتعامل مع الانفعالات السلبیة والتی منها القلق فی الموقف الاختباری والذی ینخفض بالتدریب على استراتیجیات أداء الاختبار (Hong et al., 2006, 145).

ویؤکد على ذلک Dodeen (2009, 32) بأن تلک الاستراتیجیات تساعد الطالب من خلال الاستخدام الجید لمعارفه ووقت الاختبار والجهد المبذول فی الإجابة على أسئلة الاختبار وفی نفس الوقت تحسن اتجاهات الطلاب نحو الاختبارات ونحو التعلم بصفة عامة؛ وکذلک یشیر Dodeen (2008, 410) إلى أن تلک الاستراتیجیات تمیز الطلاب الذین یستطیعون الأداء على الاختبار بطریقة أفضل من زملائهم من نفس مستوى القدرة فهؤلاء الطلاب یمتلکون استراتیجیات أو مهارات تساعدهم على الأداء الجید فی الاختبار، حیث یتمیز هؤلاء بمعرفة ما یجب فعله قبل وأثناء وبعد الاختبار.

ویشیر Orth (1995, 6) ; Banks and Eaton (2014, 207) إلى أن نقص استراتیجیات أداء الاختبار یحرم الطالب من الحصول على درجات مستحقة فی الاختبار وهو ما یترتب على فقدانهم للطریقة السلیمة فی الإجابة على الاختبار والتعامل مع أسئلته؛ فالأداء الجید على الاختبارات یحتاج من المشارکین الجدیة فی الأداء وبذل الجهد الکافی للإجابة عن أسئلته وفی حالة عدم توافر ذلک فإن درجات الطلاب فی الاختبار لا تعکس مستواهم الحقیقی فی السمة موضوع القیاس.

استراتیجیات أداء الاختبار فی البحث الحالی:

اعتمدت العدید من الدراسات الأجنبیة فی تصنیفها لاستراتیجیات أداء الاختبار على تصنیف مهارات الحکمیة الاختباریة کما أشار إلیه میلمان وبیشوب وإبل Millman, Bishop and Ebel فی 1965؛ وظهرت العدید من استراتیجیات أداء الاختبار فی تصنیف مهارات الحکمة الاختباریة کاستراتیجیات التعامل مع ورقة الأسئلة والتعامل مع ورقة الإجابة والمراجعة وإدارة وقت الاختبار والتعامل مع صیغ الأسئلة المختلفة ووضع خطة الحل             (زین ردادی، 2001، 6-7؛ مجدی الشحات، 2007، 20؛ دیانا حماد، 2010، 302-304؛ فاطمة مطلک، 2009، 572-573 ؛ السید أبوهاشم، 2008، 226-227؛ سعود العنزی، 2014، 342).

وینظر لاستراتیجیات أداء الاختبار باعتبارها الاستراتیجیات التی تمکن الطالب من عمل خطة للإجابة عن الاختبار وتنظیم الوقت بحکمة والاستعداد العقلی للموقف الاختباری وقراءة التعلیمات والتوجیهات بدقة وقراءة أسئلة الاختبار بعنایة وتذکر المعلومات التی تم استذکارها واستبعاد المعلومات المشتتة والقراءة العامة لأسئلة الاختبار لتحدید الأسئلة المعروف اجابتها وتأخیر الإجابة عن الأسئلة غیر المعروفة والتخمین الذکی لإجابة الأسئلة غیر المعروفة والمراجعة النهائیة لاکتشاف الأسئلة التی لم یجاب عنها أو أُجیب عنها إجابات خاطئة (Lancaster et al., 2009, 166)؛ وأشارت دراسة Bicak (2013) إلى أن استراتیجیات أداء الاختبار تتمثل فی استراتیجیة تحلیل البنود واستراتیجیة تخطیط الوقت، واستراتیجیة توقع الاختیار، واستراتیجیة ما بعد الاختبار، والاستراتیجیات الاجتماعیة.

وصنفت دراسة إیاد حمادنه (2011، 294) استراتیجیات حکمة الاختبار فی ثلاثة مجالات رئیسیة تتمثل فی استراتیجیات تستخدم قبل البدء فی الإجابة ومنها قراءة جمیع الأسئلة والبدء بالسؤال الأسهل، واستراتیجیات تستخدم خلال الإجابة على الاختبار ومنها استغلال الوقت وتجنب أخطاء التخمین واستراتیجیات تستخدم بعد الانتهاء من الإجابة ومنها إعادة قراءة جمیع الأسئلة للتأکد من فهمها بشکل صحیح وکذلک مراجعة الإجابات؛ بینما افترضت دراسة Dodeen (2008); Arsal (2014) أن استراتیجیات أداء الاختبار تتمثل فی مهارات ما قبل الاختبار، وإدارة الوقت، وأثناء الاختبار، وبعد الاختبار.

وباستقراء الدراسات السابقة والاستراتیجیات التی تم افتراضها سواء عند استخدام مفهوم الحکمة الاختباریة أو استراتیجیات أداء الاختبار وبصفة خاصة الاستراتیجیات التی یتم تطبیقها فعلا أثناء الاختبار، یتبنى البحث الحالی مجموعة من الاستراتیجیات التی أکدت علیها الدراسات السابقة والتی تناسب المواقف الاختباریة المختلفة بغض النظر عن نوعیة أسئلة الاختبار، حیث أن هناک من یفترض أن معظم الاستراتیجیات التی فرضت تحت مظلة الحکمة الاختباریة بمفهومها التقلیدی استراتیجیات تناسب أسئلة الاختیار من متعدد فقط ولیست استراتیجیات عامة (Crocker, 2006, 116; Takallou et al., 2015, 120) وهذه الاستراتیجیات هی:

1-      استراتیجیة تخطیط وتنظیم وقت الإجابة:

وهذه الاستراتیجیة أکدت علیها معظم نماذج الحکمة الاختباریة تحت مسمى مهارات استخدام الوقت والتی تتمثل فی البدء فی الإجابة بأسرع وقت ممکن مع الحرص على الاتقان ووضع جدول زمنى للإجابة والإجابة عن الأسئلة السهلة أولاً وتأجیل الإجابة عن الأسئلة الصعبة مع محاولة استغلال ما یتبقى من وقت الاختبار فی المراجعة (إیاد حمادنة، 2011، 293؛ عفاف وادی، 2013، 300)؛ وفی دراسة Hong et al. (2006) ودراسة Stenlund et al. (2016, 10) تم تسمیة استراتیجیة تخطیط وتنظیم وقت الإجابة باستراتیجیة التنظیم البنائی  Structural Organizationوتضمنت استراتیجیات تنظیم الوقت وتوزیع الوقت فی ضوء الصعوبة وطول الإجابة وترتیب الإجابة حسب مستوى الصعوبة؛ وفی حالة الأسئلة المقالیة یفید جداً فی تنظیم وقت الإجابة أخذ الدرجات المخصصة لکل سؤال بعین الاعتبار (Blerkom, 2009, 170) .

وتظهر هذه الاستراتیجیة فی تحدید وقت الإجابة لکل سؤال حسب الدرجة المخصصة له وعدم تعدیة الوقت المخصص للسؤال بقدر الإمکان وتجنب إضاعة الوقت فی إجابة سؤال سهل أو درجته أقل وترک وقت للمراجعة وعدم ترک الاختبار قبل انتهاء الوقت (زین ردادی، 2001، 8)؛ وتم فی بعض الدراسات اعتبار المراجعة استراتیجیة منفصلة لاستراتیجیات أداء الاختبار أو الحکمة الاختباریة کما هو فی دراسة السید أبوهاشم (2008، 227) ولکن فی أغلب الدراسات تم اعتبارها ضمن استراتیجیة إدارة وتنظیم وقت الاختبار.

2-   استراتیجیة تخطیط وتنظیم الإجابة:

وهذه الاستراتیجیة من أهم استراتیجیات الأداء فی الاختبارات المقالیة والتی تحتاج لتنظیم أفضل للإجابة ووضوح ومنطقیة فیما یتم کتابته وهنا قد یحدد الفرد فی البدایة النقاط الرئیسیة للإجابة ثم یبدأ فی تفصیل تلک النقاط (Blerkom, 2009, 170)؛ کذلک هناک بعض الاستراتیجیات التی ظهرت فی نماذج الحکمة الاختباریة وتقترب فی المعنی والهدف من هذه الاستراتیجیة مثل استراتیجیة تجنب الخطأ والتی یتم فیها ترکیز الانتباه أثناء الإجابة لتجنب الخطأ وذلک بالانتباه للتعلیمات وقراءة الأسئلة جیداً واستیضاح الغموض ومراجعة الإجابات.

ویسمی السید أبوهاشم (2008، 226) هذه الاستراتیجیة بالتعامل مع ورقة الإجابة والتی تتمثل فی التفکیر فی الإجابة لبعض ثوانی وتجهیزها ذهنیاً قبل کتابتها وتقدیم أفضل إجابة ممکنة والاهتمام بعرض عناصر الإجابة فی تسلسل منطقی وتجنب التوریة والشطب أثناء الإجابة وتخصیص صفحات معینة لکل سؤال حسب کم الإجابة.

وتظهر هذه الاستراتیجیة فی محاولة بدایة إجابة کل سؤال فی صفحة جدیدة وکتابة رقم السؤال ورأس السؤال أعلى الصفحة ووضع خطاً تحته وإجابة السؤال فی حدود المطلوب وتحدید الأفکار الرئیسیة المطلوبة فی السؤال ووضع خطوط تحت الکلمات المهمة فی الإجابة، وتحدید الأفکار الرئیسیة وإبرازها والاهتمام بطریقة عرض الإجابة (زین ردادی، 2001، 8).    

3-   استراتیجیة تحلیل الأسئلة:

وسمیت هذه الاستراتیجیة فی بعض الدراسات بمهارات التعامل مع ورقة الأسئلة کما فی دراسة السید أبوهاشم (2008، 226) والتی تتمثل فی قراءة التعلیمات بعنایة وفهمها جیداً، وتکوین فکرة عامة عن جمیع الأسئلة بقراءتها قبل البدء فی الإجابة وتحدید الکلمات الهامة فی السؤال وإعادة قراءة السؤال أکثر من مرة للتأکد من المطلوب.

وکذلک تظهر هذه الاستراتیجیة فی الانتباه لأی تعلیمات فی السؤال مثل أجب باختصار أو بالتفصیل ومعرفة المطلوب بدقة وعدم الإجابة عن أسئلة غیر مطلوبة أو ترک أسئلة مطلوبة (زین ردادی، 2001، 8)؛ ففی هذه الاستراتیجیة یقوم الطلاب بوضع        خطوط أو دوائر حول المعلومات المهمة فی السؤال، وربما یسجل بعض المعلومات  الإضافیة حول السؤال قبل الإجابة علیه لفهمه جیداً، وتسجیل مفاتیح للإجابة عن السؤال       أثناء قراءة السؤال، ووضع علامات على الأسئلة التی لا یستطیع الإجابة علیها،             (Kim & Goetz, 1993, 212).

4- استراتیجیة الضبط والسیطرة:

وهذه الاستراتیجیة ظهرت فی معظم الدراسات التی تناولت استراتیجیات ومهارات الأداء فی الموقف الاختباری وکذلک الدراسات التی تناولت مهارات الحکمة الاختباریة وسمیت فی بعض الأحیان باستراتیجیة ضبط قلق الاختبار (Chittooran & Doroyhy, 2001, 17)؛ وفی بعض الأحیان سمیت باستراتیجیة خفض قلق الاختبار وزیادة الثقة (Stenlund et al., 2016, 5).

وتظهر فی قدرة الفرد على تغییر وضبط أفکاره السلبیة ومعتقداته واتجاهاته عن الکفاءة والسلوک ویمکن تحسین هذه الاستراتیجیة عن طریق الإعداد الجید للاختبار وزیادة دافعیة أداء الاختبار والتنظیم الذاتی؛ فالقدر القلیل من قلق الاختبار قد یعمل على زیادة دافعیة الطلاب وتشجیعهم على بذل الجهد بینما زیادة قلق الاختبار قد یشتت الطالب ویعوق أداؤه الجید فی الاختبار وإذا زاد قلق الاختبار بدرجة کبیرة فإن ذلک یعمل على خفض تقدیر الذات ونقص معدل التحصیل والفشل فی کثیر من الأحیان والاتجاهات السلبیة نحو الدراسة والمشاعر السلبیة والتعصب ولا یتوقف ذلک على عمر معین(Banks & Eaton, 2014, 9).

ویضیف Volante (2006, 134-135) أن هذه الاستراتیجیة تسهم فی تحسین صدق الاختبار الناتج عن تحسن الأداء فی الاختبار، وهذه الاستراتیجیة یجب الاهتمام بتدریب الطلاب علیها؛ وأکدت دراسة Nguyen (2003) على هذه الاستراتیجیة کاستراتیجیة لأداء الاختبار تحت مسمى الضبط والسیطرة والذی یعبر عن قدرة الممتحن على إبعاد أی مؤثرات سلبیة قد تؤثر على جودة الأداء فی الاختبار، ویسمى السید أبوهاشم (2008، 225) هذه الاستراتیجیة بمهارات الضبط النفسی وتتضمن مهارات استخدام أسالیب الاسترخاء والتفکیر الإیجابی والقدرة على إحکام الذات عند تناول الاختبار والتعبیر عن المشاعر والانفعالات من خلال الحدیث للزملاء عن مشاعر القلق تجاه الاختبار لکی یتم التخلص منها.

5-    استراتیجیة ما بعد الاختبار:

وهنا یحاول الفرد الاستفادة من تقییم أداؤه بعد الاختبار لتحسین طرق الاستعداد للاختبارات المقبلة بناءً على نتیجة الأداء فی الاختبار الحالی والتغذیة المرتدة عن جودة أدائه فیه (Stenlund et al., 2016, 5).

وهنا یکون للمراقبة الذاتیة کاستراتیجیة ضمن استراتیجیات ما وراء المعرفة أهمیة کبیرة فی تحسین الأداء والاستعداد للاختبارات القادمة بصفة خاصة، حیث تسهم فی تحلیل الطالب لاستراتیجیاته المستخدمة فی أداء الاختبار وکیفیة الإعداد للاختبار واستراتیجیات الاستذکار التی یعتمد علیها، وهو ما یسهم بالتالی فی زیادة وعی الفرد باستراتیجیات أداء الاختبار والتخطیط لاستخدامها فی الاختبارات المستقبلیة وهو ما یمکنه من التغلب على العقبات التی یواجهها أثناء الأداء فی الاختبار (Hong et al., 2006, 145).

وهذا التصنیف لاستراتیجیات أداء الاختبار یتفق مع تأکید العدید من الدراسات السابقة بأن أفضل تصنیفات استراتیجیات أداء الاختبار هو الذی یتم فیه الاهتمام بالاستراتیجیات المستخدمة قبل البدء فی الإجابة والاستراتیجیات المستخدمة أثناء الإجابة والاستراتیجیات المستخدمة بعد الانتهاء من الاستجابة (إیاد حمادنة، 2011، 299؛ Amer, 2007, 4-5).

ثانیاً: الخصائص السیکومتریة للاختبار وبنوده:

          یشیر جابر عبدالله (2014، 129)؛ هدى العریفی (2008، 5)؛ إبراهیم یعقوب وباسل أبوفودة، (2012، 427)؛ عصام الجبة (2012، 151)؛ مایسة أبومسلم (2016، 160) أن أهم الخصائص السیکومتریة للاختبار تتمثل فی معاملات الصعوبة ومعاملات التمییز لمفرداته وثبات وصدق الاختبار.

-        صعوبة المفردة Item Difficulty:

یشیر صلاح علام (2012، 113) إلى أن صعوبة المفردة یرتبط بعدد الإجابات الصحیحة على المفردة وأنه کلما زاد هذا العدد زادت سهولة المفردة، ونسبة الطلاب الذین أجابوا إجابة صحیحة على المفردة إلى العدد الکلی للطلاب هو ما یعبر عن معامل أو مؤشر الصعوبة Difficulty Index، وبالتالی الزیادة فی معامل الصعوبة یعبر عن زیادة       سهولة المفردة.

-        تمییز المفردة Item Discrimination:

   یعبر تمییز المفردة عن قدرة المفردة على التمییز بین الطلاب ذوی المستویات المختلفة فی السمة، وتتراوح معاملات تمییز المفردات ما بین (-1، +1) ویعتبر تمییز المفردة منخفضاً إذا قل عن 0.2 وعندما یساوی معامل التمییز صفراً دل ذلک على انعدام قدرة المفرد على التمییز وعندما یساوی معامل التمییز الواحد الصحیح تکون المفردة ممیزة تماماً (صلاح علام، 2012، 113)؛ ومن الناحیة العملیة یصعب جداً الوصول إلى معاملات تمییز تامة، وإذا کانت معاملات التمییز بإشارة سالبة فهذا یعنى أن المفردة تمییز بطریقة عکسیة وهو ما یعبر عن خلل فیها ویجب حذفها من الاختبار (جابر عبدالله، 2014، 142؛ Orth, 1995, 73).

          ویتم استخدام معامل الارتباط الثنائی الأصیل فی حساب معامل تمییز المفردة، وذلک بحساب معامل الارتباط بین درجات الطلاب مرتفعی ومنخفضی الأداء فی الاختبار على المفردة ودرجاتهم الکلیة على الاختبار، وهو ما یشیر إلى ما إذا کان ذوی القدرة الأعلى قد أجابوا إجابة صحیحة على المفردة أکثر من ذوی القدرة الأدنى (Liao, Hatrak & Yu, 2010, 6)، ویمکن اعتباره کذلک بمثابة الفرق بین معاملی صعوبة المفردة لدى مجموعتی طلاب الإرباعی الأعلى والأدنى فی الدرجات الکلیة على الاختبار (عصام الجبة، 2012، 151، 156).

-        صدق الاختبار: Test Validity

          یؤکد صلاح علام (2006، 39) أن الصدق یعبر عن مدى استفادتنا من درجات الطلاب فی اختبار أو مقیاس نفسی أو تربوی فی اتخاذ قرارات مناسبة تتعلق بموقف ما بقدر کبیر من الثقة؛ ویعبر الصدق عن قیاس الاختبار لما وضع لقیاسه بالفعل، وبصفة عامة یصنف الصدق إلى صدق المحتوى والصدق المرتبط بالمحکات وصدق البناء (Domino & Domino, 2006, 52)؛ ویذکر Colliver, Conlee and Verhulst (2012, 367) أن هذا المفهوم للصدق المتعلق بأن الاختبار الصادق هو الذی یقیس ما وضع لقیاسه بالفعل یعتبر المفهوم التقلیدی للصدق والذی یؤکد على أن الصدق خاصیة للاختبار ومدى دقته فی قیاس البنیة المستهدفة، وفی الوقت الحالی وفی ضوء التوجیهات الصادرة من الجمعیة الأمریکیة لعلم النفس APA حدثت تحولات فی المفهوم لیعبر عن صدق التنبؤات المبنیة على الدرجات وتفسیراتها ومدى الاستفادة منها من الناحیة التطبیقیة، ولذلک أصبح المفهوم الأکثر مناسبة فی الوقت الحالی صدق درجات الاختبار ولیس صدق الاختبار.

          وحالیاً تشیر معاییر الاختبارات الصادرة عن الهیئات العالمیة المرتبطة بالقیاس التربوی مثل الجمعیة الأمریکیة لعلم النفس والجمعیة الأمریکیة للبحوث التربویة والمجلس الوطنی الأمریکی للقیاس التربوی إلى أن هناک خمسة مصادر للبرهنة على الصدق تتمثل فی الأدلة المعتمدة على محتوى الاختبار والأدلة المعتمدة على الاتساق الداخلی والأدلة المعتمدة على العلاقة بمتغیرات أخرى والأدلة المعتمدة على عملیات الاستجابة والأدلة المعتمدة على توابع عملیة الاختبار والأخیرة تشیر إلى التأکد من الصدق فی ضوء الاستفادة من نتائج عملیة القیاس وما یترتب علیها من قرارات مرتبطة بقدر کبیر من الثقة (Johnson & Arnold, 2004, 267; Cizek, Bowen & Church, 2010, 2).    

          وفی البحث الحالی تم الاعتماد على الصدق التلازمی والذی یعبر عن الارتباط بین درجات الطلاب فی الاختبار ودرجاتهم فی محک ملازم له والذی یتمثل فی درجاتهم فی الاختبار النهائی لنفس المقرر، وعلى الصدق التنبؤی والمتمثل فی علاقة درجات الطلاب فی الاختبار بدرجاتهم فی باقی المقررات کما یعبر عنها بمعدلاتهم الأکادیمیة فی دراسة تأثیر استراتیجیات أداء الاختبار على صدق الاختبار، ویمکن اعتبار الصدق التلازمی والصدق التنبؤی ضمن الأدلة المعتمدة على علاقة درجات الاختبار بمتغیرات أخرى وکذلک ضمن الأدلة المعتمدة على توابع الاختبار فی تقویم صدق الاختبار.

-        ثبات الاختبار: Test Reliability

          یشیر صلاح علام (2006، 88، 89) إلى أن ثبات الاختبار یعبر عن اتساق درجات الاختبارات والمقاییس لمجموعة معینة من الأفراد، ویکون باتساق الدرجات عبر الزمن أو اتساق صیغ مختلفة من نفس الاختبار أو اتساق بین مفردات الاختبار أو الاتساق عبر أفراد مختبرین ومصححین مختلفین، وهی خاصیة للدرجات أو النتائج ولیست للاختبار نفسه؛ وفی ضوء فکرة أن ثبات الاختبار هو عبارة عن نسبة التباین الحقیقی للتباین الکلی للدرجات (Blerkom, 2009, 204) فإن ثبات الاختبار یزداد کلما اقتربت الدرجات الملاحظة للأفراد من درجاتهم الحقیقیة فی السمة.

          ویشیر Blerkom, (2009, 48) إلى أن ثبات الاتساق الداخلی یعد من أفضل طرق التأکد من ثبات الاختبارات مقارنة بثبات إعادة التطبیق أو الصور المتکافئة، ویعبر الثبات هنا عن الاتساق بین البنود فی قیاس نفس البنیة المستهدف قیاسها، ویمکن التأکد من الثبات فی هذه الحالة باستخدام التجزئة النصفیة کبدیل للصور المتکافئة أو باستخدام أحد معادلات الاتساق الداخلی کمعادلة  کیودر وریتشاردسون KR-20 فی حالة البنود ثنائیة الإجابة       أو الصورة العامة لهذه المعادلة باستخدام معامل ثبات ألفا کرونباخ، وفی البحث الحالی       تم الاعتماد على معادلة کیودر وریتشاردسون KR-20 فی دراسة تأثیر استراتیجیات أداء الاختبار على ثباته حیث أن جمیع أسئلة الاختبار التحصیلی المستخدم فی البحث الحالی  ثنائیة الاستجابة.

-        الخطأ المعیاری للقیاس: Standard Error of Measurement (SEM)

وهو من المؤشرات العامة لجودة الاختبار ویعبر عن الانحراف المعیاری للدرجات الممثلة لدرجة الخطأ فی الدرجات الملاحظة للأفراد وکلما انخفضت قیمة الخطأ المعیاری کلما کانت الدرجات الملاحظة تعبر عن الدرجة الحقیقیة بدرجة أکبر من الدقة؛ ویذکر Blerkom (2009, 204) أن هذا الخطأ ممکن یستدل علیه بمعلومیة الانحراف المعیاری للدرجات الملاحظة وثبات الاختبار من خلال العلاقة التالیة:

معادلة (1) ...................................

وبالتالی کلما قل الانحراف المعیاری للدرجات وزاد ثبات الاختبار کلما قل الخطأ المعیاری للقیاس، فالخطأ المعیاری للقیاس یعبر عن مقدار الاختلاف الممکن فی درجات الاختبار والراجع لتأثیر المتغیرات العشوائیة، فهو متوسط الفروق بین درجات الأفراد فی الاختبار ومتوسط درجاتهم عند الأداء على الاختبار عدة مرات دون تحسن فعلی فی القدرة (Liao et al., 2010, 4).  

منهج البحث وإجراءاته:

منهج البحث:

استخدم فی الإجابة عن أسئلة البحث الحالی والتأکد من مدى صحة فروضه المنهج الوصفی بالاعتماد على العدید من الأسالیب الإحصائیة التی تم توضیحها عند الإجابة عن کل سؤال ومنها (المتوسطات والانحرافات المعیاریة، واختبار "ت" لعینة واحدة، ومعاملات الارتباط وتحلیل الانحدار، وتحلیل التباین أحادی الاتجاه، وتحلیل التباین للقیاسات المتکررة).

عینة البحث:

تکونت العینة الأساسیة فی البحث الحالی من 181 طالب من الطلاب الذکور بالدبلوم العام فی التربیة بالمقر الرئیسی فی جامعة القصیم بالمملکة العربیة السعودیة فی الفصل الدراسی الأول من العام الجامعی 1437/ 1438ه، 2016/2017م، تتراوح أعمارهم من 22 إلى 26 سنة بمتوسط عمر قدره 24.2 سنة وانحراف معیاری 1.9 سنة، من تخصصات مختلفة فی مرحلة البکالوریوس.       

أدوات البحث:

1-    مقیاس استراتیجیات أداء الاختبار:

تمت الاستفادة من الإطار النظری للبحث الحالی وکذلک المقاییس التی تم إعدادها فی بعض الدراسات السابقة فی تحدید أبعاد المقیاس الحالی وخاصة دراسة (عفاف وادی، 2013) والتی افترضت أن مهارات الحکمة الاختباریة تتضمن عدد من المهارات منها مهارة إدارة وقت الاختبار ومهارة تجنب الخطأ ومهارة التعامل مع ورقة الأسئلة ومهارة التعامل مع ورقة الإجابة ومهارة المراجعة؛ والمقیاس الذی تم إعداده فی دراسة Bicak (2013) والذی تضمن استراتیجیات أداء الاختبار المتمثلة فی استراتیجیة تحلیل البنود واستراتیجیة تخطیط الوقت، واستراتیجیة توقع الاختیار، واستراتیجیة ما بعد الاختبار، ومن المقیاس الذی تم إعداده فی دراسة Dodeen (2008) والذی اعتبر أن استراتیجیات أداء الاختبار تتمثل      فی مهارات ما قبل الاختبار، وإدارة الوقت، وأثناء الاختبار، وبعد الاختبار؛ وفی ضوء      ذلک تم إعداد المقیاس الحالی والذی تضمن فی صورته الأولیة 49 عبارة موزعة على       5 أبعاد فرعیة.

وتم تعدیل صیاغة عبارات المقیاس أکثر من مرة حتى وصلت لشکلها النهائی بعد عرض المقیاس فی صورته الأولیة على مجموعة من الزملاء بقسم علم النفس بکلیة التربیة جامعة القصیم، وتتم الاستجابة لعبارات المقیاس الحالی فی ضوء تدریج خماسی الاستجابة یبدأ بلا تنطبق علی أبداً، وینتهی بتنطبق علی دائماً لتقابل الدرجات (1، 2، 3، 4، 5) على الترتیب مع مراعات اتجاه العبارة؛ والجدول التالی یوضح توزیع عبارات المقیاس على استراتیجیات أداء الاختبار موضوع البحث الحالی:

جدول (1):

عبارات مقیاس استراتیجیات أداء الاختبار وتوزیعها على الأبعاد المختلفة للمقیاس

استراتیجیات أداء الاختبار

العبارات

أقل درجة

أعلى درجة

العدد

الموجبة

السلبیة

تخطیط وتنظیم وقت الاختبار

10

1-10

×××

10

50

تحلیل أسئلة الاختبار

13

11، 12، 14-23

13

13

65

تخطیط وتنظیم الإجابة

13

24-36

×××

13

65

الضبط والسیطرة

8

37-41

42، 43، 44

8

40

ما بعد الاختبار

5

45-49

×××

5

25

المجموع

49

45

4

49

245

وبعد التأکد من صدق المحتوی عن طریق عرض المقیاس على مجموعة من المحکمین تم تطبیقه على 35 طالباً من طلاب البکالوریوس بقسمی التربیة البدنیة والتربیة الخاصة، وتم التأکد من الصدق البنائی باستخدام التحلیل العاملی التوکیدی بالنسبة للأبعاد للتأکد من تشبعها على عامل کامن واحد هو استراتیجیات أداء الاختبار، فبعد أن تم تحدید النموذج البنائی للمقیاس تم استخدام برنامج Amos v.21.0 فی تقدیر معالم النموذج ومؤشرات جودة المطابقة له باستخدام طریقة الاحتمال الأقصى فکانت کما هی موضحة بجدول (2):

جدول (2):

مؤشرات جودة المطابقة للنموذج البنائی لمقیاس استراتیجیات أداء الاختبار

المؤشر

الحد الأقصى

χ2

مربع کای

6.181

عدم دلالة مربع کای أو النسبة بین مربع کای ودرجات الحریة أقل من 2

Df

درجات الحریة

5

χ2/df

النسبة بین مربع کای ودرجات الحریة

1.236

GFI

مؤشر جودة المطابقة

0.939

تزداد جودة المطابقة کلما اقترب المؤشر من الواحد الصحیح

AGFI

مؤشر جودة المطابقة المعدل

0.984

CFI

مؤشر المطابقة المقارن

0.991

IFI

مؤشر المطابقة المتزاید

0.992

NFI

مؤشر المطابقة المعیاری

0.958

RMSEA

جذر متوسط مربعات خطأ التقریب

0.028

تزداد جودة المطابقة باقتراب هذا المؤشر من الصفر

یتضح من جدول (2) أن النموذج المفترض للمقیاس یطابق بدرجة کبیرة بیانات العینة وهو ما یؤکد تشبع أبعاد المقیاس على متغیر کامن واحد هو استراتیجیات أداء الاختبار حیت کانت مربع کای غیر دالة إحصائیاً وکانت کذلک النسبة بین مربع کای ودرجات  الحریة أقل من (2) وکانت قیم (مؤشر حسن المطابقة GFI ومؤشر حسن المطابقة المعدل AGFI ومؤشر المطابقة المقارن CFI ومؤشر المطابقة المعیاری NFI ومؤشر المطابقة المتزاید IFI) جمیعها قیم مرتفعة وقریبة من الحد الأقصى لهذه المؤشرات (واحد صحیح)، وکذلک مؤشر جذر متوسط مربعات خطأ التقریب RMSEA کان أقل من 0.05 وهو ما یؤکد الصدق البنائی للمقیاس؛ والشکل التالی یوضح النموذج البنائی المفترض للمقیاس وتشبعات العوامل:

 

شکل (2): النموذج البنائی لمقیاس استراتیجیات أداء الاختبار

یتضح من الشکل السابق أن تشبع استراتیجیة تخطیط وتنظیم وقت الاختبار على المتغیر الکامن کان مساویاً 0.92، وتشبع استراتیجیة تحلیل أسئلة الاختبار مساویاً 0.86، وتشبع استراتیجیة تخطیط وتنظیم الإجابة مساویاً 0.81، وتشبع استراتیجیة الضبط والسیطرة مساویاً 0.96، وأخیراً کان تشبع استراتیجیة ما بعد الاختبار مساویاً 0.82، وهو ما یؤکد أن أبعاد المقیاس لها تشبعات مقبولة على المتغیر الکامن.

وتم التأکد من ثبات درجات المقیاس وأبعاده الفرعیة باستخدام معاملات ثبات ألفا کرونباخ فکانت کما هو موضح بجدول (3):

جدول (3):

معاملات ثبات مقیاس استراتیجیات أداء الاختبار وأبعاده الفرعیة

تخطیط وتنظیم وقت الاختبار

تحلیل أسئلة الاختبار

تخطیط وتنظیم الاجابة

الضبط والسیطرة

ما بعد الاختبار

المقیاس ککل

0.873

0.820

0.784

0.749

0.791

0.855

ومن جدول (3) یتضح أن للمقیاس وأبعاده الفرعیة معاملات ثبات مقبولة، ومما سبق یتأکد تمتع المقیاس بمؤشرات سیکومتریة (صدق، ثبات) جیدة، وهو ما یؤکد صلاحیته للاستخدام فی البحث الحالی.

2- اختبار تحصیلی فی مقرر القیاس والتقویم:

خطوات إعداد الاختبار التحصیلی:

-        تم تحدید الموضوعات التی سیتم تضمینها فی الاختبار وهی الموضوعات المحددة فی توصیف مقرر القیاس والتقویم الذی یقوم الباحث بتدریسه لطلاب الدبلوم العام فی التربیة فی الفصل الدراسی الأول من العام الجامعی 2016/ 2017م، 1437/1438ه، والتی تم تصنیفها فی خمسة مجالات رئیسیة هی (مفاهیم القیاس والتقییم والتقویم وخصائص کل منها والفرق بینها، ومستویات القیاس وأنواع التقویم وخصائص التقویم الجید، الأسئلة الموضوعیة والمقالیة وأنواعها وخصائصها وشروطها، الاختبارات النفسیة وتصنیفاتها وشروطها، بعض الأسالیب الإحصائیة).

-        تم تحدید الأهمیة النسبیة لکل مجال فرعی فی ضوء مساحته وأهمیته فی المقرر.

-        تم تحدید الأهداف السلوکیة التی سیتم قیاسها کنواتج مستهدف تحقیقها من خلال دراسة المقرر والتی تمثلت فی المستویات المعرفیة الثلاثة الأولى من تصنیف بلوم وهی التذکر والفهم والتطبیق، وتم تحدید الأهمیة النسبیة لکل هدف حسب الأهداف التی یسعى المقرر لتحقیقها.

-        تم إعداد جدول مواصفات الاختبار التحصیلی على أنه یتکون من 40 سؤال منها أسئلة مقالیة قصیرة وأسئلة موضوعیة (اختیار من متعدد، صواب وخطأ) کما هو موضح فی جدول (4):

جدول (4):

جدول مواصفات الاختبار التحصیلی فی مقرر مبادئ القیاس والتقویم

         الهدف

المجال

التذکر 30%

الفهم 50%

التطبیق 20%

المجموع

المفاهیم الأساسیة 15%

40×0.30×0.15 = 1.8

(سؤالین)

40×0.50×0.15

= 3

(3 أسئلة)

40×0.20×0.15

=1.2

(سؤال واحد)

6

مستویات القیاس وأنواع التقویم 15%

40×0.30×0.15 = 1.8

(سؤالین)

40×0.50×0.15

= 3

(3 أسئلة)

40×0.20×0.15

=1.2

(سؤال واحد)

6

الأسئلة الموضوعیة والمقالیة 25%

40×0.30×0.25

= 3

(3 أسئلة)

40×0.50×0.25

= 5

(5 أسئلة)

40×0.20×0.25

 = 2

(سؤالین)

10

الاختبارات وتصنیفاتها وشروطها 20%

40×0.30×0.20

= 2.4

(سؤالین)

40×0.50×0.20

= 4

(4 أسئلة)

40×0.20×0.20 =1.6

(سؤالین)

8

المبادئ الإحصائیة 25%

40×0.30×0.25

= 3

(3 أسئلة)

40×0.50×0.25

= 5

(5 أسئلة)

40×0.20×0.25

= 2

(سؤالین)

10

المجموع

12

20

8

40

-            بعد تکوین جدول مواصفات الاختبار وکتابة الأسئلة تم عرض الاختبار على الزملاء ممن یقومون بتدریس المقرر ولدیهم خلفیة بالقیاس والتقویم وکانت آرائهم متفقة بشأن انتماء کل سؤال للمجال والهدف الذی حدده الباحث مع بعض التعدیلات فی صیاغة بعض الأسئلة، ومما سبق یکون قد تم التحقق من صدق المحتوى للاختبار التحصیلی فی ضوء آراء المحکمین وجدول مواصفات الاختبار.

-            کذلک تم تطبیق الاختبار على مجموعة من طلاب البکالوریوس بقسم التربیة البدنیة وقسم التربیة الخاصة بلغ عددهم 35 طالباً وتم حساب معامل ثبات کیودر وریتشاردسون للاختبار فکان معامل الثبات مساویاً 0.746 وکذلک کان معامل ثبات التجزئة النصفیة مساویاً 0.738 وبذلک یکون تم التأکد من ثبات الاختبار التحصیلی، تم کذلک التأکد من الاتساق الداخلی لبنود الاختبار بحساب معاملات الارتباط بین درجات بنود الاختبار والدرجة الکلیة للاختبار بعد حذف درجة البند منها، فکانت معاملات الارتباط کما هو موضح بجدول (5):

جدول (5):

معاملات الارتباط بین درجات بنود الاختبار التحصیلی والدرجة الکلیة بعد حذف درجة البند منها

م

الارتباط

م

الارتباط

م

الارتباط

م

الارتباط

م

الارتباط

1

0.446**

9

0.459**

17

0.421**

25

0.374*

33

0.625**

2

0.438**

10

0.489**

18

0.596**

26

0.482**

34

0.632**

3

0.474**

11

0.644**

19

0.536**

27

0.596**

35

0.782**

4

0.527**

12

0.436**

20

0.338*

28

0.770**

36

0.545**

5

0.520**

13

0.724**

21

0.471**

29

0.424**

37

0.718**

6

0.438**

14

0.382*

22

0.712**

30

0.544**

38

0.539**

7

0.437**

15

0.366*

23

0.591**

31

0.609**

39

0.482**

8

0.466**

16

0.468**

24

0.496**

32

0.663**

40

0.539**

القیمة الجدولیة لمعامل الارتباط لحجم عینة 35 ومستوی دلالة 0.05 و0.01 تساوی 0.3246 و0.4182 على الترتیب

تم کذلک التأکد من الاتساق الداخلی للمجالات الفرعیة للاختبار بحساب معاملات الارتباط بین درجات تلک المجالات وکذلک معاملات الارتباط بین درجات تلک المجالات والدرجة الکلیة للاختبار بعد حذف درجة المجال منها، فکانت معاملات الارتباط کما هو موضح بجدول (6):

جدول (6):

معاملات الارتباط بین درجات المجالات الفرعیة للاختبار التحصیلی وبینها وبین الدرجة الکلیة بعد حذف درجة المجال

الاختبار التحصیلی

المفاهیم الأساسیة

مستویات القیاس وأنواع التقویم

الأسئلة الموضوعیة والمقالیة

الاختبارات وتصنیفاتها وشروطها

المبادئ الإحصائیة

مستویات القیاس وأنواع التقویم

0.712**

 

 

 

 

الأسئلة الموضوعیة والمقالیة

0.728**

0.509**

 

 

 

الاختبارات وتصنیفاتها وشروطها

0.745**

0.697**

0.586**

 

 

المبادئ الإحصائیة

0.652**

0.464**

0.622**

0.743**

 

الدرجة الکلیة للاختبار

0.830**

0.859**

0.748**

0.760**

0.799**

القیمة الجدولیة لمعامل الارتباط لحجم عینة 35 وعند مستوی دلالة 0.01 تساوی 0.4182

ومما سبق یتأکد تماسک بنود الاختبار وکذلک الاتساق والتماسک بین مجالاته الفرعیة، والاختبار فی صورته النهائیة یتکون من 40 سؤالاً والإجابة الخطأ تقابل الدرجة صفر بینما الإجابة الصحیحة تقابل الدرجة (1) وبالتالی تکون أقصى درجة یمکن الحصول علیها فی الاختبار هی الدرجة 40، وفی ضوء الخطوات السابق تتأکد الکفاءة السیکومتریة للاختبار وإمکانیة استخدامه فی البحث الحالی.

نتائج البحث:

أولاً: نتائج الإجابة عن السؤال الأول:

ینص السؤال الأول للبحث الحالی على "ما استراتیجیات أداء الاختبار الأکثر استخداماً لدى الطلاب عینة البحث الحالی؟"

وللإجابة عن هذا السؤال تم استخدام اختبار "ت" لمقارنة متوسط درجات عینة مع متوسط فرضی وذلک للتعرف على درجة استخدام کل استراتیجیة من استراتیجیات أداء الاختبار وذلک بافتراض أن المتوسط الفرضی لکل استراتیجیة یساوی (3× عدد العبارات) فکانت النتائج کما هی موضحة بجدول (7):

جدول (7):

دلالة الفروق بین المتوسط الفرضی والتجریبی لاستراتیجیات أداء الاختبار

  استراتیجیات أداء الاختبار

المتوسط الفرضی

المتوسط التجریبی

الانحراف المعیاری

قیمة "ت" ودلالتها

درجة الاستخدام

مستوى الاستخدام

تخطیط وتنظیم وقت الاجابة

30.00

31.785

7.753

3.097**

63.570%

متوسط

تحلیل أسئلة الاختبار

39.00

38.735

12.293

0.290

59.592%

متوسط

تخطیط وتنظیم الاجابة

39.00

40.259

10.730

1.579

61.937%

متوسط

الضبط والسیطرة

24.00

22.553

8.138

2.393*

56.383%

ضعیف

ما بعد الاختبار

15.00

16.022

4.389

3.133**

64.088%

متوسط

الدرجة الکلیة

147.00

149.354

39.635

0.799

60.961%

متوسط

یتضح من جدول (7) السابق أنه:

-        استراتیجیات أداء الاختبار ککل جاءت متحققة بدرجة متوسطة حیث لا توجد فروق دالة إحصائیاً بین المتوسط التجریبی والمتوسط الفرضی للدرجات الکلیة، أما بشأن الاستراتیجیات الفرعیة لأداء الاختبار فجاءت استراتیجیة تخطیط وتنظیم وقت الاجابة أعلى الاستراتیجیات من حیث درجة الاستخدام یلیها استراتیجیة ما بعد الاختبار، ثم استراتیجیة تخطیط وتنظیم الإجابة فاستراتیجیة تحلیل أسئلة الاختبار، أما فی حالة استراتیجیة الضبط والسیطرة فجاءت الفروق دالة إحصائیاً عند مستوى 0.05 بین المتوسط التجریبی والمتوسط الفرضی لصالح المتوسط الفرضی وبالتالی تکون هذه الاستراتیجیة هی أقل الاستراتیجیات من حیث درجة الاستخدام.

وعدم وجود مستویات مرتفعة من استراتیجیات أداء الاختبار لدى الطلاب عینة البحث الحالی على الرغم من أنهم من طلاب الدبلوم العام أی مروا بالعدید من المواقف الاختباریة حتى الانتهاء من مرحلة البکالوریوس، یفسر فی ضوء عدم تلقی هؤلاء الطلاب لتدریبات متخصصة على هذه الاستراتیجیات فحتى یتقن الطلاب هذه الاستراتیجیات وتصبح جزء من سلوکهم الاعتیادی فی الموقف الاختباری یجب أن یتم تدریب الطالب وتدریسه هذه الاستراتیجیات بشکل مباشر.

وهذا التفسیر یتماشى مع ما یؤکد علیه Xu and Wu (2012) من أهمیة التدریب على هذه الاستراتیجیات فی مواقف تشابه الموقف الاختباری الفعلی؛ فلکی یصبح الطالب أکثر ألفة بهذه الاستراتیجیات وبکیفیة تطبیقها بنجاح یجب أن تتاح للطالب الفرصة للتدریب الکافی علیها (Pour-Mohammadi & Abidin, 2011)؛ بل ویدعوا البعض إلى ضرورة أن تصبح هذه الاستراتیجیات جزء من المنهج الدراسی فهی مهارات یحتاج إتقانها إلى تدریب وتعلیم واهتمام من قبل المعلمین فی جمیع المراحل الدراسیة ومثل هذه الجهود منخفضة جداً لحد غیر متوقع، وأکدت نتائج دراسة (Takallou et al., 2015) على أن اتجاهات طلاب الجامعة نحو تعلم هذه الاستراتیجیات کان مرتفع بل وکانت هناک مطالبة من أفراد عینة الدراسة بضرورة أن تکون هناک تدریبات کافیة علی هذه الاستراتیجیات والتی تساعد الطالب فی معرفة ما الذی علیه فعلیة أثناء وبعد الاختبار؛ وبالتالی یمکن تفسیر انخفاض مستوى هذه الاستراتیجیات لدى الطلاب عینة البحث الحالی فی ضوء عدم الاهتمام بتعلیمها وتدریب الطلاب علیها.

کذلک یمکن تفسیر عدم ارتفاع مستوى استراتیجیات أداء الاختبار لدى الطلاب عینة البحث الحالی فی ضوء انخفاض دافعیة أداء الاختبار لدیهم هذا من جهة ومن جهة أحرى انخفاض دافعیة الإنجاز والرغبة فی الاتقان بصفة عامة والمرتبط بعدم وجود فرص للتوظیف والتحاق الطالب بالدبلوم رغبة فی الحصول على الشهادة بغض النظر على التعلم والاتقان، ففی هذه الحالة لا یحاول الطالب بذل الجهد الکافی للوصول للدرجة المرتفعة، وتساعد نظم التقویم المتبعة وترکیز معظم الاختبارات على الأسئلة الموضوعیة فی حرمان الطالب من تعلم وممارسة هذه الاستراتیجیات بشکل فعال.

وتتفق النتائج الحالیة مع نتائج دراسة Hong et al. (2006) والتی توصلت إلى أن استراتیجیة تنظیم وقت الإجابة من أعلى الاستراتیجیات استخداماً فی الموقف الاختباری؛ وتتفق کذلک مع نتائج دراسة Zhang et al. (2011) التی أکدت أن مستوى استراتیجیات أداء الاختبار لدى طلاب الجامعة الصنین متوسط؛ ومع نتائج دراسة Dodeen et al. (2014) والتی أکدت نتائجها على تدنی مستوى مهارات أداء الاختبار لدى طلاب الجامعة ماعدا استراتیجیة قبل الاختبار کانت فی المدى المتوسط؛ ومع نتائج دراسة فاطمة مطلک (2009) والتی أکدت على أن مستوى الدرجة الکلیة للحکمة الاختباریة لدى الطلاب ذوی المستوى العادی فی التحصیل مستوى متوسط، وهی نفس النتیجة التی توصل إلیها زین ردادی (2001)؛ وتتفق النتائج الحالیة مع نتائج دراسة سعود العنزی (2014) والتی أکدت أن مهارات خطة الحل والتی تقترب فی المعنی من استراتیجیة تخطیط وتنظیم الإجابة فی البحث الحالی مستواها متوسط بینما تختلف معها فی أن مهارات إدارة الوقت والتعامل مع الأسئلة کانت ضعیفة بینما فی البحث الحالی کانت هذه الاستراتیجیات متوسطة.

ومع نتائج دراسة أحمد عودة (1989) والتی أکدت على أن استراتیجیات حکمة الاختبار یجب أن یتم تعلیمها بعکس ما هو مفترض أن هذه الاستراتیجیات یتم اکتسابها تلقائیاً من خلال خبرة المرور بالاختبارات والألفة بالاختبارات؛ بینما تختلف مع نتائج دراسة Dodeen (2009) والتی أکدت نتائجها أن مستوى استراتیجیات أداء الاختبار لدى طلاب جامعة الإمارات العربیة المتحدة مستوى مرتفع؛ ومع نتائج دراسة إیاد حمادنة (2011) والتی أکدت على أن مهارات حکمة الاختبار تستخدم بدرجة عالیة لدى طلاب الجامعة الأردنیین، ولکن على الرغم من أن استراتیجیة ما بعد الاختبار فی البحث الحالی جاءت بدرجة متوسطة إلا أنها تحتل مرتبة أعلى من حیث درجة الاستخدام مقارنة بباقی الاستراتیجیات کما فی دراسة "إیاد حمادنة".

وتختلف مع نتائج دراسة Bicak (2013) والتی أشارت إلى أن استراتیجیات أداء الاختبار المتمثلة فی استراتیجیة تحلیل البنود واستراتیجیة تخطیط وتنظیم الوقت، واستراتیجیة توقع الاختیار، واستراتیجیة ما بعد الاختبار، کانت بدرجة ضعیفة.

ثانیاً: نتائج الإجابة عن السؤال الثانی:

ینص السؤال الثانی للبحث الحالی على "هل توجد فروق دالة إحصائیاً فی درجات الطلاب عینة البحث الحالی فی الاختبار التحصیلی راجعة لاختلاف درجة استخدامهم لاستراتیجیات الأداء فی الاختبار؟"

للإجابة عن هذا السؤال تم استخدام تحلیل التباین أحادی الاتجاه One Way ANOVA فی الکشف عن دلالة الفروق بین درجات الطلاب فی الاختبار التحصیلی، وذلک فی المقارنة بین درجات الطلاب ککل، ودرجات الطلاب بعد استبعاد أدنی 10% فی استراتیجیات أداء الاختبار، ودرجات الطلاب بعد استبعاد أدنی 20% فی استراتیجیات أداء الاختبار، ودرجات الطلاب بعد استبعاد أدنی 30% فی استراتیجیات أداء الاختبار، فکانت النتائج کما هو موضح فی التالی، مع ملاحظة أنه تم تفسیر نتائج هذا السؤال ضمن تفسیر نتائج السؤال الثالث للارتباط بین نتائج السؤالین منعا للتکرار: 

جدول (8):

الإحصاءات الوصفیة لدرجات الطلاب فی الاختبار التحصیلی فی ضوء درجة استخدام استراتیجیات أداء الاختبار

المجموعات

العدد

المتوسط

الانحراف المعیاری

الأفراد ککل

181

25.105

9.249

بعد استبعاد أدنى 10 % فی استراتیجیات أداء الاختبار

161

25.783

9.310

بعد استبعاد أدنى 20 % فی استراتیجیات أداء الاختبار

141

27.113

8.515

بعد استبعاد أدنى 30 % فی استراتیجیات أداء الاختبار

122

28.992

7.555

جدول (9):

دلالة الفروق فی درجات الطلاب فی الاختبار التحصیلی فی ضوء درجة استخدام استراتیجیات أداء الاختبار

مصدر التباین

مجموع المربعات

درجات الحریة

التباین

النسبة الفائیة

بین المجموعات

1244.840

3

414.947

5.384**

داخل المجموعات

46323.573

601

77.077

الکلی

47568.413

604

 

یتضح من جدول (9) وجود فروق دالة إحصائیاً عند مستوى 0.01 فی درجات الطلاب فی الاختبار التحصیلی راجعة لدرجة استخدام استراتیجیات أداء الاختبار، وتم استخدام اختبار أقل فرق دال LSD فی المقارنات البعدیة بین المجموعات فی درجات الاختبار التحصیلی فی ضوء درجة استخدام استراتیجیات أداء الاختبار فکانت کما هی موضحة فی جدول (10):

جدول (10):

المقارنات البعدیة بین المجموعات فی درجات الاختبار التحصیلی فی ضوء درجة استخدام استراتیجیات أداء الاختبار

المجموعات

الأفراد ککل

 (م= 25.105)

بعد استبعاد أدنى 10 %

(م= 25.783)

 بعد استبعاد أدنى

20 % (م= 27.114)

بعد استبعاد أدنى 10 % (م= 25.783)

0.678

 

 

بعد استبعاد أدنى 20 % (م= 27.114)

2.009*

1.331

 

بعد استبعاد أدنى 30 % (م= 28.992)

3.887**

3.209**

1.878

یتضح من جدول (10) أنه توجد فروق دالة إحصائیاً عند مستوى 0.05 فی درجات الطلاب فی الاختبار التحصیلی بین مجموعة الطلاب ککل وبین مجموعة الطلاب بعد استبعاد أدنى 20% فی استراتیجیات أداء الاختبار لصالح مجموعة الطلاب بعد الاستبعاد، کذلک توجد فروق دالة إحصائیاً عند مستوى 0.01 بین مجموعة الطلاب ککل وبین مجموعة الطلاب بعد استبعاد أدنى 30% فی استراتیجیات أداء الاختبار لصالح مجموعة الطلاب بعد الاستبعاد، وتوجد فروق دالة إحصائیاً عند مستوى 0.01 بین مجموعة الطلاب بعد استبعاد أدنى 30% ومجموعة الطلاب بعد استبعاد أدنى 10 % فی استراتیجیات أداء الاختبار لصالح مجموعة الطلاب بعد استبعاد أدنى 30 %، والنتائج هنا تؤکد فی مجملها أن تدنی استخدام الطلاب لاستراتیجیات أداء الاختبار ینتج عنه تدنی فی درجاتهم فی الاختبار، وأن الأداء على الاختبار یرتبط بعلاقة کبیرة باستخدام استراتیجیات أداء الاختبار.

ثالثاً: نتائج الإجابة عن السؤال الثالث:

ینص السؤال الثالث للبحث الحالی على "هل یمکن التنبؤ بدرجات الطلاب عینة البحث الحالی فی الاختبار التحصیلی من خلال درجاتهم فی استراتیجیات الأداء الاختبار؟"

          تمثل الهدف من هذا السؤال فی التعرف على أکثر استراتیجیات أداء الاختبار تأثیراً وإسهاماً فی التنبؤ بدرجات الطلاب فی الاختبار، للإجابة عن هذا السؤال تم استخدام تحلیل الانحدار المتعدد بطریقة التحلیل المتتابع Stepwise باعتبار أن استراتیجیات الأداء فی الاختبار متغیرات مستقلة ونتائج الأداء فی الاختبار التحصیلی متغیر تابع؛ حیث یساعد هذا الأسلوب الإحصائی فی وصف التأثیرات المباشرة للمتغیرات المستقلة فی المتغیرات التابعة فی صورة نموذج خطی تعرف معادلته باسم معادلة الانحدار الخطی المتعدد، وفی البدایة تم عرض معاملات ارتباط بیرسون التی تؤکد دلالة العلاقة بین درجات الطلاب فی الاختبار ودرجاتهم فی استراتیجیات أداء الاختبار کما هو موضح فی جدول (11):

جدول (11):

دلالة العلاقة بین أداء الطلاب فی الاختبار التحصیلی واستراتیجیات أداء الاختبار

 استراتیجیات أداء الاختبار

تخطیط وتنظیم وقت الإجابة

تحلیل أسئلة الاختبار

تخطیط وتنظیم الإجابة

الضبط والسیطرة

ما بعد الاختبار

الدرجة الکلیة

 معامل الارتباط

0.510**

0.565**

0.463**

0.604**

0.412**

0.570**

          یتضح من جدول (11) أنه توجد علاقات ارتباطیة موجبة دالة إحصائیاً بین درجات الطلاب فی الاختبار التحصیلی واستراتیجیات أداء الاختبار، وکانت نتائج تحلیل الانحدار المتعدد للتنبؤ بدرجات الطلاب فی الاختبار التحصیلی من خلال استراتیجیات أدائهم للاختبار کما هی موضحة فی جدول (12):

جدول (12):

تحلیل الانحدار المتعدد للتنبؤ بدرجات الاختبار التحصیلی من خلال استراتیجیات أداء الاختبار

استراتیجیات أداء الاختبار

معاملات الانحدار

ثابت الانحدار

B

4.293

تحلیل أسئلة الاختبار

B

0.163*

Beta

0.216

الضبط والسیطرة

B

0.488**

Beta

0.428

معامل الارتباط المتعدد R

0.417

معامل التحدید R2

0.174

النسبة الفائیة ودرجات الحریة لتحلیل تباین

 الانحدار المتعدد

ف =54.691**، درجات الحریة (2، 178)

ومن جدول (12) یتضح أن:

تسهم استراتیجیات الضبط والسیطرة وتحلیل أسئلة الاختبار على الترتیب إیجابیاً فی التنبؤ بدرجات الطلاب فی الاختبار، وکانت النسبة الفائیة لتحلیل تباین الانحدار المتعدد مساویة (2، 178) وهی دالة إحصائیا عند مستوى دلالة 0.01 مما یؤکد أهمیة هذه الاستراتیجیات وإسهامها فی التنبؤ بدرجات الطلاب فی الاختبار، وکان معامل الارتباط المتعدد مساویاً 0.417، وکان معامل التحدید مساویاً 0.174 مما یعنی أن نسبة التباین المفسر فی درجات الطلاب والتی ترجع لتأثیر هذه الاستراتیجیات یساوی 17.4٪ ویمکن صیاغة معادلة التنبؤ کالتالی:

درجات الاختبار التحصیلی = 4.293 + 0.163× استراتیجیة تحلیل أسئلة الاختبار + 0.488× استراتیجیة الضبط والسیطرة

ویمکن تفسیر ارتفاع مستوى الأداء فی الاختبار لدى مرتفعی استخدام استراتیجیات أداء الاختبار بأن ارتفاع مستوى هذه الاستراتیجیات یصحبه زیادة فی دافعیة الطلاب واهتمامهم بالأداء الجید فی الاختبار والذی ینعکس إیجابیاً على ترکیز الطالب وجهده المبذول فی محاولة الوصول للإجابة الصحیحة ویقلل من قلق الاختبار وتمکن الطالب من الضبط الانفعالی والمعرفی أثناء الموقف الاختباری وهو ما تؤکد علیه دراسات (Maspons & Llabre, 1983; Orth, 1995; Ellis & Ryan, 2003; Lancaster et al., 2009 Takallou et al., 2015)؛ بأن التدریب على هذه الاستراتیجیات یحسن دافعیة أداء الاختبار ویقلل من قلق الاختبار؛ فمن أهم ممیزات أصحاب استراتیجیات أداء الاختبار تعاملهم بفاعلیة مع الانفعالات السلبیة والتی منها القلق فی الموقف الاختباری (Hong et al., 2006).

کذلک یمکن تفسیر زیادة مستوى الأداء لدى الطلاب مرتفعی استخدام استراتیجیات أداء الاختبار فی ضوء أن هؤلاء الطلاب یستطیعون التعامل مع الموقف الاختباری بنوع من الفاعلیة، فالموقف الاختباری یعتبر موقف ضغط وتوتر للعدید من الطلاب، وتمکن استراتیجیة السیطرة والضبط وکذلک الإدارة الجیدة لوقت الاختبار من التغلب على مثل هذه الضغوط، کذلک یستفید الطالب من أدائه فی الاختبارات السابقة فی الاستعداد للاختبارات المقبلة وهو ما یسهم فی زیادة شعوره بالفاعلیة والتمکن ویولد لدیة اعتقادات إیجابیة عن قدرته على الأداء الجید فی الموقف الاختباری.

فمن خصائص مرتفعی استخدام استراتیجیات أداء الاختبار والتی تمیزهم عن غیرهم أنهم یتمکنون من البرهنة على الاتقان والفهم وتنظیم الإجابة بالشکل الذی یعطیهم فرصه أکبر للحصول على درجات أعلى کذلک یستطیعون استغلال وقت الاختبار بشکل أفضل ولا یقضون وقتاً فی التفکیر فی نتائج الأداء والذی قد یسهم فی تشتیت ترکیزهم وإنما یرکزون على کیفیة الأداء بشکل أفضل وحتى فی حالة الأسئلة الصعبة والغامضة فإن تحلیل أسئلة الاختبار یمکنهم من الإجابة ولو بشکل جزئی، کما أن استراتیجیة ما بعد الاختبار تتیح للطالب التقدم للاختبار ولدیه شعور بالارتیاح والثقة وتمکنه من الاستعداد الجید للاختبار فمن یستخدم هذه الاستراتیجیة یتمکن من تحلیل أخطائه فی الاختبارات السابقة وحاول تجنب تلک الأخطاء فی الاختبارات اللاحقة وقد یسهم ذلک فی زیادة توجه الطالب لعزو نجاحة أو فشلة للعوامل الداخلیة القبالة للضبط والتحکم مثل الجهد أکثر من العوامل الخارجیة غیر القابلة للتحکم کالظروف وصعوبة المقررات؛ فاستخدام الطلاب لاستراتیجیات أداء الاختبار یزید من وعی الطالب بأدائه Pour-Mohammadi and Abidin (2011) والذی ینعکس على تنظیم الطالب للإجابة وتجنبه للخطأ قدر الإمکان وکذلک استغلاله لوقت الاختبار الاستغلال الأمثل وهو ما یفسر ارتفاع معدل درجات الطلاب بزیادة استخدام هذه الاستراتیجیات.

وعدم ظهور تأثیرات دالة لاستراتیجیة تخطیط وتنظیم وقت الاجابة وتنظیم وتخطیط الإجابة واستراتیجیة ما بعد الاختبار فی التنبؤ بمستوى الأداء فی الاختبار على الرغم من دلالة العلاقة بین هذه الاستراتیجیات ودرجات الطلاب فی الاختبار یمکن تفسیره بأن هذه الاستراتیجیات لها تأثیرات غیر مباشرة فی درجات الطلاب فی الاختبار حیث أن هذه الاستراتیجیات تؤثر فی استراتیجیتی تحلیل أسئلة الاختبار والضبط والسیطرة.

وتتفق النتائج الحالیة مع معظم نتائج الدراسات السابقة والتی أکدت دلالة العلاقة بین استراتیجیات أداء الاختبار والأداء فی الاختبار وأن من یستخدم هذه الاستراتیجیات تزداد احتمالیة نجاحه الأکادیمی فی الاختبار مثل دراسة Arsal (2014) والتی أشارت نتائجها إلى التأثیر الإیجابی لاستراتیجیات أداء الاختبار فی خفض قلق الاختبار والذی ینعکس إیجابیاً على الأداء فی الاختبار؛ ودراسة Zhang et al. (2011); Hong et al. (2006) والتی أکدت نتائجها أن استراتیجیات أداء الاختبار تعد من أهم العوامل الممیزة بین منخفضی ومرتفعی الأداء فی الاختبار؛ وکذلک تتفق مع تأکید (Famularo, 2007, 29) بأن استخدام هذه الاستراتیجیات یرتبط إیجابیاً بدرجات الاختبارات؛ وتأکید Chittooran and Dorothy (2001) بأن الفرصة للنجاح فی الأداء على الاختبار تزداد بزیادة استخدام استراتیجیات أداء الاختبار والتی تتمثل فی الألفة بالاختبار والاستعداد للاختبار والحکمة الاختباریة وضبط قلق الاختبار؛ وتتفق کذلک مع نتائج دراسة عفاف وادی (2013) والتی أشارت نتائجها لإمکانیة التنبؤ بدرجات تحصیل الطلاب من خلال مهارات الحکمة الاختباریة لدیهم؛ وتتفق مع نتائج دراسة Stenlund et al. (2016) والتی أکدت على دلالة الفروق بین منخفضی ومرتفعی التحصیل فی استراتیجیات أداء الاختبار لصالح مرتفعی التحصیل.

وتتفق کثیراً مع نتائج دراسة Wise et al. (2006) والتی أشارت إلى أن استبعاد الأفراد غیر الجادین فی الإجابة عن الاختبار وهم منخفضی دافعیة أداء الاختبار یزید من معدل الدرجات ما بین (0.25) إلى (0.5) انحراف معیاری؛ ونتائج دراسة Wise and DeMars (2010) والتی أکدت أن استبعاد الأفراد منخفضی دافعیة أداء الاختبار یصحبه زیادة فی متوسط الدرجات؛ والنتائج الحالیة تؤکدها نتائج العدید من الدراسات التی أشارت إلى جدوى التدریب على استراتیجیات أداء الاختبار أو مهارات الحکمة الاختباریة فی رفع مستوى الأداء على الاختبار، وخفض قلق الاختبار والذی ینعکس إیجابیاً على مستوى الأداء فی الاختبار (Holzer et al., 2009; Dodeen, 2015; Takallou et al., 2016) ودراسات (أحمد عودة، 1989؛ إیثار الخصاونة، 1994)؛ وکذلک تتفق النتائج الحالیة مع نتائج دراسة Ellis and Ryan (2003) والتی أشارت إلى أن تدریب الطلاب على استراتیجیات ومهارات أداء الاختبار یزید من متوسط الدرجات فی الاختبار بمعدل ما بین (0.25) إلى (1) انحراف معیاری؛ وکذلک تتفق مع نتائج دراسة محمد عبدالوهاب (2007) والتی أکدت على أن مهارات حکمة الاختبار تسهم بنحو 14% فی درجات التحصیل وکذلک استفادة الطلاب فی المجموعة التجریبیة من التدریب على مهارات الحکمة الاختباریة فی رفع مستوى التحصیل؛ وتتفق کذلک مع نتائج دراسة Kim and Goetz (1993) التی أکدت على دلالة العلاقة بین استخدام استراتیجیات أداء الاختبار بمستوى الأداء.

بینما تختلف النتائج الحالیة مع نتائج دراسة محمد عبدالوهاب (2007) فی أن مهارات حکمة الاختبار تسهم بنحو 5% فقط فی قلق الاختبار وکذلک تختلف معها فی أن التدریب على مهارات الحکمة الاختباریة لم یسهم فی خفض قلق الاختبار؛ کذلک لا تتفق مع نتائج دراسة سامی العنزی (2014) والتی توصلت إلى عدم دلالة الفروق فی مهارات الحکمة الاختباریة باختلاف مستوى التحصیل؛ کذلک تختلف مع نتائج دراسة سعود العنزی (2014) والتی توصلت لعدم اختلاف مهارات الحکمة الاختباریة باختلاف مستوى التحصیل؛ وتختلف مع نتائج دراسة دیانا حماد (2010) والتی أکدت عدم دلالة العلاقة بین مهارات الحکمة الاختباریة والتحصیل الدراسی؛ ولا تتفق مع نتائج دراسة Zhang et al. (2011) والتی أشارت إلى أن استراتیجیات الأداء فی الاختبار لدى الطلاب الصینین تربطها علاقات ضعیفة بالأداء فی اختبارات اللغة الإنجلیزیة؛ والاختلاف مع بعض نتائج الدراسات السابقة وخاصة التی تناولت الحکمة الاختباریة یؤکد على أن المفهوم الشائع لمهارات الحکمة الاختباری یختلف عن استراتیجیات أداء الاختبار بمفهومها المستخدم فی البحث الحالی.

رابعاً: نتائج الإجابة عن السؤال الرابع:

ینص السؤال الرابع للبحث الحالی على "هل تختلف الخصائص السیکومتریة لبنود الاختبار (الصعوبة والتمییز) باختلاف درجة استخدام استراتیجیات أداء الاختبار لدى الطلاب عینة البحث الحالی؟"

1-       صعوبة البنود:

للتعرف على مدى اختلاف صعوبات بنود الاختبار التحصیلی باختلاف درجة استخدام استراتیجیات أداء الاختبار لدى الطلاب عینة البحث الحالی، تم حساب معاملات صعوبة البنود فی حالة العینة الکلیة، وکذلک حساب معاملات الصعوبة فی حالة استبعاد أدنى 10%، 20%، 30% فی استراتیجیات أداء الاختبار على الترتیب، فکانت کما هی موضحة        بجدول (13):

جدول (13):

معاملات صعوبة البنود فی ضوء استخدام استراتیجیات أداء الاختبار

العینة الکلیة

(ن= 181)

بعد استبعاد أدنى 10%

(ن= 161)

بعد استبعاد أدنى 20 %

(ن=141)

بعد استبعاد أدنى 30%

(ن= 122)

م

صعوبة

م

صعوبة

م

صعوبة

م

صعوبة

م

صعوبة

م

صعوبة

م

صعوبة

م

صعوبة

1

0.724

21

0.453

1

0.752

21

0.472

1

0.752

21

0.504

1

0.795

21

0.525

2

0.657

22

0.464

2

0.683

22

0.472

2

0.723

22

0.496

2

0.779

22

0.533

3

0.608

23

0.486

3

0.640

23

0.497

3

0.688

23

0.518

3

0.746

23

0.554

4

0.580

24

0.470

4

0.602

24

0.484

4

0.652

24

0.504

4

0.721

24

0.533

5

0.569

25

0.470

5

0.590

25

0.484

5

0.645

25

0.504

5

0.697

25

0.525

6

0.558

26

0.448

6

0.584

26

0.447

6

0.631

26

0.468

6

0.689

26

0.484

7

0.497

27

0.459

7

0.534

27

0.497

7

0.560

27

0.525

7

0.607

27

0.557

8

0.475

28

0.436

8

0.491

28

0.441

8

0.518

28

0.468

8

0.566

28

0.500

9

0.497

29

0.453

9

0.528

29

0.491

9

0.574

29

0.511

9

0.615

29

0.549

10

0.453

30

0.436

10

0.460

30

0.460

10

0.496

30

0.489

10

0.525

30

0.525

11

0.448

31

0.436

11

0.491

31

0.441

11

0.504

31

0.475

11

0.533

31

0.516

12

0.470

32

0.519

12

0.503

32

0.553

12

0.539

32

0.560

12

0.549

32

0.607

13

0.459

33

0.503

13

0.466

33

0.516

13

0.482

33

0.553

13

0.525

33

0.582

14

0.420

34

0.475

14

0.429

34

0.503

14

0.454

34

0.532

14

0.484

34

0.574

15

0.464

35

0.464

15

0.503

35

0.484

15

0.504

35

0.489

15

0.533

35

0.516

16

0.459

36

0.470

16

0.478

36

0.497

16

0.496

36

0.518

16

0.508

36

0.557

17

0.431

37

0.514

17

0.460

37

0.518

17

0.489

37

0.532

17

0.492

37

0.549

18

0.436

38

0.475

18

0.453

38

0.509

18

0.475

38

0.532

18

0.475

38

0.557

19

0.514

39

0.508

19

0.553

39

0.522

19

0.574

39

0.546

19

0.631

39

0.557

20

0.464

40

0.552

20

0.472

40

0.571

20

0.511

40

0.589

20

0.557

40

0.623

 

بعد حساب معاملات صعوبة البنود فی الأربع حالات السابقة، ونظراً لأن معاملات الصعوبة فی جوهرها نسب مئویة وتنتمی إلى مستوى القیاس الرتبی تم تحویل معاملات الصعوبة إلى درجات معیاریة وللتغلب على مشکلة الدرجات السالبة تم تحویل الدرجات المعیاریة إلى معاملات دلتا المقابلة (∆) حیث أن (∆ = 13 + 4z) وتمثل z الدرجة المعیاریة المقابلة لکل معامل صعوبة، بمتوسط 13 وانحراف معیاری 4 (Domino & Domino, 2006, 30) وتمتد قیمة معامل الصعوبة دلتا ما بین (6) فی حالة المفردات الصعبة جداً و(20) فی حالة المفردات السهلة جداً وتساوی 13 فی حالة المفردات متوسطة الصعوبة والسهولة (Liao et al., 2010, 4)؛ ثم تم استخدام تحلیل التباین للقیاسات المتکررة للکشف عن دلالة الفروق بین معاملات صعوبة البنود دلتا فی الحالات الأربعة؛ فکانت النتائج کما هی موضحة فی التالی:

جدول (14):

الإحصاءات الوصفیة لمعاملات صعوبة البنود دلتا فی ضوء درجة استخدام استراتیجیات أداء الاختبار

المجموعات

المتوسط

الانحراف المعیاری

الأفراد ککل

11.021

3.330

بعد استبعاد أدنى 10 % فی استراتیجیات أداء الاختبار

12.145

3.519

بعد استبعاد أدنى 20 % فی استراتیجیات أداء الاختبار

13.519

3.670

بعد استبعاد أدنى 30 % فی استراتیجیات أداء الاختبار

15.315

4.212

جدول (15):

 دلالة الفروق فی صعوبات البنود دلتا فی ضوء درجة استخدام استراتیجیات أداء الاختبار (باستخدام تحلیل التباین للقیاسات المتکررة)

مصدر التباین

مجموع المربعات

درجات الحریة

التباین

النسبة الفائیة

درجة استخدام الاستراتیجیات

411.060

3

275.498

276.211**

الخطأ

58.040

117

0.997

یتضح من جدول (15) أنه توجد فروق دالة إحصائیاً عند مستوى ثقة 0.01 فی معاملات صعوبة البنود فی الحالات الأربعة التی تمت المقارنة بینها، مما یعنی أنه توجد فروق فی معاملات صعوبة البنود راجعة لاختلاف استخدام استراتیجیات أداء الاختبار، وتم استخدام اختبار أقل فرق دال LSD فی المقارنات البعدیة بین الحالات الأربعة فی معاملات الصعوبة دلتا فکانت النتائج کما هی موضحة فی جدول (16):

جدول (16):

المقارنات البعدیة لمعاملات صعوبة البنود فی ضوء استخدام استراتیجیات أداء الاختبار

المجموعات

الأفراد ککل

 (م= 11.021)

بعد استبعاد أدنى

10 % (م= 12.145)

بعد استبعاد أدنى

20 % (م= 13.519)

بعد استبعاد أدنى 10 %

 (م= 12.145)

1.124**

 

 

بعد استبعاد أدنى 20 %

(م= 13.519)

2.498**

1.374**

 

بعد استبعاد أدنى 30 %

(م= 15.315)

4.294**

3.170**

1.796**

یتضح من جدول (16) أنه توجد فروق دالة إحصائیاً عند مستوى ثقة 0.01 فی معاملات صعوبة البنود المحولة (دلتا) حیث تزداد سهولة البند فی المجموعة التی تم فیها استبعاد أدنى 30% من الأفراد فی استخدام استراتیجیات أداء الاختبار، بینما کانت أعلى المجموعات فی معاملات الصعوبة هی مجموعة الأفراد ککل دون استبعاد متدنی استخدام استراتیجیات أداء الاختبار.

2-     تمییز البنود:

للتعرف على مدى اختلاف تمییز بنود الاختبار التحصیلی باختلاف درجة استخدام استراتیجیات أداء الاختبار لدى الطلاب عینة البحث الحالی، تم حساب معاملات تمییز البنود فی حالة العینة الکلیة، وکذلک فی حالة استبعاد أدنى 10%، 20%، 30%، وفی کل حالة تم تحدید أعلى وأدنی 27% من الطلاب فی درجات الاختبار التحصیلی وتم حساب معامل الارتباط بین درجاتهم على بنود الاختبار والدرجة الکلیة فی الاختبار باعتباره مؤشر لتمییز البنود، فکانت کما هی موضحة بجدول (17):

جدول (17):

معاملات تمییز البنود فی ضوء استخدام استراتیجیات أداء الاختبار

قبل الاستبعاد

(ن= 49 لکل مجموعة)

بعد استبعاد أدنى 10%

(ن= 44 لکل مجموعة)

بعد استبعاد أدنى 20 %

(ن=38)

بعد استبعاد دنى 30%

(ن= 33 لکل مجموعة)

م

تمییز

م

تمییز

م

تمییز

م

تمییز

م

تمییز

م

تمییز

م

تمییز

م

تمییز

1

0.442

21

0.224

1

0.398

21

0.296

1

0.449

21

0.105

1

0.394

21

0.030

2

0.563

22

0.346

2

0.582

22

0.159

2

0.519

22

0.340

2

0.538

22

0.273

3

0.492

23

0.366

3

0.506

23

0.362

3

0.542

23

0.366

3

0.458

23

0.394

4

0.508

24

0.488

4

0.478

24

0.339

4

0.457

24

0.471

4

0.299

24

0.515

5

0.578

25

0.325

5

0.531

25

0.499

5

0.542

25

0.236

5

0.510

25

0.211

6

0.550

26

0.285

6

0.502

26

0.249

6

0.505

26

0.236

6

0.355

26

0.242

7

0.408

27

0.345

7

0.317

27

0.226

7

0.314

27

0.209

7

0.151

27

0.211

8

0.366

28

0.246

8

0.384

28

0.271

8

0.421

28

0.106

8

0.308

28

0.060

9

0.406

29

0.307

9

0.316

29

0.205

9

0.288

29

0.235

9

0.063

29

0.211

10

0.306

30

0.289

10

0.317

30

0.249

10

0.263

30

0.209

10

0.271

30

0.090

11

0.386

31

0.408

11

0.317

31

0.205

11

0.288

31

0.418

11

0.243

31

0.331

12

0.244

32

0.511

12

0.227

32

0.407

12

0.212

32

0.488

12

0.183

32

0.410

13

0.309

33

0.432

13

0.318

33

0.490

13

0.236

33

0.488

13

0.151

33

0.527

14

0.230

34

0.325

14

0.228

34

0.464

14

0.236

34

0.314

14

0.121

34

0.212

15

0.226

35

0.467

15

0.137

35

0.316

15

0.210

35

0.526

15

0.120

35

0.544

16

0.122

36

0.407

16

0.113

36

0.475

16

0.157

36

0.446

16

0.181

36

0.487

17

0.203

37

0.203

17

0.181

37

0.385

17

0.183

37

0.263

17

0.181

37

0.302

18

0.162

38

0.366

18

0.182

38

0.227

18

0.131

38

0.288

18

0.151

38

0.301

19

0.366

39

0.203

19

0.316

39

0.272

19

0.263

39

0.186

19

0.097

39

0.275

20

0.246

40

0.391

20

0.296

40

0.184

20

0.262

40

0.410

20

0.090

40

0.438

ثم تم استخدام تحلیل التباین للقیاسات المتکررة للکشف عن دلالة الفروق بین معاملات تمییز البنود فی الحالات الأربع؛ فکانت النتائج کما هی موضحة فی التالی:

جدول (18):

الإحصاءات الوصفیة لمعاملات تمییز البنود فی ضوء درجة استخدام استراتیجیات أداء الاختبار

المجموعات

المتوسط

الانحراف المعیاری

الأفراد ککل

0.351

0.115

بعد استبعاد أدنى 10 % فی استراتیجیات أداء الاختبار

0.323

0.121

بعد استبعاد أدنى 20 % فی استراتیجیات أداء الاختبار

0.321

0.131

بعد استبعاد أدنى 30 % فی استراتیجیات أداء الاختبار

0.273

0.149

جدول (19):

دلالة الفروق فی معاملات تمییز البنود فی ضوء درجة استخدام استراتیجیات أداء الاختبار

مصدر التباین

مجموع المربعات

درجات الحریة

التباین

النسبة الفائیة

درجة استخدام الاستراتیجیات

0.125

3

0.042

8.830**

الخطأ

0.554

117

0.005

یتضح من جدول (19) وجود فروق دالة إحصائیاً عند مستوى 0.01 فی معاملات تمییز البنود راجعة لاختلاف استخدام استراتیجیات أداء الاختبار، وتم استخدام اختبار أقل فرق دال LSD فی المقارنات البعدیة بین معاملات التمییز فی ضوء درجة استخدام استراتیجیات أداء الاختبار فکانت کما هی موضحة فی جدول (20):

جدول (20):

المقارنات البعدیة لمعاملات تمییز البنود فی ضوء استخدام استراتیجیات أداء الاختبار

المجموعات

الأفراد ککل

(م= 0.351)

بعد استبعاد أدنى 10 % (م= 0.323)

بعد استبعاد أدنى 20 % (م= 0.321)

بعد استبعاد أدنى 10 % (م= 0.323)

0.028

 

 

بعد استبعاد أدنى 20 % (م= 0.321)

0.031**

0.003

 

بعد استبعاد أدنى 30 % (م= 0.273)

0.078**

0.050*

0.047**

یتضح من جدول (20) أن معاملات تمییز البنود تزداد فی المجموعتین قبل استبعاد أی من الأفراد وبعد استبعاد 10% فقط من الأفراد بینما تقل معاملات التمییز للبنود فی المجموعة التی تم استبعاد أدنى 20% من الأفراد فی استخدام استراتیجیات أداء الاختبار وکانت أقل معاملات التمییز فی حالة المجموعة التی تم استبعاد أقل 30% من الأفراد المتدنین فی استخدام استراتیجیات أداء الاختبار.

          ویمکن تفسیر النتائج السابقة والخاصة بزیادة سهولة البنود والانخفاض فی معاملات التمییز فی ضوء خصائص ذوی الاستخدام المنخفض لاستراتیجیات أداء الاختبار حیث یلجأ هؤلاء إلى التخمین العشوائی فی حالة البنود الصعبة بینما أصحاب استراتیجیات الأداء یحاولون الاستفادة من معارفهم الجزئیة والتامة فی الوصول إلى الإجابة الصحیحة وهو ما جعل البنود تبدو أکثر سهولة لهم، وکذلک باستبعاد هؤلاء الأفراد منخفضی استخدام استراتیجیات أداء الاختبار أصبحت الإجابة على البنود أکثر تجانساً مما أسهم فی انخفاض تمییز البنود، وهو ما یدل على أن التباین الکبیر فی استخدام استراتیجیات أداء الاختبار یصحبه زیادة مصطنعة فی معاملات صعوبة البنود وفی معاملات تمییزها وهو ما یستدعی الحذر عند تقنین الاختبارات المعرفیة فی مثل هذه الحالات، وهو ما یتفق مع ما یؤکد علیه Wolf et al. (1995, 350) ففی حالة عدم بذل الممتحنین للجهد الکافی فی الإجابة على بنود الاختبار واستخدام الاستراتیجیات المناسبة للوصول للحل الصحیح والبرهنة على امتلاک المعرفة اللازمة یحدث تشویه لمعاملات صعوبة البنود وقدرتها على التمییز.

ویمکن تفسیر النتائج الحالیة کذلک بأن استبعاد الطلاب منخفضی استخدام استراتیجیات أداء الاختبار یصحبه دقة فی تقدیر السمة المقاسة، وبالتالی یتناسب أداء الفرد على بنود الاختبار مع درجته الکلیة فی الاختبار، ففی هذه الحالة یکون الأداء على البنود وبالتالی الدرجة الکلیة دالة للمستوى الحقیقی للسمة، وهو ما تؤکد علیه نتائج دراسة باسل أبوفودة (2008) حیث کان هناک زیادة فی دقة تقدیر صعوبة وتمییز البنود متمثلة فی تدنی الأخطاء المعیاریة فی تقدیرهما بعد تدریب الطلاب على مهارات الحکمة الاختباریة؛ وفی ضوء فکرة أنه کلما اقتربت صعوبة البنود من المستوى المتوسط تکون أکثر تمییزاً یتأکد أن تقدیر معاملات التمییز بعد استبعاد منخفضی استخدام استراتیجیات أداء الاختبار أصبح أکثر دقة، وهو ما یؤکد فکرة أن التباین فی استخدام استراتیجیات أداء الاختبار ینتج عنه تضخیم وهمی فی معاملات الصعوبة ومعاملات تمییز البنود.

وتتفق النتائج الحالیة مع نتائج دراسة فریح العطوی (2013) والتی أکدت على أن ارتفاع سمة المخاطرة لدى الممتحنین یصحبه زیادة مصطنعة فی الثبات والصعوبة وتمییز البنود ودالة معلومات الاختبار؛ ویتفق مع نتائج دراسة بلال الشواقفة (2011) والتی أکدت على انخفاض صعوبة البنود وانخفاض معاملات تمییزها لدى طلاب المجموعة التجریبیة الذین تم تدریبهم على الحکمة الاختباریة؛ ویتفق مع نتائج دراسة إیثار الخصاونة (1994) التی أکدت على زیادة سهولة البنود بعد تدریب الطلاب على مهارات الحکمة الاختباریة وتختلف معها فی أن تلک الدراسة أشارت إلى ارتفاع معاملات تمییز البنود بعد التدریب بینما فی البحث الحالی استبعاد الأفراد منخفضی استخدام استراتیجیات أداء الاختبار نتج عنه انخفاض فی معاملات التمییز؛ ولکنها تختلف مع نتائج دراسة Robie et al. (2001) والتی أکدت على عدم اختلاف الخصائص السیکومتریة للبنود (الصعوبة، التمییز) باختلاف دافعیة أداء الاختبار.

خامساً: نتائج الإجابة عن السؤال الخامس:

ینص السؤال الخامس للبحث الحالی على "هل تختلف الخصائص السیکومتریة للاختبار باختلاف استراتیجیات أداء الاختبار لدى الطلاب عینة البحث الحالی؟"

1-    ثبات الاختبار، والخطأ المعیاری للقیاس:

للتعرف على تأثیر درجة استخدام استراتیجیات أداء الاختبار على ثبات الاختبار تم حساب ثبات الاختبار باستخدام معادلة KR-20 فی حالة کل الطلاب وکذلک بعد استبعاد أدنی 10%، 20%، 30% فی درجة استخدام استراتیجیات أداء الاختبار، وتم استخدام الاحصائی W فی مقارنة معاملات ثبات الاختبار فی الحالات الأربع (إبراهیم یعقوب وباسل أبوفودة، 2012، 436)؛ والذی یتبع توزیع F بدرجات حریة (ن1 -1، ن2 – 1) والذی یحسب من المعادلة W= 1-α1/ 1-α2 حیث α1, α2 هما معاملی ثبات الاختبار المراد المقارنة بینهما ون1، ن2 هما عدد الممتحنین فی کل مجموعة، وللتعرف على الخطأ المعیاری للقیاس تم استخدام المعادلة رقم (21)، فکانت النتائج کما هی موضحة فی التالی:

جدول (21):

معاملات ثبات الاختبار والخطأ المعیاری للقیاس فی ضوء استخدام استراتیجیات أداء الاختبار

معاملات الثبات

معامل الثبات

الانحراف المعیاری

الخطأ المعیاری للقیاس

العینة ککل

0.726

9.249

4.841

بعد استبعاد أدنى 10%

0.761

9.310

4.551

بعد استبعاد أدنى 20%

0.782

8.515

3.976

بعد استبعاد أدنى 30%

0.822

7.555

3.187

ویتضح من جدول (21) أن الخطأ المعیاری للقیاس یقل باستبعاد الطلاب        منخفضی استخدام استراتیجیات أداء الاختبار، وهو ما یترتب على زیادة الثبات ونقص الانحراف المعیاری، والجدول التالی یوضح دلالة الفروق بین معاملات ثبات الاختبار فی الحالات المختلفة:

جدول (22):

دلالة الفروق فی معاملات ثبات الاختبار فی ضوء استخدام استراتیجیات أداء الاختبار

معاملات الثبات

العینة ککل (0.726)

بعد استبعاد أدنى 10% (0.761)

بعد استبعاد أدنى 20% (0.782)

بعد استبعاد أدنى 10% (0.761)

1.146

 

 

بعد استبعاد أدنى 20% (0.782)

1.257

1.096

 

بعد استبعاد أدنى 30% (0.822)

1.539*

1.343

1.225

یتضح من جدول (22):

-            أن معامل ثبات الاختبار التحصیلی یزداد باستبعاد الطلاب منخفضی استخدام استراتیجیات أداء الاختبار، ولم تکن الفروق بین معاملات الثبات فی الحالات المختلفة فروق دالة إحصائیاً، ماعدا الفرق بین معاملی الثبات فی حالة الدرجات قبل الاستبعاد وبعد استبعاد 30% من الطلاب فی ضوء استخدام استراتیجیات أداء الاختبار حیث کانت الفروق فی هذه الحالة دالة إحصائیاً عند مستوى 0.05.

2-       صدق الاختبار:

تم الکشف عن تأثیر استخدام استراتیجیات أداء الاختبار على صدق الاختبار باستخدام الصدق التلازمی عن طریق حساب معاملات الارتباط بین درجات الطلاب فی الاختبار التحصیلی ودرجاتهم فی الاختبار النهائی لمقرر القیاس والتقویم وذلک بالنسبة للأفراد ککل وللأفراد بعد استبعاد أدنى 10%، 20%، 30% فی استخدام استراتیجیات أداء الاختبار وباستخدام الصدق التنبؤی بحساب معاملات الارتباط بین درجات الطلاب فی الاختبار ومعدلاتهم الأکادیمیة فی الفصل الدراسی الأول فی جمیع المقررات.

وللمقارنة بین معاملات الارتباط فی الحالات الأربع تم استخدام التحویل اللوغاریتمی لتحویل کل معامل ارتباط إلى مقابلة اللوغاریتمی حتى تقترب معاملات الارتباط من التوزیع الطبیعی (Steiger, 1980, 246)؛ وتستخدم معادلة الدرجة الحرجة للمقارنة بین معاملات الارتباط اللوغاریتمیة من المعادلة:

 

 

 

 

حیث أن r هی معامل الارتباط و هی القیمة اللوغاریتمیة المقابلة لمعامل الارتباط من جداول فیشر، وn1, n2 تمثل عدد الممتحنین فی کل مجموعة، فکانت النتائج کما هی موضحة بجدول (23):

جدول (23):

الصدق التلازمی والصدق التنبؤی لدرجات الطلاب فی الاختبار التحصیلی فی ضوء استخدام استراتیجیات أداء الاختبار

المجموعات

الصدق التلازمی

الصدق التنبؤی

معامل الارتباط

دلالة الفروق فی معامل الارتباط

معامل الارتباط

دلالة الفروق فی معامل الارتباط

(1)

(2)

(3)

(1)

(2)

(3)

العینة ککل (1)

0.615

 

 

 

0.468

 

 

 

بعد استبعاد أدنى 10% (2)

0.658

0.659

 

 

0.522

0.649

 

 

بعد استبعاد أدنى 20% (3)

0.736

1.984*

1.313

 

0.614

1.825

1.167

 

بعد استبعاد أدنى 30% (4)

0.782

2.812**

2.150*

0.863

0.650

2.255*

1.615

0.479

یتضح من جدول (23) أن:

-             هناک زیادة فی صدق درجات الاختبار کما یعبر عنها بعلاقة درجات الاختبار بدرجات الاختبار النهائی للمقرر (الصدق التلازمی) وعلاقة درجات الاختبار التحصیلی بمعدل الطالب الأکادیمی (الصدق التنبؤی)، حیث أن استبعاد الطلاب منخفضی استخدام استراتیجیات أداء الاختبار ینتج عنه زیادة دالة فی علاقة درجات الاختبار التحصیلی بدرجات الاختبار النهائی للمقرر ومعدل الطالب الأکادیمی.

ویمکن تفسیر النتائج السابقة فی ضوء فکرة مدى تعبیر الدرجات فی الاختبار عن المستوى الحقیقی للسمة فعدم استخدام الطلاب لاستراتیجیات أداء الاختبار والذی قد یرجع لنقص دافعیة أداء الاختبار أو لعدم المعرفة بهذه الاستراتیجیات یؤدى إلى عدم قدرة الطالب على البرهنة على امتلاکه للمعرفة المطلوبة فی الاختبار ونقص فی الدرجة المستحقة، وهو ما ینتج عنه عدم تعبیر الدرجات فی الاختبار بصدق عن المستوى الحقیقی للسمة، وباستبعاد هؤلاء الأفراد یزداد صدق تعبیر الدرجات عن المستوى الحقیقی للسمة وهو ما یصحبه زیادة فی علاقة درجات الاختبار بغیرها من درجات المتغیرات المرتبطة.

وهو ما یتفق مع ما یؤکد علیه Barry and Finney (2009) ; Wise et al. (2006) ; Wise and DeMars (2010); Pohl et al. (2016); Lon and Iliescu (2017) حیث یؤثر عدم بذل الجهد الکافی فی أداء الاختبار وعدم استخدام استراتیجیات مناسبة لتحقیق ذلک على صدق الاختبار فاستخدام استراتیجیات أداء الاختبار یُمکن الطالب من البرهنة على معارفه ومهاراته وإظهار مستواه الحقیقی وهو ما یزید من صدق الدرجات، وتتفق النتائج السابقة مع نتائج دراسة Westfall and D'Costa (1987) والتی أکدت على أن استبعاد الأفراد غیر المطابقین یزید من الصدق التنبؤی لدرجات الاختبار؛ ومع نتائج دراسة Waskiewicz (2011) والتی أکدت أن تنقیة درجات الاختبار باستبعاد الطلاب الذین لا یؤدون بجدیة على الاختبار یسهم فی زیادة دقة درجات الاختبار فی التعبیر عن مستوى السمة المقاسة.

ومن جهة أخرى یمکن تفسیر تأثر صدق وثبات درجات الاختبار بمستوى استخدام الأفراد لاستراتیجیات أداء الاختبار بأن التباین فی هذه الاستراتیجیات یمکن اعتباره مصدراً للفروق بین الأفراد فی درجات الاختبار بجانب مستوى السمة الحقیقی، وبالتالی استبعاد الأفراد منخفضی استراتیجیات أداء الاختبار یسهم فی تحیید أثر الفروق بین الطلاب والراجع لتباین درجة استخدام هذه الاستراتیجیات وتکون الفروق بینهم راجعة لمستوى السمة المقاسة وهو ما یزید من ثبات الدرجات وصدقها فی التعبیر عن مستوى السمة، وهذا التفسیر یؤیده تأکید البعض على أن سلوکیات الفرد فی الموقف الاختباری والتی من أهمها استخدام استراتیجیات أداء الاختبار تعد من مصادر التباین غیر المرغوبة (تباین الخطأ) فی الدرجات بجانب التباین الحقیقی (Stenlund et al., 2016; Xu & Wu, 2012; Famularo, 2007; Wise et al., 2010; Penk et al., 2014).

وفی ضوء ذلک یفسر تحسن صدق الاختبار وثباته بأن استبعاد الأفراد منخفضی استخدام استراتیجیات أداء الاختبار یسهم فی الحد من التباین غیر المرغوب خاصة وأن الموقف الاختباری فی البحث الحالی لا یتوقف علیه أی قرارات تخص الطلاب مما أسهم فی زیادة نسبة منخفضی استخدام هذه الاستراتیجیات؛ وکذلک یؤکد Crocker (2006, 124) على أن صدق التنبؤات حول السمة المقاسة یتأثر کثیراً بتباین الطلاب فی استخدام استراتیجیات أداء الاختبار؛ ولذلک فإن تنقیة درجات الاختبار فی ضوء مستوى استخدام استراتیجیات أداء الاختبار یسهم فی زیادة صدق تعبیر درجات الاختبار عن السمة المقاسة (Parham, 1996, 3)؛ وهو ما یتفق مع ما یؤکد علیه Dodeen (2015, 109) بأن استراتیجیات أداء الاختبار تسهم فی تحسین صدقه والمترتب على أن تلک الاستراتیجیات تسهم فی إظهار المستوى الحقیقی للفرد فی السمة هذا من ناحیة ومن ناحیة أخرى تقلل من تحیز الدرجات للمرتفعین فی هذه الاستراتیجیات.      

وکذلک تتفق النتائج الحالیة مع ما أشار إلیه Ghafournia and Afghari (2014, 91) بأن التدریب على استراتیجیات أداء الاختبار یُمکن أن یسهم فی زیادة صدق الاختبار وثبات درجاته، حیث أن التدریب على هذه الاستراتیجیات یؤدی إلى الحد من التباین الراجع لاختلاف درجة استخدامها، ویتفق مع ما أکد علیه شیبرد Shepard فی 1990 بأن التدریب على هذه الاستراتیجیات یسهم فی تحقیق التکافؤ بین الأفراد فی الأداء على الاختبار (In: Orth, 1995, 5)؛ وهو ما یسهم فی الحد من التأثیر السلبی للتباین فی استخدام تلک الاستراتیجیات على دقة نتائج القیاس (Blerkom, 2009, 169).

فبالنسبة لثبات الاختبار التحصیلی فی البحث الحالی وتأثره بدرجة استخدام استراتیجیات أداء الاختبار فیلاحظ أن هناک تحسن فی معاملات ثبات الاختبار وخاصة فی حالة استبعاد أکبر قدر ممکن من منخفضی استخدام هذه الاستراتیجیات وهو ما یمکن تفسره بأن استبعاد هؤلاء الأفراد یصاحبه نقص فی تباین الخطأ وبالتالی تزداد نسبة التباین الحقیقی للتباین الکلی للدرجات وهو ما یسهم فی زیادة ثبات الاختبار، فمن مسلمات النظریة الکلاسیکیة فی القیاس أن التباین فی الدرجات الملاحظة یتکون من التباین الحقیقی وتباین الخطأ، وتباین الخطأ یمکن أن یکون له ثلاثة مکونات یتعلق أحدهما بالفرد والأخر بتفاعل الفرد مع البند وهى من الأخطاء المنتظمة بالإضافة للخطأ العشوائی مجهول المصدر وهو من الأخطاء غیر المنتظمة (Westfall & D'Costa, 1987, 3)؛ وبالتالی یمکن تفسیر التأثیر الإیجابی لاستبعاد الطلاب منخفضی استخدام استراتیجیات أداء الاختبار على ثباته بأن استبعادهم یحد من تباین الخطأ الراجع للفرد وتفاعله مع البنود؛ وتتفق النتائج الحالیة مع افتراضات النظریة التقلیدیة فی القیاس والمتعلقة بأن الأخطاء المنتظمة لا تؤثر کثیراً على ثبات الدرجات، ولکنها تؤثر أکثر على صدق الدرجات (فریح العطوی، 2013، 26)؛ حیث اتضح من النتائج المتعلقة بالثبات بأن هناک تحسن فی الثبات لکن الفروق بین معاملات الثبات لم تصل لمستوى الدلالة الإحصائیة فی غالبیة الحالات.

ومن ناحیة أخرى یمکن تفسیر النتائج الحالیة فی ضوء أن الأفراد منخفضی استراتیجیات أداء الاختبار قد یعتمدون على التخمین العشوائی فی الإجابة عن أسئلة الاختبار وبالتالی استبعاد هؤلاء یسهم فی زیادة صدق الاختبار وثباته، حیث أکدت نتائج دراسة باسل أبوفودة (2008) على أن الاعتماد على التخمین فی الإجابة یؤثر سلباً على صدق وثبات الاختبار؛ وکذلک یشیر Pohl et al. (2016, 4) إلى أن التخمین العشوائی للاستجابة والناتج عن نقص دافعیة أداء الاختبار ونقص الحکمة الاختباریة ینتج عنه مشکلات کبیرة تهدد المؤشرات السیکومتریة للبند وصدق وثبات الاختبار؛ ویؤکد Robie et al. (2001, 178) على نفس الأمر تقریباً بأن انخفاض دافعیة أداء الاختبار وبالتالی ما یترتب علیها من جهد مبذول فی محاولة الوصول لأقصى أداء ممکن یؤثر سلباً على الخصائص السیکومتریة        لأداة القیاس.

وتتفق النتائج الحالیة مع نتائج دراسة Wise et al. (2006); Wise and DeMars (2010) فی أن انخفاض دافعیة أداء الاختبار لدى بعض المشارکین ینتج عنها نقص غیر حقیقی فی معاملات الارتباط بین درجات الاختبار والمحکات الخارجیة التی یفترض أن ترتبط بالسمة موضوع القیاس؛ وتختلف معها فی أن ذلک ینتج عنه زیادة مصطنعة فی الثبات حیث أن البحث الحالی أکدت نتائجه أن انخفاض استخدام استراتیجیات أداء الاختبار والذی قد ینتج من انخفاض دافعیة أداء الاختبار ینتج عنه نقص فی ثبات الاختبار، فنقص استخدام استراتیجیات أداء الاختبار قد ینتج عنه احیاناً استجابات عشوائیة وعدم قدره على السیطرة على الانفعالات المصاحبة للموقف الاختباری والذی ینتج عنه تدنی فی مستوى الدرجات وعدم تجانس فی أداء الافراد على بنود الاختبار وبالتالی قد ترجع نسبة کبیرة من التباین فی الدرجات إلى تباین غیر حقیقی لا یعکس التباین فی السمة وهو ما یؤدى الی انخفاض ثبات الاختبار.

وفی ضوء نتائج البحث الحالی الخاصة بصعوبة البنود وتمییزها والتی اتضح منها أن استبعاد الأفراد منخفضی استخدام استراتیجیات أداء الاختبار نتج عنه زیادة فی سهولة البنود ونقص فی معاملات التمییز، والذی قد ینتج عنه نقص فی التباین الکلی للدرجات وفی الوقت نفسه یقل تباین الخطأ ویکون النقص فی تباین الدرجات الحقیقیة محدود مقارنة بالنقص فی التباین الکلی للدرجات وهو ما یسهم فی زیادة معامل ثبات الاختبار، وقد یبرر التفسیر السابق أنه على الرغم من تحسن معاملات الثبات إلا ان الفروق بین معاملات الثبات فی الحالات الأربع للبحث الحالی کانت غیر دالة فی أغلب الأحیان.

وتختلف النتائج الحالیة مع نتائج دراسة Robie et al. (2001) والتی توصلت إلى أن اختلاف دافعیة الطلاب لأداء الاختبار لا یؤثر على الخصائص السیکومتریة للاختبار من حیث الصدق البنائی والثبات؛ وتتفق النتائج الحالیة کثیراً مع نتائج دراسة Maspons and Llabre (1983) فی أن مستوى استراتیجیات أداء الاختبار لا یؤثر کثیراً فی ثبات الاختبار ولکنه یؤثر على صدقه؛ کذلک تتفق مع ما یشیر إلیه Clause (1996, 5) بأن التعرف على المستجیبین الذین لا تمثل درجاتهم فی الاختبار مستواهم الحقیقی فی السمة بناءً على محکات ومؤشرات دقیقة یسهم فی دقة تقدیر الخصائص السیکومتریة للاختبار ودقة القرارات المترتبة على الأداء فیه.

التوصیات والمقترحات:

-           ضرورة تدریس وتدریب الطلاب على استراتیجیات أداء الاختبار والذی یمکن أن یزید من صدق الاختبار بتحیید أثر الفروق بین الطلاب فی الاستراتیجیات على نتائج القیاس.

-           فی حالة الدراسات التجریبیة یجب الحذر عند استخدام اختبارات الأداء الأقصى فی سیاقات لا تمثل أهمیة بالنسبة للمشارکین فی التجربة، حیث أن التطبیق البعدی للاختبار قد یصاحبه زیادة فی دافعیة المشارکین لأداء الاختبار وهو ما قد یسهم فی زیادة معدل بذل الجهد واستخدام استراتیجیات أفضل فی أداء الاختبار، وبالتالی قد تکون الفروق بین القیاسین القبلی والبعدی ترجع فی جزءٍ کبیرٍ منها لاختلاف تلک المتغیرات فی مرتی التطبیق ولیس ناتج لتحسن فی المتغیرات موضوع التجربة.

-           ضرورة العمل على حفز المشارکین فی البحوث والدراسات التربویة التی تعتمد على استخدام اختبارات الأداء الأقصى بصفة عامة لبذل الجهد ومحاولة الوصول لأقصى استجابة ممکنة، بالقدر الذی یضمن تعبیر درجات القیاس عن المستوى الحقیقی للسمة، لما لذلک من تأثیر إیجابی على خصائص الاختبار السیکومتریة وبنوده.

-           استبعاد الحالات غیر الجادة فی الاستجابة عند تقنین أدوات البحوث لما لذلک من تأثیر إیجابی على دقة تقدیر الخصائص السیکومتریة للأداة، فوجود مثل هؤلاء یؤدی إلى تضخیم وهمى فی معاملات الصعوبة والتمییز، ویهدد صدق وثبات أدوات القیاس.

وفی ضوء النتائج الحالیة یمکن اقتراح اجراء البحوث التالیة:

-         تحری تأثیر استخدام استراتیجیات أداء الاختبار على خصائصه السیکومتریة باستخدام نماذج نظریة الاستجابة للمفردة.

-         دراسة تأثیر استخدام استراتیجیات أداء الاختبار على مؤشرات مطابقة الفرد وجودة أداؤه فی الاختبار.

-         الکشف عن المتغیرات النفسیة والمعرفیة التی تنبأ باستخدام الطلاب لاستراتیجیات أداء الاختبار.

-         المقارنة بین استراتیجیات أداء الاختبار لدى شرائح عمریة مختلفة ومراحل دراسیة مختلفة.

 

المراجع:

إبراهیم محمد یعقوب وباسل خمیس أبوفودة (2012). أثر مخالفة قواعد صیاغة فقرات الاختیار من متعدد على الخصائص السیکومتریة للاختبار وفقراته. مجلة جامعة دمشق، 28(1)، 419-443.

أحمد سلیمان عودة (1989). أثر تعلیم استراتیجیة التخمین فی اکتساب الطلبة بالمستوى الجامعی لمهارة حکمة الاختبار: دراسة تجریبیة. المجلة التربویة، جامعة الکویت، 6(20)، 123-137.

إیاد محمد حمادنة (2011). درجة استخدام الطلبة بالمستوی الجامعی لاستراتیجیات حکمة الاختبار. مجلة المنارة للبحوث والدراسات، الأردن، 17(1)، 291-312.

إیثار محمد الخصاونة (1994). أثر برنامج تدریبی لحنکة الاختبار على توزیع علامات الاختبار لأداء الطلبة والخصائص الإحصائیة للفقرات فی مادتی اللغة العربیة والریاضیات للصف السادس والصف التاسع. رسالة ماجستیر غیر منشورة، کلیة الدراسات العلیا، الجامعة الأردنیة، الأردن.

باسل خمیس أبوفودة (2008). أثر تعلم حکمة الاختبار على افتراض أحادیة البعد والتقدیرات المختلفة لنظریة استجابة الفقرة. رسالة دکتوراه غیر منشورة، کلیة التربیة، جامعة الیرموک، الأردن.

بلال محمود الشواقفة (2011). أثر تعلم حکمة الاختبار على معالم الفقرات والاختبار      عند مستویین من قدرات المفحوصین باستخدام النموذج ثلاث المعلمة. رسالة دکتوراه غیر منشورة، کلیة التربیة، جامعة الیرموک، الأردن.

بندر زید سالم الأمیر (2016). الأخطاء الشائعة فی بناء مفردات اختبار الاختیار من متعدد وتأثیرها على الخصائص السیکومتریة للاختبارات التحصیلیة. المجلة العربیة للعلوم الاجتماعیة، المؤسسة العربیة للاستشارات العلمیة وتنمیة الموارد البشریة، جمهوریة مصر العربیة، 9(4)، 137-175.

جابر محمد عبدالله عیسى (2014). تأثیر عدد بدائل الاستجابة لبنود الاختبار التحصیلی اختیار من متعدد على خصائصه السیکومتریة. مجلة کلیة التربیة، جامعة الأزهر، 157(1)، 121-170.

دیانا فهمی علی حماد (2010). علاقة الحکمة الاختباریة بالأداء الناتج من اختبار تحصیلی ذو اختیار من متعدد مبنی وفق نموذج راش لدى طالبات کلیة التربیة للبنات الأقسام الأدبیة بجامعة أم القرى. مجلة دراسات عربیة فی التربیة وعلم النفس، رابطة التربویین العرب، 4(4)، 297-338.

زین حسن ردادی (2001). الحکمة الاختباریة وعلاقتها بنوع الطالب وتخصصه وتحصیله الدراسی. مجلة کلیة التربیة، جامعة الزقازیق، 39، 1-34.

سامی عاید العنزی (2014). علاقة الحکمة الاختباریة بتحصیل طلبة المرحلة الثانویة فی دولة الکویت فی اختبار تحصیلی مبنی وفق نموذج راش. عالم التربیة، المؤسسة العربیة للاستشارات العلمیة وتنمیة الموارد البشریة، جمهوریة مصر العربیة، 15(47)، 345-369.

سعود بشیر العنزی (2014). مهارات الحکمة الاختباریة فی ضوء متغیرات النوع والقدرة العامة والتحصیل الدراسی لدى طلاب السنة التحضیریة فی جامعة الحدود الشمالیة. مجلة التربیة، کلیة التربیة، جامعة الأزهر، 161(2)، 327-364.

السید محمد أبوهاشم (2008). النموذج البنائی التنبؤی لمهارات الدراسة والحکمة الاختباریة والتحصیل الدراسی لدى طلاب المرحلة الثانویة. مجلة کلیة التربیة، جامعة المنصورة، 68(1)، 210-270.

صلاح الدین محمود علام (2006). القیاس والتقویم التربوی والنفسی. القاهرة: دار الفکر العربی.

صلاح الدین محمود علام (2012). الاختبارات والمقاییس التربویة والنفسیة. عمان: دار الفکر.

عصام الدسوقی إسماعیل الجبة (2012). الخصائص السیکومتریة لمفردات اختیار من متعدد تتضمن أکثر من إجابة صحیحة. مجلة کلیة التربیة، جامعة المنصورة، 81، 141-174.

عفاف زیاد وادی (2013). مهارات الحکمة الاختباریة وعلاقتها بالتحصیل الدراسی لدى طلبة کلیة التربیة/ ابن الهیثم للعلوم الصرفة. مجلة البحوث التربویة والنفسیة، جامعة بغداد، العراق، 37، 295-322.

فاطمة عباس مطلک (2009). قیاس مستوى الحکمة الاختباریة لدى الطلبة المتمیزین والمتمیزات وأقرانهم الاعتیادین من المرحلة الإعدادیة (دراسة مقارنة فی مرکز محافظة نینوی). مجلة کلیة الآداب، جامعة بغداد، العراق، 91، 566-598.

فریح محمد العطوی (2013). أثر المخاطرة على الخصائص السیکومتریة لفقرات الاختبار وقدرات الأفراد. رسالة ماجستیر غیر منشورة، کلیة التربیة، جامعة الیرموک، الأردن.

مایسة فاضل أبومسلم (2016). أثر کل من عدد البدائل وترتیبها لمفردات اختبار تحصیلی دراسی من نوع الاختیار من متعدد على الخصائص السیکومتریة للاختبار ومفرداته. مجلة اتحاد الجامعات العربیة للتربیة وعلم النفس، 14(2)، 154-187.

مجدی محمد أحمد الشحات (2007). أثر التدریب على الحکمة الاختباریة على مستوى کل من قلق الاختبار والتحصیل الدراسی. مجلة کلیة التربیة، جامعة بنها، 17(69)، 1-37.

محمد محمود محمد عبدالوهاب (2007). أثر برنامج تدریبی لمهارة حکمة الاختبار على مستوى الأداء التحصیلی وقلق الاختبار لدى عینة من طلبة کلیة التربیة بالمنیا. رسالة ماجستیر غیر منشورة، کلیة التربیة، جامعة المنیا.

نعمان الموسوی (1997). تحدید العدد الأمثل لخیارات الفقرة فی اختبار الاختیار من متعدد فی ضوء بعض خصائصه السیکومتریة. المجلة التربویة، جامعة الکویت، 11(44)، 199-256.

هدى محمد عبدالله العریفی (2008). تباین الخصائص السیکومتریة لاختبار متعدد البدائل بتباین عدد مفرداته وبعض الخصائص الدافعیة للمفحوصین. رسالة ماجستیر غیر منشورة، کلیة التربیة، جامعة أم القرى، المملکة العربیة السعودیة.

Amer, A. (2007). EFL/ESL Test-Wiseness and Test-taking Strategies. ERIC Number: ED497399.

Arsal, Z. (2014). Relationships between Test Anxiety and Test-Taking Strategies. Faculty of Education Journal, Abant İzzet Baysal University, Turkey, 14(2), 306-320.

Banks, T., & Eaton, I. (2014). Improving Test-Taking Performance of Secondary At-Risk Youth and Students with Disabilities. Preventing School Failure, 58(4), 207–213. Doi: https://doi.org/10.1080/1045988X.2013.792765.

Barry, C., & Finney, S. (2009, October). Exploring Change in Test-Taking Motivation. Paper Presented at Annual Meeting of the Northeastern Educational Research Association, Rocky Hill, New Jersey.

Bicak, B. (2013). Scale for Test Preparation and Test Taking Strategies. Educational Sciences: Theory & Practice, 13(1), 279-289.

Blerkom, M. (2009). Measurement and Statistics for Teachers. New York: Routledge, Taylor & Francis Group.

Chittooran, M., & Dorothy, M. (2001, April). Test-Taking Skills for Multiple-Choice Formats: Implications for School Psychologists. Annual Conference of the National Association of School Psychologists, Washington.

Cizek, G.; Bowen, D., & Church, K (2010). Sources of Validity Evidence for Educational and Psychological Tests: A Follow-Up Study. Educational and Psychological Measurement, 70(5), 732-743.                                            DOI: https://doi.org/10.1177/0013164410379323.

Clause, C. (1996). The Effects of Test Appropriateness on Reliability and Validity. Master Degree Thesis, Michigan State University.

Colliver, J.; Conlee, M., & Verhulst, S. (2012). From Test Validity to Construct Validity and back?. Medical Education, 46, 366–371.                                     DOI: https://doi.org/10.1111/j.1365-2923.2011.04194.x.

Crocker, L. (2006). Preparing Examinees for Test Taking: Guidelines for Test Developers and Test Users. In: S., M., Downing & T., M., Haladyna (Eds.), Handbook of test development, (Pp.115-128), New Jersey: Lawrence Erlbaum Associates, Publishers.

Cui, Y., & Roberts, R. (2013). Validating Student Score Inferences with Person-Fit Statistic and Verbal Reports: A Person-Fit Study for Cognitive Diagnostic Assessment. Educational Measurement: Issues and Practice,  32 (1), 34-42. DOI: https://doi.org/10.1111/emip.12003.

Dodeen, H. (2008). Assessing Test-Taking Strategies of University Students: Developing a Scale and Estimating its Psychometric Indices. Assessment & Evaluation in Higher Education, 33(4), 409-419.                                                     Doi: https://doi.org/10.1080/02602930701562874.

Dodeen, H. (2009). Test-Related Characteristics of UAEU Students: Test-Anxiety, Test-Taking Skills, Guessing, Attitudes toward Tests, and Cheating. Faculty of Education Journal, United Arab Emirates University, 26, 31-66.

Dodeen, H. (2015). Teaching Test-Taking Strategies: Importance and Techniques. Psychology Research, 5(2), 108-113.

Dodeen, H.; Abdelfatah, F., & Alshumrani, S. (2014). Test-Taking Skills of Secondary Students: The Relationship with Motivation, Attitudes, Anxiety and Attitudes towards Tests. South African Journal of Education, 34(2), 1-18.

Domino, M., & Domino, G. (2006). Psychological Testing: An Introduction. 2nd ed. Cambridge University Press

Ellis, A., & Ryan, A. (2003). Race and Cognitive-Ability Test Performance: The Mediating Effects of Test Preparation, Test-Taking Strategy Use and Self-Efficacy. Journal of Applied Social Psychology, 33(12), 2607-2629.                     DOI: https://doi.org/10.1111/j.1559-1816.2003.tb02783.x.

Eme, J., & Udoh, A. (2011). Some Psycho-Academic Variables as Determinants of Students Performance in English Studies in Akwa Ibom State, Nigeria. International Multidisciplinary Research Journal, 5(2), 177-188.

Famularo, L. (2007). The Effect of Response Format and Test Taking Strategies on Item Difficulty: A Comparison of Stem-Equivalent Multiple-Choice and Constructed-Response Test Items. PH. D. Dissertation, Lynch School of Education, Boston College. 

Ghafournia, N., & Afghari, A. (2014). The Interaction among Using Test-Taking Strategies, Level of Language Proficiency, and Test Performance. Iranian Journal of Research in English Language Teaching, 1(3), 83-94.

Guion, R. (1998). Assessment, Measurement, and Prediction for Personnel Decisions. New Jersey: Erlbaum.

Holzer, M.; Madaus, J.; Bray, M., & Kehle, T. (2009). The Test-Taking Strategy Intervention for College Students with Learning Disabilities. Learning Disabilities Research & Practice, 24(1), 44–56.

Hong, E.; Sas, M., & Sas, j. (2006). Test-Taking Strategies of High and Low Mathematics Achievers. The Journal of Educational Research, 99(3), 144-155. DOI: https://doi.org/10.1111/j.1540-5826.2008.01276.x.

Johnson, E., & Arnold, N. (2004). Validating an Alternate Assessment. Remedial and Special Education, 25(5). 266-275. DOI: https://doi.org/10.1177/07419325040250050101

Kim, Y., & Goetz, E. (1993). Strategic Processing of Test Questions: The Test Marking Responses of College Students. Learning and individual Differences, 5(3), 211-218. DOI: https://doi.org/10.1016/1041-6080(93)90003-B

Lancaster, P.; Schumaker, J.; Lancaster, S., & Deshler, D. (2009). Effects of a Computerized Program on Use of the Test Taking Strategy by Secondary Students with Disabilities. Learning Disability Quarterly, 32(3), 165-179. DOI: https://doi.org/10.2307/27740366

Liao, C.; Hatrak, N., & Yu, F. (2010). Comparison of Content, Item Statistics and Test-Taker Performance for the Redesigned and Classic TOEIC Listening and Reading Test. Test of English for International Communication (TOEIC) Compendium, 4, 1-9.

Lon, A., & Iliescu, D. (2017). The Measurement Equivalence of Personality Measures across High- and Low-Stake Test Taking Settings. Personality and Individual Differences, 110, 1–6. DOI: https://doi.org/10.1016/j.paid.2017.01.008

Maspons, M., & Llabre, M. (1983, April). Effect of Pretraining Hispanic Students on Test-Taking Strategies on the Reliability and Predictive Validity of a Mathematics Predictor test. Paper presented at the Annual Meeting of the American Educational Research Association, Montreal, Quebec.

Nguyen, H. (2003).  Constructing a New Theoretical Framework for Test Wiseness and Developing the Knowledge of Test-Taking Strategies (KOTTS) Measure. Master Degree Thesis, Michigan State University.

Oakland, T.; Callueng, C., & Harris, G. (2012). The Impact of Test-Taking Behaviors on WISC-IV Spanish Domain Scores in Its Standardization Sample. Journal of Psychoeducational Assessment, 30, 139-147. DOI: https://doi.org/10.1177/0734282911423358 

Orth, J. (1995). The Effect of Test Taking Strategies for Multiple-Choice Tests. PH. D. Thesis, Graduate Faculty, School of Education, University of Pittsburgh, Pennsylvania.

Parham, S. (1996). The Relationships between Test-Taking Strategies and Cognitive Ability Test Performance. PH. D. Thesis, Graduate College, Bowling Green State University, Ohio. 

Penk, C.; Pohlmann, C., & Roppelt, A. (2014). The role of Test-Taking Motivation for Students’ Performance in Low-Stakes Assessments: An Investigation of School-Track-Specific Differences. Large-scale Assessments in Education, 2(5), 1-17. DOI: https://doi.org/10.1186/s40536-014-0005-4

Pohl, S.; Sudkamp, A.; Hardt, K., Carstensen, C., & Weinert, S. (2016) Testing Students with Special Educational Needs in Large-Scale Assessments-Psychometric Properties of Test Scores and Associations with Test Taking Behavior. Frontiers in Psychology, 7(154), 1-14. DOI: https://doi.org/10.3389/fpsyg.2016.00154

Pour-Mohammadi, M., & Abidin, M. (2011). Attitudes towards Teaching and Learning Test-taking Strategies for Reading Comprehension Tests: The Case of Iranian EFL Undergraduates. Journal of Studies in Education, 1(1), 1-12. DOI: https://doi.org/10.5296/jse.v1i1.1028

Reise, S., & Flannery, W. (1996). Assessing Person-Fit on Measures of Typical Performance. Applied Measurement in Education, 9(1), 9-26.

Robie, C.; Mueller, L., & Campion, J. (2001). Effects of a Motivational Inducement on the Psychometric Properties of a Cognitive Ability Test. Journal of Business and Psychology, 16(2), 177-189. DOI: 10.1023/A:1011153015413

Rogers, B. (1984, April). The Effects of Instructions on the Psychometric Properties of a survey Instrument. Paper Presented at the Annual Meeting of the American Educational Research Association, New Orleans. 

Rogers, W.; T., & Harley, D. (1999). An Empirical Comparison of Three- and Four-Choice Items and Tests: Susceptibility to Testwiseness and Internal Consistency Reliability. Educational and Psychological Measurement, 59(2), 234-247. DOI: https://doi.org/10.1177/00131649921969820

Rudner, L.; Bracey, G., & Skaggs, G. (1996). The Use of a Person-Fit Statistic with One High-Quality Achievement Test. Applied Measurement in Education, 9(1), 91-109. DOI: http://dx.doi.org/10.1207/s15324818ame0901_8

  Steiger, J. (1980). Tests for Comparing Elements of a Correlation Matrix. Psychological Bulletin, 87(2), 245-251. DOI: http://dx.doi.org/10.1037/0033-2909.87.2.245

Stenlund, T.; Eklof, H., & Lyren, P. (2017). Group Differences in Test-Taking Behavior: An Example from a High-Stakes Testing Program. Assessment in Education, 24(1), 4-20, DOI: http://dx.doi.org/10.1080/0969594X.2016.1142935.

Takallou, F.; Vahdany, F.; Araghi, S., & Tabrizi, A. (2015). The Effect of Test Taking Strategy Instruction on Iranian High School Students’ Performance on English Section of the University Entrance Examination and Their Attitude towards Using These Strategies. International Journal of Applied Linguistics & English Literature, 4(6), 119-129. DOI: http://dx.doi.org/10.7575/aiac.ijalel.v.4n.6p.119

Takallou, F.; Vahdany, F.; Araghi, S., & Tabrizi, A. (2016). Test-Taking Strategy Instruction in the National University Entrance Examination (NUEE) English Section. International Journal of Asian Social Science, 6(3), 177-191. DOI: 10.18488/journal.1/2016.6.3/1.3.177.191

Volante, L. (2006). Toward Appropriate Preparation for Standardized Achievement Testing. The Journal of Educational Thought, 40(2), 129-144.

Waskiewicz, R. (2011). Pharmacy Students’ Test-Taking Motivation-Effort on a Low-Stakes Standardized Test. American Journal of Pharmaceutical Education, 75 (3), 1-8. DOI: https://doi.org/10.5688/ajpe75341

 Westfall, P., & D'Costa, A. (1987). Improving Prediction by Correcting Test Scores for Person Disturbances Using the Rasch Model. ERIC Number: ED319768

Wise, V.; Wise, S., & Bhola, D. (2006). The Generalizability of Motivation Filtering in Improving Test Score Validity. Educational Assessment, 11(1), 65–83.

Wise, S., & DeMars, C. (2010). Examinee Non-Effort and the Validity of Program Assessment Results. Educational Assessment, 15, 27–41. DOI: http://dx.doi.org/10.1080/10627191003673216

Wise, S.; Ma, L.; Kingsbury, G., & Hauser, C. (2010, May). An Investigation of the Relationship between Time of Testing and Test-Taking Effort. Paper presented at the annual meeting of the National Council on Measurement in Education, Denver, Colorado.

Wise, S., & Kingsbury, G. (2016). Modeling Student Test-Taking Motivation in the Context of an Adaptive Achievement Test. Journal of Educational Measurement, 53(1), 86-105. DOI: 10.1111/jedm.12102

Wolf, L.; Smith, J., & Birnbaum, M. (1995). Consequence of Performance, Test Motivation, and Mentally Taxing Items. Applied Measurement in Education, 8(4), 341-351. DOI: http://dx.doi.org/10.1207/s15324818ame0804_4

Xu, T., & Wu, Z. (2012). Test-taking strategies for a high-stakes writing test: An exploratory study of 12 Chinese EFL learners. Assessing Writing, 17(3), 174–190. DOI: https://doi.org/10.1016/j.asw.2012.03.001

Zhang, W.; Liu, M.; Zhao, S., & Xie, Q. (2011). English Test-Taking Strategy Use and Students’ Test Performance. Asian English as Foreign Language Journal, 13(2),  133-168.

 

المراجع:
إبراهیم محمد یعقوب وباسل خمیس أبوفودة (2012). أثر مخالفة قواعد صیاغة فقرات الاختیار من متعدد على الخصائص السیکومتریة للاختبار وفقراته. مجلة جامعة دمشق، 28(1)، 419-443.
أحمد سلیمان عودة (1989). أثر تعلیم استراتیجیة التخمین فی اکتساب الطلبة بالمستوى الجامعی لمهارة حکمة الاختبار: دراسة تجریبیة. المجلة التربویة، جامعة الکویت، 6(20)، 123-137.
إیاد محمد حمادنة (2011). درجة استخدام الطلبة بالمستوی الجامعی لاستراتیجیات حکمة الاختبار. مجلة المنارة للبحوث والدراسات، الأردن، 17(1)، 291-312.
إیثار محمد الخصاونة (1994). أثر برنامج تدریبی لحنکة الاختبار على توزیع علامات الاختبار لأداء الطلبة والخصائص الإحصائیة للفقرات فی مادتی اللغة العربیة والریاضیات للصف السادس والصف التاسع. رسالة ماجستیر غیر منشورة، کلیة الدراسات العلیا، الجامعة الأردنیة، الأردن.
باسل خمیس أبوفودة (2008). أثر تعلم حکمة الاختبار على افتراض أحادیة البعد والتقدیرات المختلفة لنظریة استجابة الفقرة. رسالة دکتوراه غیر منشورة، کلیة التربیة، جامعة الیرموک، الأردن.
بلال محمود الشواقفة (2011). أثر تعلم حکمة الاختبار على معالم الفقرات والاختبار      عند مستویین من قدرات المفحوصین باستخدام النموذج ثلاث المعلمة. رسالة دکتوراه غیر منشورة، کلیة التربیة، جامعة الیرموک، الأردن.
بندر زید سالم الأمیر (2016). الأخطاء الشائعة فی بناء مفردات اختبار الاختیار من متعدد وتأثیرها على الخصائص السیکومتریة للاختبارات التحصیلیة. المجلة العربیة للعلوم الاجتماعیة، المؤسسة العربیة للاستشارات العلمیة وتنمیة الموارد البشریة، جمهوریة مصر العربیة، 9(4)، 137-175.
جابر محمد عبدالله عیسى (2014). تأثیر عدد بدائل الاستجابة لبنود الاختبار التحصیلی اختیار من متعدد على خصائصه السیکومتریة. مجلة کلیة التربیة، جامعة الأزهر، 157(1)، 121-170.
دیانا فهمی علی حماد (2010). علاقة الحکمة الاختباریة بالأداء الناتج من اختبار تحصیلی ذو اختیار من متعدد مبنی وفق نموذج راش لدى طالبات کلیة التربیة للبنات الأقسام الأدبیة بجامعة أم القرى. مجلة دراسات عربیة فی التربیة وعلم النفس، رابطة التربویین العرب، 4(4)، 297-338.
زین حسن ردادی (2001). الحکمة الاختباریة وعلاقتها بنوع الطالب وتخصصه وتحصیله الدراسی. مجلة کلیة التربیة، جامعة الزقازیق، 39، 1-34.
سامی عاید العنزی (2014). علاقة الحکمة الاختباریة بتحصیل طلبة المرحلة الثانویة فی دولة الکویت فی اختبار تحصیلی مبنی وفق نموذج راش. عالم التربیة، المؤسسة العربیة للاستشارات العلمیة وتنمیة الموارد البشریة، جمهوریة مصر العربیة، 15(47)، 345-369.
سعود بشیر العنزی (2014). مهارات الحکمة الاختباریة فی ضوء متغیرات النوع والقدرة العامة والتحصیل الدراسی لدى طلاب السنة التحضیریة فی جامعة الحدود الشمالیة. مجلة التربیة، کلیة التربیة، جامعة الأزهر، 161(2)، 327-364.
السید محمد أبوهاشم (2008). النموذج البنائی التنبؤی لمهارات الدراسة والحکمة الاختباریة والتحصیل الدراسی لدى طلاب المرحلة الثانویة. مجلة کلیة التربیة، جامعة المنصورة، 68(1)، 210-270.
صلاح الدین محمود علام (2006). القیاس والتقویم التربوی والنفسی. القاهرة: دار الفکر العربی.
صلاح الدین محمود علام (2012). الاختبارات والمقاییس التربویة والنفسیة. عمان: دار الفکر.
عصام الدسوقی إسماعیل الجبة (2012). الخصائص السیکومتریة لمفردات اختیار من متعدد تتضمن أکثر من إجابة صحیحة. مجلة کلیة التربیة، جامعة المنصورة، 81، 141-174.
عفاف زیاد وادی (2013). مهارات الحکمة الاختباریة وعلاقتها بالتحصیل الدراسی لدى طلبة کلیة التربیة/ ابن الهیثم للعلوم الصرفة. مجلة البحوث التربویة والنفسیة، جامعة بغداد، العراق، 37، 295-322.
فاطمة عباس مطلک (2009). قیاس مستوى الحکمة الاختباریة لدى الطلبة المتمیزین والمتمیزات وأقرانهم الاعتیادین من المرحلة الإعدادیة (دراسة مقارنة فی مرکز محافظة نینوی). مجلة کلیة الآداب، جامعة بغداد، العراق، 91، 566-598.
فریح محمد العطوی (2013). أثر المخاطرة على الخصائص السیکومتریة لفقرات الاختبار وقدرات الأفراد. رسالة ماجستیر غیر منشورة، کلیة التربیة، جامعة الیرموک، الأردن.
مایسة فاضل أبومسلم (2016). أثر کل من عدد البدائل وترتیبها لمفردات اختبار تحصیلی دراسی من نوع الاختیار من متعدد على الخصائص السیکومتریة للاختبار ومفرداته. مجلة اتحاد الجامعات العربیة للتربیة وعلم النفس، 14(2)، 154-187.
مجدی محمد أحمد الشحات (2007). أثر التدریب على الحکمة الاختباریة على مستوى کل من قلق الاختبار والتحصیل الدراسی. مجلة کلیة التربیة، جامعة بنها، 17(69)، 1-37.
محمد محمود محمد عبدالوهاب (2007). أثر برنامج تدریبی لمهارة حکمة الاختبار على مستوى الأداء التحصیلی وقلق الاختبار لدى عینة من طلبة کلیة التربیة بالمنیا. رسالة ماجستیر غیر منشورة، کلیة التربیة، جامعة المنیا.
نعمان الموسوی (1997). تحدید العدد الأمثل لخیارات الفقرة فی اختبار الاختیار من متعدد فی ضوء بعض خصائصه السیکومتریة. المجلة التربویة، جامعة الکویت، 11(44)، 199-256.
هدى محمد عبدالله العریفی (2008). تباین الخصائص السیکومتریة لاختبار متعدد البدائل بتباین عدد مفرداته وبعض الخصائص الدافعیة للمفحوصین. رسالة ماجستیر غیر منشورة، کلیة التربیة، جامعة أم القرى، المملکة العربیة السعودیة.
Amer, A. (2007). EFL/ESL Test-Wiseness and Test-taking Strategies. ERIC Number: ED497399.
Arsal, Z. (2014). Relationships between Test Anxiety and Test-Taking Strategies. Faculty of Education Journal, Abant İzzet Baysal University, Turkey, 14(2), 306-320.
Banks, T., & Eaton, I. (2014). Improving Test-Taking Performance of Secondary At-Risk Youth and Students with Disabilities. Preventing School Failure, 58(4), 207–213. Doi: https://doi.org/10.1080/1045988X.2013.792765.
Barry, C., & Finney, S. (2009, October). Exploring Change in Test-Taking Motivation. Paper Presented at Annual Meeting of the Northeastern Educational Research Association, Rocky Hill, New Jersey.
Bicak, B. (2013). Scale for Test Preparation and Test Taking Strategies. Educational Sciences: Theory & Practice, 13(1), 279-289.
Blerkom, M. (2009). Measurement and Statistics for Teachers. New York: Routledge, Taylor & Francis Group.
Chittooran, M., & Dorothy, M. (2001, April). Test-Taking Skills for Multiple-Choice Formats: Implications for School Psychologists. Annual Conference of the National Association of School Psychologists, Washington.
Cizek, G.; Bowen, D., & Church, K (2010). Sources of Validity Evidence for Educational and Psychological Tests: A Follow-Up Study. Educational and Psychological Measurement, 70(5), 732-743.                                            DOI: https://doi.org/10.1177/0013164410379323.
Clause, C. (1996). The Effects of Test Appropriateness on Reliability and Validity. Master Degree Thesis, Michigan State University.
Colliver, J.; Conlee, M., & Verhulst, S. (2012). From Test Validity to Construct Validity and back?. Medical Education, 46, 366–371.                                     DOI: https://doi.org/10.1111/j.1365-2923.2011.04194.x.
Crocker, L. (2006). Preparing Examinees for Test Taking: Guidelines for Test Developers and Test Users. In: S., M., Downing & T., M., Haladyna (Eds.), Handbook of test development, (Pp.115-128), New Jersey: Lawrence Erlbaum Associates, Publishers.
Cui, Y., & Roberts, R. (2013). Validating Student Score Inferences with Person-Fit Statistic and Verbal Reports: A Person-Fit Study for Cognitive Diagnostic Assessment. Educational Measurement: Issues and Practice,  32 (1), 34-42. DOI: https://doi.org/10.1111/emip.12003.
Dodeen, H. (2008). Assessing Test-Taking Strategies of University Students: Developing a Scale and Estimating its Psychometric Indices. Assessment & Evaluation in Higher Education, 33(4), 409-419.                                                     Doi: https://doi.org/10.1080/02602930701562874.
Dodeen, H. (2009). Test-Related Characteristics of UAEU Students: Test-Anxiety, Test-Taking Skills, Guessing, Attitudes toward Tests, and Cheating. Faculty of Education Journal, United Arab Emirates University, 26, 31-66.
Dodeen, H. (2015). Teaching Test-Taking Strategies: Importance and Techniques. Psychology Research, 5(2), 108-113.
Dodeen, H.; Abdelfatah, F., & Alshumrani, S. (2014). Test-Taking Skills of Secondary Students: The Relationship with Motivation, Attitudes, Anxiety and Attitudes towards Tests. South African Journal of Education, 34(2), 1-18.
Domino, M., & Domino, G. (2006). Psychological Testing: An Introduction. 2nd ed. Cambridge University Press
Ellis, A., & Ryan, A. (2003). Race and Cognitive-Ability Test Performance: The Mediating Effects of Test Preparation, Test-Taking Strategy Use and Self-Efficacy. Journal of Applied Social Psychology, 33(12), 2607-2629.                     DOI: https://doi.org/10.1111/j.1559-1816.2003.tb02783.x.
Eme, J., & Udoh, A. (2011). Some Psycho-Academic Variables as Determinants of Students Performance in English Studies in Akwa Ibom State, Nigeria. International Multidisciplinary Research Journal, 5(2), 177-188.
Famularo, L. (2007). The Effect of Response Format and Test Taking Strategies on Item Difficulty: A Comparison of Stem-Equivalent Multiple-Choice and Constructed-Response Test Items. PH. D. Dissertation, Lynch School of Education, Boston College. 
Ghafournia, N., & Afghari, A. (2014). The Interaction among Using Test-Taking Strategies, Level of Language Proficiency, and Test Performance. Iranian Journal of Research in English Language Teaching, 1(3), 83-94.
Guion, R. (1998). Assessment, Measurement, and Prediction for Personnel Decisions. New Jersey: Erlbaum.
Holzer, M.; Madaus, J.; Bray, M., & Kehle, T. (2009). The Test-Taking Strategy Intervention for College Students with Learning Disabilities. Learning Disabilities Research & Practice, 24(1), 44–56.
Hong, E.; Sas, M., & Sas, j. (2006). Test-Taking Strategies of High and Low Mathematics Achievers. The Journal of Educational Research, 99(3), 144-155. DOI: https://doi.org/10.1111/j.1540-5826.2008.01276.x.
Johnson, E., & Arnold, N. (2004). Validating an Alternate Assessment. Remedial and Special Education, 25(5). 266-275. DOI: https://doi.org/10.1177/07419325040250050101
Kim, Y., & Goetz, E. (1993). Strategic Processing of Test Questions: The Test Marking Responses of College Students. Learning and individual Differences, 5(3), 211-218. DOI: https://doi.org/10.1016/1041-6080(93)90003-B
Lancaster, P.; Schumaker, J.; Lancaster, S., & Deshler, D. (2009). Effects of a Computerized Program on Use of the Test Taking Strategy by Secondary Students with Disabilities. Learning Disability Quarterly, 32(3), 165-179. DOI: https://doi.org/10.2307/27740366
Liao, C.; Hatrak, N., & Yu, F. (2010). Comparison of Content, Item Statistics and Test-Taker Performance for the Redesigned and Classic TOEIC Listening and Reading Test. Test of English for International Communication (TOEIC) Compendium, 4, 1-9.
Lon, A., & Iliescu, D. (2017). The Measurement Equivalence of Personality Measures across High- and Low-Stake Test Taking Settings. Personality and Individual Differences, 110, 1–6. DOI: https://doi.org/10.1016/j.paid.2017.01.008
Maspons, M., & Llabre, M. (1983, April). Effect of Pretraining Hispanic Students on Test-Taking Strategies on the Reliability and Predictive Validity of a Mathematics Predictor test. Paper presented at the Annual Meeting of the American Educational Research Association, Montreal, Quebec.
Nguyen, H. (2003).  Constructing a New Theoretical Framework for Test Wiseness and Developing the Knowledge of Test-Taking Strategies (KOTTS) Measure. Master Degree Thesis, Michigan State University.
Oakland, T.; Callueng, C., & Harris, G. (2012). The Impact of Test-Taking Behaviors on WISC-IV Spanish Domain Scores in Its Standardization Sample. Journal of Psychoeducational Assessment, 30, 139-147. DOI: https://doi.org/10.1177/0734282911423358 
Orth, J. (1995). The Effect of Test Taking Strategies for Multiple-Choice Tests. PH. D. Thesis, Graduate Faculty, School of Education, University of Pittsburgh, Pennsylvania.
Parham, S. (1996). The Relationships between Test-Taking Strategies and Cognitive Ability Test Performance. PH. D. Thesis, Graduate College, Bowling Green State University, Ohio. 
Penk, C.; Pohlmann, C., & Roppelt, A. (2014). The role of Test-Taking Motivation for Students’ Performance in Low-Stakes Assessments: An Investigation of School-Track-Specific Differences. Large-scale Assessments in Education, 2(5), 1-17. DOI: https://doi.org/10.1186/s40536-014-0005-4
Pohl, S.; Sudkamp, A.; Hardt, K., Carstensen, C., & Weinert, S. (2016) Testing Students with Special Educational Needs in Large-Scale Assessments-Psychometric Properties of Test Scores and Associations with Test Taking Behavior. Frontiers in Psychology, 7(154), 1-14. DOI: https://doi.org/10.3389/fpsyg.2016.00154
Pour-Mohammadi, M., & Abidin, M. (2011). Attitudes towards Teaching and Learning Test-taking Strategies for Reading Comprehension Tests: The Case of Iranian EFL Undergraduates. Journal of Studies in Education, 1(1), 1-12. DOI: https://doi.org/10.5296/jse.v1i1.1028
Reise, S., & Flannery, W. (1996). Assessing Person-Fit on Measures of Typical Performance. Applied Measurement in Education, 9(1), 9-26.
Robie, C.; Mueller, L., & Campion, J. (2001). Effects of a Motivational Inducement on the Psychometric Properties of a Cognitive Ability Test. Journal of Business and Psychology, 16(2), 177-189. DOI: 10.1023/A:1011153015413
Rogers, B. (1984, April). The Effects of Instructions on the Psychometric Properties of a survey Instrument. Paper Presented at the Annual Meeting of the American Educational Research Association, New Orleans. 
Rogers, W.; T., & Harley, D. (1999). An Empirical Comparison of Three- and Four-Choice Items and Tests: Susceptibility to Testwiseness and Internal Consistency Reliability. Educational and Psychological Measurement, 59(2), 234-247. DOI: https://doi.org/10.1177/00131649921969820
Rudner, L.; Bracey, G., & Skaggs, G. (1996). The Use of a Person-Fit Statistic with One High-Quality Achievement Test. Applied Measurement in Education, 9(1), 91-109. DOI: http://dx.doi.org/10.1207/s15324818ame0901_8
  Steiger, J. (1980). Tests for Comparing Elements of a Correlation Matrix. Psychological Bulletin, 87(2), 245-251. DOI: http://dx.doi.org/10.1037/0033-2909.87.2.245
Stenlund, T.; Eklof, H., & Lyren, P. (2017). Group Differences in Test-Taking Behavior: An Example from a High-Stakes Testing Program. Assessment in Education, 24(1), 4-20, DOI: http://dx.doi.org/10.1080/0969594X.2016.1142935.
Takallou, F.; Vahdany, F.; Araghi, S., & Tabrizi, A. (2015). The Effect of Test Taking Strategy Instruction on Iranian High School Students’ Performance on English Section of the University Entrance Examination and Their Attitude towards Using These Strategies. International Journal of Applied Linguistics & English Literature, 4(6), 119-129. DOI: http://dx.doi.org/10.7575/aiac.ijalel.v.4n.6p.119
Takallou, F.; Vahdany, F.; Araghi, S., & Tabrizi, A. (2016). Test-Taking Strategy Instruction in the National University Entrance Examination (NUEE) English Section. International Journal of Asian Social Science, 6(3), 177-191. DOI: 10.18488/journal.1/2016.6.3/1.3.177.191
Volante, L. (2006). Toward Appropriate Preparation for Standardized Achievement Testing. The Journal of Educational Thought, 40(2), 129-144.
Waskiewicz, R. (2011). Pharmacy Students’ Test-Taking Motivation-Effort on a Low-Stakes Standardized Test. American Journal of Pharmaceutical Education, 75 (3), 1-8. DOI: https://doi.org/10.5688/ajpe75341
 Westfall, P., & D'Costa, A. (1987). Improving Prediction by Correcting Test Scores for Person Disturbances Using the Rasch Model. ERIC Number: ED319768
Wise, V.; Wise, S., & Bhola, D. (2006). The Generalizability of Motivation Filtering in Improving Test Score Validity. Educational Assessment, 11(1), 65–83.
Wise, S., & DeMars, C. (2010). Examinee Non-Effort and the Validity of Program Assessment Results. Educational Assessment, 15, 27–41. DOI: http://dx.doi.org/10.1080/10627191003673216
Wise, S.; Ma, L.; Kingsbury, G., & Hauser, C. (2010, May). An Investigation of the Relationship between Time of Testing and Test-Taking Effort. Paper presented at the annual meeting of the National Council on Measurement in Education, Denver, Colorado.
Wise, S., & Kingsbury, G. (2016). Modeling Student Test-Taking Motivation in the Context of an Adaptive Achievement Test. Journal of Educational Measurement, 53(1), 86-105. DOI: 10.1111/jedm.12102
Wolf, L.; Smith, J., & Birnbaum, M. (1995). Consequence of Performance, Test Motivation, and Mentally Taxing Items. Applied Measurement in Education, 8(4), 341-351. DOI: http://dx.doi.org/10.1207/s15324818ame0804_4
Xu, T., & Wu, Z. (2012). Test-taking strategies for a high-stakes writing test: An exploratory study of 12 Chinese EFL learners. Assessing Writing, 17(3), 174–190. DOI: https://doi.org/10.1016/j.asw.2012.03.001
Zhang, W.; Liu, M.; Zhao, S., & Xie, Q. (2011). English Test-Taking Strategy Use and Students’ Test Performance. Asian English as Foreign Language Journal, 13(2),  133-168.