أثر وجود أداء تفاضلي في الفقرات المشترکة على دقة المعادلة العمودية لاختبار رافن للذکاء في ضوء نموذج فيشر للاستجابة للمفردة

نوع المستند : المقالة الأصلية

المؤلفون

1 أستاذ ورئيس قسم علم النفس التربوي کلية التربية – جامعة أسيوط

2 مدرس علم النفس التربوي کلية التربية – جامعة أسيوط

10.12816/0042506

المستخلص

اهتم علماء النفس منذ أن وجدت حرکة القياس النفسى، بتحقيق صدق وثبات الاختبارات والمقاييس النفسية، سعياً منهم لتحقيق أعلى درجة من الموضوعية في                   هذه الأدوات، عند استخدامها في عملية القياس0 ووفق نظرية القياس التقليدية                Classical Theory يمکن التعبير عن قدرة الفرد من خلال الدرجة الحقيقية والتى تتضح من خلال أدائه على الاختبار، وبناءً عليه فإنه سيتغير وضع قدرة الفرد حسب تغير مستوى الاختبار0 إن الاختبار والبنود تتغير خصائصها بتغير خصائص الأفراد، کما أن خصائص الأفراد تتغير بتغير خصائص الاختبار من حيث السهولة والصعوبة. 
إن معادلة الاختبارات بواسطة نظرية الاستجابة للمفردة تحل الکثير من المشکلات التي عجزت عنها النظرية التقليدية بشرط أن يکون النموذج المستخدم في النظرية الحديثة مطابقاً للبيانات المعدة للمعادلة(Kolen, M., 1991, 8).
ويعد نموذج فيشر اللوجستي تطبيقاً أوسع لنموذج راش مع وجود بعض القيود الخطية على معلمات البنود، فهذا النموذج يعطي اهتماما خاصا باحتمالية التقدير القصوى، ويوفر هذا النموذج أساساً لاختبار الفرضيات المتعلقة بصعوبة البند، کما تم عمل دراسات مسحية للعديد من الدراسات التجريبية في تحليل البند، تحيز البند، بناء الاختبار، وساعدت هذه الدراسات في تقديم نوع جديد من تطبيقات الاستجابة للمفردة إلى عمليات ديناميکية، وقد اقترح أيضا فيشر نموذجا خاصا من LLTM لقياس التغيير في فضاء متعدد الأبعاد(Fischer, H., 1982, 380).
ولعل وضع نماذج للاختبار عبر مستويات مختلفة من القدرة على مقياس واحد يساعدنا في مقارنة درجات المفحوصين بشکل مباشر ويسهل عملية تطبيق الاختبار، إضافة إلى توفير الجهد والوقت، کما أن وجود فقرات ذات أداء تفاضلي ضمن نماذج الاختبار قد يؤثر في دقة معادلة درجات الاختبارات، لذلک من المهم تحديد هذه الفقرات والکشف عن أثرها في عملية المعادلة (Hidalgo, M. & Lopez, J.,  2002, 32).
 

الموضوعات الرئيسية


 

           کلیة التربیة

        کلیة معتمدة من الهیئة القومیة لضمان جودة التعلیم

        إدارة: البحوث والنشر العلمی ( المجلة العلمیة)

    =======

أثر وجود أداء تفاضلی فی الفقرات المشترکة على دقة المعادلة العمودیة لاختبار رافن للذکاء فی ضوء نموذج فیشر للاستجابة للمفردة

 

إعــــداد

أ.د / عماد أحمد حسن علی               د / سمیرة محمد أحمد حسن

        أستاذ ورئیس قسم علم النفس التربوی               مدرس علم النفس التربوی

           کلیة التربیة – جامعة أسیوط                          کلیة التربیة – جامعة أسیوط  

 

م م/ علی صلاح عبد المحسن حسن

مدرس مساعد بقسم علم النفس التربوی

کلیة التربیة – جامعة أسیوط

 

 

}         المجلد الثانی والثلاثین– العدد الرابع– جزء ثانی– أکتوبر 2016م  {

http://www.aun.edu.eg/faculty_education/arabic

 

 

مقدمة البحث:

اهتم علماء النفس منذ أن وجدت حرکة القیاس النفسى، بتحقیق صدق وثبات الاختبارات والمقاییس النفسیة، سعیاً منهم لتحقیق أعلى درجة من الموضوعیة فی                   هذه الأدوات، عند استخدامها فی عملیة القیاس0 ووفق نظریة القیاس التقلیدیة                Classical Theory یمکن التعبیر عن قدرة الفرد من خلال الدرجة الحقیقیة والتى تتضح من خلال أدائه على الاختبار، وبناءً علیه فإنه سیتغیر وضع قدرة الفرد حسب تغیر مستوى الاختبار0 إن الاختبار والبنود تتغیر خصائصها بتغیر خصائص الأفراد، کما أن خصائص الأفراد تتغیر بتغیر خصائص الاختبار من حیث السهولة والصعوبة. 

إن معادلة الاختبارات بواسطة نظریة الاستجابة للمفردة تحل الکثیر من المشکلات التی عجزت عنها النظریة التقلیدیة بشرط أن یکون النموذج المستخدم فی النظریة الحدیثة مطابقاً للبیانات المعدة للمعادلة(Kolen, M., 1991, 8).

ویعد نموذج فیشر اللوجستی تطبیقاً أوسع لنموذج راش مع وجود بعض القیود الخطیة على معلمات البنود، فهذا النموذج یعطی اهتماما خاصا باحتمالیة التقدیر القصوى، ویوفر هذا النموذج أساساً لاختبار الفرضیات المتعلقة بصعوبة البند، کما تم عمل دراسات مسحیة للعدید من الدراسات التجریبیة فی تحلیل البند، تحیز البند، بناء الاختبار، وساعدت هذه الدراسات فی تقدیم نوع جدید من تطبیقات الاستجابة للمفردة إلى عملیات دینامیکیة، وقد اقترح أیضا فیشر نموذجا خاصا من LLTM لقیاس التغییر فی فضاء متعدد الأبعاد(Fischer, H., 1982, 380).

ولعل وضع نماذج للاختبار عبر مستویات مختلفة من القدرة على مقیاس واحد یساعدنا فی مقارنة درجات المفحوصین بشکل مباشر ویسهل عملیة تطبیق الاختبار، إضافة إلى توفیر الجهد والوقت، کما أن وجود فقرات ذات أداء تفاضلی ضمن نماذج الاختبار قد یؤثر فی دقة معادلة درجات الاختبارات، لذلک من المهم تحدید هذه الفقرات والکشف عن أثرها فی عملیة المعادلة (Hidalgo, M. & Lopez, J.,  2002, 32).


مشکلة البحث:

إن توافر صور متکافئة أو بدیلة للاختبار تسهل من عملیة إعادة اختبار المفحوصین عندما یکون ذلک ضروریاً أو مرغوبا فیه للحفاظ على سریة الاختبار، ولمنع أثر الاختلاط بین الأفراد الذین طبق علیهم الاختبار والأفراد الذین سیطبق علیهم الاختبار، وکذلک لمنع                أثر تذکر الإجابة على فقرات الاختبار إذا ما أعید تطبیقه مرة أخرى(على خطاب،                2001، 343).

وهناک العدید من الدراسات الأجنبیة والعربیة  التی أجریت حول استخدام النظریة الحدیثة فی القیاس ( نظریة الاستجابة للمفردة) وعملیة معادلة درجات الاختبار، من هذه الدراسات ما أکدت على أثر أداء الفقرات التفاضلی فی دقة معادلة الاختبار فی ضوء نماذج الاستجابة للمفردة، وأخرى على النقیض من ذلک أکدت على عدم تأثیر الفقرات التفاضلیة فی دقة معادلة الاختبار فی ضوء نماذج الاستجابة للمفردة.

ومما تقدم فإن مشکلة البحث تثیر الأسئلة التالیة:

1-    هل تحقق معاییر الفعالیة للمعادلة العمودیة لصورتی اختبار رافن للمصفوفات المتتابعة الملون فی ظل الاحتفاظ بالفقرات ذات الأداء التفاضلی للعمر فی ضوء نموذج فیشر؟

2-    هل تحقق معاییر الفعالیة للمعادلة العمودیة لصورتی اختبار رافن للمصفوفات المتتابعة الملون عند حذف الفقرات ذات الأداء التفاضلی للعمر فی ضوء نموذج فیشر؟

 أهداف البحث:

یهدف البحث الحالی إلى الکشف عن الفقرات ذات الأداء التفاضلی لمتغیر العمر فی دقة المعادلة العمودیة لاختبار رافن للمصفوفات المتتابعة فی ضوء نموذج فیشر للاستجابة للمفردة، وذلک من خلال:

  1. الکشف عن الفقرات ذات الأداء التفاضلی لمتغیر العمر لصورتی اختبار رافن للمصفوفات المتتابعة الملون ومن ثم إجراء معادلة عمودیة لدرجات القدرة للمفحوصین عبر هذین المستویین فی ضوء نموذج فیشر، حیث تشیر بعض الدراسات إلى أن اختبارات الاستعداد واختبارات القدرة العقلیة غالباً ما تبدی فقراتها أداءً تفاضلیاً وفقاً للنوع (Harris, A.& Carlton, S., 1995, 140).
  2. التحقق من فعالیة المعادلة العمودیة لصورتی اختبار رافن للمصفوفات المتتابعة الملون فی ظل وجود الفقرات ذات الأداء التفاضلی لمتغیر العمر وفقاً لنموذج فیشر.
  3. التحقق من فعالیة المعادلة العمودیة لصورتی اختبار رافن للمصفوفات المتتابعة الملون عند حذف الفقرات ذات الأداء التفاضلی لمتغیر العمر وفقاً لنموذج فیشر.

أهمیة البحث:

تتضح أهمیة البحث الحالی من خلال ما یلی:

ü      تبرز أهمیة هذا البحث من فائدة وضع مقیاس موحد لمستویات مختلفة للقدرة، والذی بدوره یوفر الوقت والجهد فی عملیة القیاس.

ü      مقارنة الأفراد ذوی القدرات المختلفة بشکل مباشر، وملاحظة تطور هذه القدرات واستخدام درجات الاختبارات بشکل متبادل من خلال المعادلة العمودیة.

ü      السعی للتحقق من أثر الفقرات ذات الأداء التفاضلی على دقة المعادلة للاختبارات باستخدام نموذج فیشر.

ü      المساهمة فی مجال بناء وتطبیق الاختبارات وتفسیرها وکیفیة التعامل مع وجود أداء تفاضلی عند مقارنة قدرات مختلفة خلال المعادلة العمودیة للاختبارات.

ü      المساهمة فی توسیع الفهم حول المعادلة العمودیة لدرجات الاختبار باستخدام نموذج فیشر وذلک لمواکبة الاتجاهات الحدیثة قی القیاس والتقویم.

منهج البحث: 

یدور البحث الحالی حول الکشف عن أثر أداء الفقرات التفاضلی العمر فی دقة معادلة الاختبار فی ضوء نموذج فیشر للاستجابة للمفردة، وفی سبیل ذلک تم استخدام صورتی اختبار رافن الملون للکبار من إعداد (عماد حسن، 2016)، ثم استخدام البرامج الإحصائیة للکشف عن الفقرات التفاضلیة، ثم إجراء عملیة المعادلة وفقاً لنموذج فیشر للاستجابة للمفردة، ثم التحقق من دقة المعادلة فی حالة حذف الفقرات ذات الأداء التفاضلی للاختبار أو الإبقاء علیها؛ لذلک تم إتباع المنهج الوصفی.

 

حدود البحث:

(أ‌)    الحدود الزمانیة:

تم تطبیق أدوات البحث فی الفصل الدراسی الثانی من العام الجامعی 2015/ 2016 بکلیة التربیة جامعة أسیوط.

(ب) الحدود المکانیة:

تم تطبیق أدوات البحث فی فصول ومدرجات ومعامل کلیة التربیة جامعة أسیوط. (ج) الحدود الموضوعیة:

تم استخدام نموذج فیشر کأحد نماذج نظریة الاستجابة للمفردة مع استخدام معیار هانزل مانتل للحکم على أداء الفقرات التفاضلیة من خلال برنامج DIFAS 5.0، کما تم استخدام معامل الصدق التقاطعی للحکم على فعالیة المعادلة العمودیة.

 (د) الحدود البشریة:

اقتصرت هذه الدراسة على عینة من طلاب وطالبات کلیة التربیة بالفرقتین الأولى والرابعة وجدول 1 یوضح أعداد الذکور والإناث بالفرق الأولى والرابعة والدبلوم العام نظام العام الواحد بکلیة التربیة.

جدول 1

أعداد الذکور والإناث بالفرق

الأولى والرابعة وطلاب الدبلوم العام بکلیة التربیة جامعة أسیوط

 الفرقة              النوع

 

ذکور

إناث

المجموع

الأولى

280

320

600

الرابعة

195

270

465

دبلوم عام نظام العام الواحد

435

500

935

المجـموع

910

1090

2000

 

 

أدوات البحث:

اختبار المصفوفات المتتابعة الملون لرافن               (تعدیل وتقنین عماد أحمد حسن علی)

المفاهیم الإجرائیة:

یتناول البحث الحالی المصطلحات الإجرائیة التالیة:

1- معادلة درجات الاختبار:

وهو تحویل نظام الدرجات الخاص بإحدى نموذجی الاختبار إلى نظام درجات خاص بالنموذج الآخر، بحیث تصبح الدرجات متکافئه(Chong Ho Yu, A.,  2005, 3)  .

2- المعادلة العمودیة:

وهی تحویل الدرجات على نماذج للاختبار صممت لمجتمعات عند مستویات قدرة مختلفة إلى تدریج مشترک(Stephen, H., 2007, 10;  Baker, F., 1984, 261).

3- الأداء التفاضلی للفقرة: 

وهو إبداء الفقرة أداءاً تفاضلیاً وفقاً لمعیار مانتل هانزل، بحیث تکون الفقرة ذات أداء تفاضلی إذا کانت قیمة کا تربیع أکبر من 3.84 عند مستوى دلالة 0.05، أو أکبر من 6.63         عند مستوى دلالة 0.01 (Zwick, R.,& Mazzeo, J., 1997, 322).

4- اختبار المصفوفات المتتابعة لجون رافن:

تعد المصفوفات المتتابعة الملونة أحد اختبارات المصفوفات الثلاثة التى أعدها عالم النفس الإنجلیزی J. Raven ، وهی من اختبارات الذکاء غیر اللفظى وهى خالیة من تأثیر الثقافة إلى حد کبیر وتعتمد أساساً على التطبیق الجمعى ویمکن أن تطبق فردیاً فى ظروف معینة، ویتوافر منها حالیاً ثلاثة مستویات: المصفوفات المتتابعة العادیة، المصفوفات المتتابعة الملونة، المصفوفات المتتابعة المتقدمة (عماد حسن، 2016، 3).

5- نموذج فیشر:

هو أحد النماذج الدینامیکیة لنظریة الاستجابة للمفردة، وقد اقترحه بوک فی کتاباته عام 1976، ویستخدم هذا النموذج فی قیاس منحنیات البارامتر(صلاح الدین علام ، 2005 ،84؛ (Purya, B.& Klaus, K., 2015, 4.

المفاهیم الأساسیة للبحث

- نظریة الاستجابة للمفردة(IRT):

          تعد نظریة الاستجابة للمفردة طریقة جدیدة لنمذجة البیانات، بمعنى أنها تحاول نمذجة العلاقة بین قدرة الفرد واحتمال استجابته سواء أکان صواباً، أم خطأً، ویعتمد صدق طرق نظریة الاستجابة للمفردة فی جزء کبیر على البیانات المستمدة من أداء الفرد(Harwell, S., 1997, 266).

          وتفترض هذه النظریة أنه یمکن تفسیر الأداء الملاحظ للأفراد على اختبار ما بسمة أو قدرة لدى هؤلاء الأفراد. وبطبیعة الحال فإن هذه السمة أو القدرة لا یمکن التنبؤ بها مباشرة، ومن هنا جاءت کلمة سمة کامنة Latent trait. ویذکر صلاح الدین علام                 (2002، 21) أنه عندما یود عالم النفس قیاس إحدى السمات العقلیة، ولتکن سمة الذکاء، فإنه لا یلاحظ ذکاء الطفل – لأن الذکاء مفهوم مجرد-، ولکنه یلاحظ سلوک الطفل فی مواقف مختلفة تتطلب الذکاء، أی أن السمات العقلیة تعد بمثابة تکوینات یفترض أنها تعکس مجموعة مترابطة من السلوک الذی یمکن ملاحظته وتسجیله فی مواقف اختباریة مقننة.

ولکی یمکن تحدید أی من نماذج الاستجابة للمفردة هو الذی یجب استخدامه، هناک ثلاث محکات لخصها کلا من Wiberg, M., 2004, 4)؛ وصلاح الدین علام،                2005، 84) وهی:

المحک الأول: تحدید افتراضات النموذج.

المحک الثانی: خصائص النموذج المتوقعة.

المحک الثالث: توقعات النموذج لنتائج الاختبار الفعلیة.

وتلک المحکات الثلاثة هی ملخص للظاهرة التی یحتمل أن یستخدمها معدی الاختبار، ویمکن أن تنقسم تلک المحکات إلى محکات فرعیة أخرى، ولقد اقترح هامبلتون (فی: میمی إسماعیل، 2007، 23) أنه یجب على الاختبار أن یلائم أکثر من نموذج واحد للبیانات، ومن ثم یمکن مقارنة النماذج طبقاً للمحکات الثلاثة.

المحک الأول: افتراضات النموذج:

1- أحادیة البعد:

تشیر إلى حقیقة أن الاختبار یجب أن یقیس قدرة کامنة واحدة والمفردات التی تکون أحادیة البعد ربما تعکس سمات عدیدة ویطبق هذا الشرط فی معظم نماذج نظریة الاستجابة للمفردة(Yen, M. &Edwardson, S., 1999, 236).

2- تساوی التمییز:

          یمکن لتساوی التمییز أن یفحص العلاقة بین المفردة ((i والدرجة الکلیة للاختبار. فإذا کانت المفردات ذات تمییز متساو فمن الأفضل أن نستخدم النموذج اللوغاریتمی أحادی البارامتر ( نموذج راش)، أما إذا لم تکن المفردات ذات تمییز متساو فمن الأفضل أن نستخدم النموذج اللوغاریتمی ثنائی البارامتر وثلاثی البارامتر.

3- احتمالیة تخمین الإجابة الصحیحة: 

          هناک طریقة لفحص ما إذا کان یحدث تخمین وذلک عن طریق ملاحظة إجابة الممتحنین ذوی القدرات المنخفضة على المفردات الأکثر صعوبة، أی أن الممتحنین ذوی القدرات المنخفضة الذین یجیبون على المفردات الأکثر صعوبة بشکل صحیح، فإن ذلک یسمح لبارامتر التخمین أن یظهر، وعلى ذلک فإن النموذج اللوغاریتمی ثلاثی البارامتر ملاءمة من النموذج الأحادی والثنائی فی إظهار بارامتر التخمین.(Wiberg, M.,  2004, 5)

 

المحک الثانی: خصائص النموذج المتوقعة:

ویلخصها (Husen, T. &Postlethwaite, T., 1995, 351) فی:

1-    إن تقدیر بارامتر قدرة الفرد لا یعتمد على تقدیر بارامتر صعوبة المفردة.

2-    إن تقدیر بارامتر المفردة لا یعتمد على استخدام عینات مختلفة من الأفراد سواء أکانت عینات ذات قدرات مرتفعة، أم منخفضة.

المحک الثالث: توقعات النموذج لنتائج الاختبار الفعلیة:

یتم معرفة توقعات النموذج لنتائج الاختبار الفعلیة عن طریق:

1-    إجراء مقارنة بین المنحنیات الممیزة لکل مفردة من المفردات الأخرى.

2-    استخدام رسوم بیانیة لتقسیمات الدرجة المتوقعة والملاحظة أو استخدام اختبارات                (کا­2).

- نموذج فیشرالدینامیکی: LLTM))

          تهتم هذه النماذج بقیاس التغیر الذی یحدث فی السمات الإنسانیة عبر الزمن. فالبعض یرى أن هذا  التغیر یُعد عملیة تدریجیة، بینما یرى البعض الآخر أنه عملیة تحول من حالة إلى أخرى.

ففی الحالة الأولى یکون المتغیر الذی ینطوی علیه التغیر متصلاً، بینما فی الحالة الثانیة یکون المتغیر منفصلاً، غیر أن الحالة الأولى هی التی نالت الاهتمام فی                       النماذج الدینامیکیة.

          فقد اقترح فیشر نموذجاً یمکن استخدامه فی قیاس منحنیات التحصیل، ویشمل النموذج على عدة مکونات استناداً إلى النموذج ثنائی البارامتر، وتتطلب عملیة التعییر باستخدام هذا النموذج توافر عینة متکافئة من المختبرین الذین حصلوا على درجات متفاوتة من التعلیم، وقد حاول بوک فی نموذجه أن یسمح بتعیین الفرد فی نمط  معین، ومن ثم تقدیر بارامترات هذا النموذج الفردی(صلاح الدین علام، 2005، 84).

ویعد نموذج فیشر اللوجستی تطبیقاً أوسع لنموذج راش مع وجود بعض القیود الخطیة على معلمات البنود، فهذا النموذج یعطی اهتماما خاصا باحتمالیة التقدیر القصوى، ویوفر هذا النموذج أساساً لاختبار الفرضیات المتعلقة بصعوبة البند، کما تم عمل دراسات مسحیة للعدید من الدراسات التجریبیة فی تحلیل البند، تحیز البند، بناء الاختبار، وساعدت هذه الدراسات فی تقدیم نوع جدید من تطبیقات الاستجابة الطارئة إلى عملیات دینامیکیة،                وقد اقترح أیضا فیشر نموذجا خاصا من LLTM لقیاس التغییر فی فضاء متعدد الأبعاد(Fischer, H., 1982, 380).

ولنفترض أن لدینا مجموعة من البیانات تتناسب مع افتراضات نموذج راش، فیمکن أن یکون اختبار ملاءمة النموذج المعرفی المحدد بطریقتین: الأولى بطریقة مشابهة تناسب اختبار نموذج راش، والثانیة یمکن استخدام نموذج بیانی لاختیار معلمات البند المقدرة بنموذج راش ومقارنتها بنموذج فیشر، فنموذج فیشر یساعد على الحد من ضعف ارتباط العناصر ببعضها البعض. ویمکن استخدامه لتعدیل أو إعادة صیاغة هیکل العملیات الابتدائیة،          أو للمساعدة فی تحدید المشاکل التی تعترض بناء النموذج.(Philipp, S., 2008, 347)  

إن نموذج LLTM أحدث طفرة عظیمة فی علم النفس بصفة عامة والقیاس النفسی بصفة خاصة، حیث أنه یسد الفجوة بین العلم والقیاس النفسی المعرفی، ویساعد فی الکشف عن العملیات العقلیة التی تنتج التباین الخاص بالثبات ویساعد فی تقدیم استراتیجیات معرفیة لحل الممتحنین، والتی بدورها تؤدی إلى تنمیة العناصر الأکثر کفاءة. وهذا یوفر طریقة منهجیة فی الحکم على مستوى البند .(Baghaei, H. & Kubinger, M., 2015, 9)

وأشار فیشر  (Fischer,  H, 1973, 360)إلى قوة هذا النموذج فى اختبار الفرضیات فهو نموذج اختبار تجریبى یُمکن للباحثین من وضع فرضیات عن البند، ووضع النظریات النفسیة الموضوعیة، وتحدید العملیات الادراکیة التى تحتاجها لحل البنود، وبناء صحة البنود التى یمکن اثباتها لاختبار العملیات الادراکیة المحددة.

ویوجد العدید من الطرق التی من خلالها یمکن تقدیر المعلمات، من أهمها بروزاً طریقة أقصى احتمال مشروط (Cb4L)، ویفرض نموذج فیشر على معلمة الصعوبة بعض القیود الخطیة، ونموذج فیشر یتیح للباحثین تجریبیا اختبار الفرضیات حول عملیات حل البند ووضع النظریات النفسیة الموضوعیة.

 وتلخیصاً لما تقدم عن نموذج فیشر، فإن جمیع البنود تعد جزءاً شائعاً من نموذج راش ( خاصة فی التصمیم التجریبی ذی المجموعة الواحدة)، فأینما نجد محتوى نفسی للبنود یربط بینها من خلال بارامترات تزداد إمکانیة تطبیق نموذج فیشر فی القیاس النفسی                 وذلک عند التعامل مع القیاسات القبلیة والبعدیة، فنموذج فیشر امتداد لنموذج راش  Baghaei, H. & Kubinger, M., 2015, 1; Pono, I, 2002, 24)

ویشیر (Baghaei, H. & Kubinger, M., 2015, 3) إلى أنه من الشروط الأساسیة قبل تطبیق نموذج فیشر یجب تطبیق نموذج راش أولاً، فقبل إجراء نموذج فیشر یمکن حذف الفقرة أو البند الذی لا یتناسب مع افتراضات نموذج راش، وبهذه الطریقة نتعرف على الاشخاص والفقرات التی یمکن إزالتها مع وجود استراتیجیات بدیلة للحل.

وتؤکد کلا من ; Susan E., W., & Lisa M. S., 1981, 385) Purya, B.& Klaus, K., 2015, 6) على تشابه نموذج راش مع نموذج فیشر فی اعتماد النموذجین على بارامتر الصعوبة فقط، إلا أنه فی نموذج فیشر تتنوع البارامترات التی تشارک فی عملیات تجهیز الأداء.

الصیغة الریاضیة لنموذج فیشر:

یعتمد النموذج الریاضی الدینامیکی لفیشر على الافتراضات التی أسسها راش فی معادلته الریاضیة، ویمکن صیاغة المعادلة کما سبق فی نموذج راش على النحو التالی:

عند وضع صیغة ریاضیة لاستجابة الفرد (v) للمفردة (i)، یجب البحث عن المتغیرات الأساسیة المؤثرة فی الاستجابة، وهی قدرة الفرد vβ وصعوبة المفردة iδ، ویکون النموذج الوسیط الذی یمکن أن یوضح هذین المتغیرین فی الاستجابة الملاحظة (Xvi) هو الفرق بین هذین المعلمین، ویعد احتمال حدوث الاستجابة الصواب Xvi= 1 دالة لهذا الفرق، وهذا یتمثل فی الدالة الآتیة:

( - )Pvi = f

حیث Pvi احتمال نجاح الفرد (v) على المفردة (i)، أی احتمال حدوث الاستجابة الصواب، ویلاحظ من المعادلة السابقة أن احتمال حدوث الإجابة الصواب Pvi ینحصر بین القیمیتن (صفر، 1) فی حین أن الفرق (iδ - vβ) یمکن أن یکون أی عدد حقیقی من  -∞ إلى +∞. لذا ینبغی اختیار نموذج احتمال یعتمد على الفرق (iδ - vβ) ویجعله محصوراً بین القیمتین (صفر، 1)، ولیکن احتمال التوزیع الأسی ( اللوغاریتمی مثلاً).

ویمکن صیاغة المعادلة السابقة فی الصورة التالیة:

                                                            i          δ - vβ

e­­­­­

ـــــــ Pvi  =

                                                         i            δ - vβ

e­­­­­1+

 

وهی نفس صیغة نموذج راش، وتشتمل على بارامتر واحد فقط، وهو بارامتر صعوبة المفردات لتمثیل الفروق بین المفردات(صلاح الدین علام، 2005، 69؛                 .(Pono, I, 2002, 23).

-         معادلة الاختبارات (Test Equating):

تحتوى أدبیات البحوث على العدید من التعریفات لمعادلة الاختبار، ولا یوجد   تعریف محدد لمعادلة الاختبار، وعلمیا لا یهتم الباحثون بالتعریفات المتعددة الموجودة                   ( Roos, L., 2002, 10).

فمعادلة الاختبار هی عملیة الحصول على درجات متکافئة لأداتین تقیسان السمة نفسها(راشد الدوسری، 2001، 112).

وعموما فإن معادلة الاختبار هی إجراء یسمح لمفردات صورتی اختبار أن یتم وضعها على نفس المقیاس ( same scale) (Roos, L.,  2002,  5).

وتعرف معادلة الأختبار بأنها تلک العملیة التی یتم فیها اشتقاق (Deriving) دالة رسم الدرجة (Function mapping score  ) على صورة بدیلة للاختبار على مقیاس الصورة الرباط ( المشترکة) (anchor form) ونتیجة لذلک بعد المعادلة، تکون أیه درجة للمقیاس لها نفس المعنی بغض النظر عن أیة صورة من صور الاختبار تم تطبیقه   (Haertel, E.,  2004,  1).

ویقصد بعملیة معادلة درجات اختبارین (test Score Equationg ) تلک الإجراءات والعملیات الإحصائیة التی تتم بغرض تحویل نظام وحدات القیاس الخاص بإحدى الصورتین إلى نظام وحدات القیاس الخاص بالصورة الأخرى، بحیث تصبح القیاسات المستمدة من درجات کل من الصورتین متکافئة بعد إجراء هذا التحویل( إسماعیل الولیلی، 2005، 108).

أهمیة معادلة الاختبارات: 

هناک الکثیر من المشکلات التی تعانیها نظم التعلیم فی الکثیر من دول العالم، ومن أهم هذه المشکلات عملیة بناء الامتحانات الفصلیة، والامتحانات الملحقة للشهادات العامة بالمرحلتین الإعدادیة والثانویة، إذ یقوم المتخصصون فی إدارة المناهج ببناء الکثیر من الامتحانات لنهایة کل فصل دراسی، ویتطلب ذلک وقتا کبیراً، وجهداً أکبر، ویضطرون إلى بناء اختبارات ملحقة للطلبة الذین لم یتمکنوا من اجتیاز الامتحانات الفصلیة بنجاح، ولا یوجد دلیل علمی على قدرة هذه الامتحانات على تمثیل المحتوى المطلوب لتأکید جانب الصدق فیها، کما لا یمکن اعتبارها متکافئة فیما بینها بسبب عدم تحلیلها للحصول على الخصائص السیکومتریة الضروریة لعملیة التکافؤ، والمعادلة، کالوسط الحسابی، والانحراف المعیاری، ومعامل الصعوبة، ومعامل التمییز، وکثیراً ما یشتکی الطلبة فی کل عام دراسی من تفاوت الامتحانات من امتحان إلى أخر، وعدم العدل فی قیاس سمة التحصیل قیاساً علمیاً سلیماً ومما یزید من خطورة المشکلة أن نتائج الطلبة فی الامتحانات العامة تترتب علیها قرارات متعلقة بالانتقال إلى مراحل دراسیة أعلى، أو الالتحاق بالجامعات، أو بسوق العمل(راشد الدوسری، 2001، 10).

 طرق معادلة الاختبارات وفقا لنظریة الاستجابة للمفردة:

        تعتمد هذه الطریقة على تحویل التدریج المستقل لمفردات اختبارین مختلفین حسب درجة صعوبة مفردات کل منهما، وکذلک قدرات التلامیذ الذین طبق علیهم الاختباران إلى تدریج واحد مشترک له صفر مشترک، وذلک بعد التحق من توافر افتراضات نظریة الاستجابة للمفردة فی البیانات الناتجة عن تطبیق الاختبارین(إسماعیل الولیلی، 2005، 107).

          إن وضع تقدیرات المعلمات للمفردة المشتقة من الصور المختلفة للاختبار على مقیاس مشترک، یعد إحدى خطوات المعادلة وفق نظریة الاستجابة للمفردة، وتوجد ثلاثة أنواع رئیسیة للمعایرة وإجراءات الربط وذلک لوضع تقدیرات معلمة المفردة المشتقة من الصور المختلفة للاختبار على مقیاس مشترک فی حالة المعادلة وفق تصمیم المفردات                        المشترکة وهی :

 

- وصل المعایرة(التدریج)المنفصلة.The linking separate calibration(LSC)

- المعایرة ( التدریج ) المتلازمة. The concurrent calibration

- معایرة ( تدریج ) المعلمة المثبتة. The fixed parameter calibration

ومن أشهر الطرق المستخدمة فی حساب معاملات التحویل                  (Transformation Coefficients) (A, B) فی حالة وصل المعایرة ( التدریج) المنفصلة       ( Zhonghua, Z., 2010, 18) الطرق التالیة:

- الطرق الآنیة / اللحظیة / التامة (the moment methods) وهی:

-        طریقة المتوسط / المتوسط (Mean /  Mean method)

-        طریقة المتوسط / الانحراف المعیاری (Mean / sigma method)

أسئلة البحث:

من خلال ما تم عرضه من الإطار النظری حول متغیرات البحث ونتائج الدراسات السابقة یمکن عرض أسئلة البحث فیما یلی:

  1. هل تتحقق معاییر الفعالیة للمعادلة العمودیة لصورتی اختبار رافن للمصفوفات المتتابعة الملون فی ظل الاحتفاظ بالفقرات ذات الأداء التفاضلی للعمر فی ضوء نموذج فیشر؟
  2. هل تتحقق معاییر الفعالیة للمعادلة العمودیة لصورتی اختبار رافن للمصفوفات المتتابعة الملون عند حذف الفقرات ذات الأداء التفاضلی للعمر فی ضوء نموذج فیشر؟  

 

 

إجراءات البحث:

أولاً- عینة البحث: اقتصر هذا البحث على عینة من طلاب وطالبات الفرقة الأولى والرابعة وطلاب وطالبات الدبلوم العامة بکلیة التربیة، للعام الجامعی                           2015/ 2016م.

ثانیاً- الخطوات الإجرائیة للبحث:

تتلخص خُطوات إجراء البحث فی الخُطوات الآتیة:

1-    استعان الباحث باختبار جون رافن المصور للذکاء من إعداد جون رافن وتعدیل وتقنین عماد حسن(2016).

2-    تم تقسیم الاختبار إلى صورتین کل صورة تتکون من 24 فقرة، بینهما                       12 فقرة مشترکة.

3-    تم تطبیق الصورتین على طلاب وطالبات کلیة التربیة، وذلک بهدف تقنین الصورتین على العینة الاستطلاعیة.

4-    تم تطبیق صورتی الاختبار النهائیتین على العینة الأساسیة، وأصبح لکل طالب وطالبة درجة کلیة على إحدى الصورتین.

5-     تم تطبیق برنامج DIFAS 5.0 على صورتی الاختبارین للکشف عن                     الفقرات التفاضلیة.

6-    تم استخدام الأسالیب الاحصائیة المناسبة لتحلیل البیانات، بعد أن تم التأکد من توافر شروط نظریة الاستجابة للمفردة (IRT).

نتائج البحث وتفسیرها:

وینص السؤال الأول على " هل تحقق معاییر الفعالیة للمعادلة العمودیة لصورتی اختبار رافن للمصفوفات المتتابعة الملون فی ظل الاحتفاظ بالفقرات ذات الأداء التفاضلی للعمر فی ضوء نموذج فیشر؟

 

 وللإجابة عن هذا السؤال: تم أولاً الکشف عن الفقرات ذات الأداء التفاضلی فی صورتی اختبار رافن، وذلک من خلال استخدام برنامج DIFAS4.0، بأن یکون طلاب الدراسات العلیا مجموعة مرجعیة وطلاب الفرقتین الأولى والرابعة مجموعة مستهدفة،                 أو العکس – حیث أظهر برنامج DIFAS4.0 نفس الفقرات بالترتیب عند وضع طلاب الدراسات العلیا مجموعة مستهدفة وطلاب الفرقتین الأولى والرابعة مجموعة مرجعیة- وأظهرت نتائج البرنامج، وجود 18 فقرة من فقرات الاختبارین ذات أداءاً تفاضلیاً، ثمانی فقرات بالصورة الاختباریة الأولى، وعشر فقرات بالصورة الاختباریة الثانیة.

ثم قام الباحث بالتحقق من تساوی متوسطی درجات طلاب الدراسات العلیا وطلاب الفرقتین الأولى والرابعة على صورتی الاختبار کمعیار لتکافؤ الصورتین، ولذلک تم استخدام اختبار (ت) لعینتین مستقلتین من خلال البرنامج الاحصائی Spss، وجدول 2 یوضح ذلک.

جدول  2

المتوسط الحسابی والانحراف المعیاری وقیمة ت للفروق بین درجات الطلاب

على صورتی اختبار رافن

المتغیر

الصورة الاختباریة الأولى (ن1= 1065)

الصورة الاختباریة الثانیة

 (ن2= 935)

قیمة ت

الدلالة

م

ع

م

ع

 

الدرجة الکلیة للاختبار

19.0547

3.63318

18.2802

4.63083

10.12

دال عند 0.01

یتضح من جدول 2 وجود فروق ذات دلالة إحصائیة بین متوسطی درجات طلاب الفرقتین الأولى والرابعة على صورتی الاختبار، وذلک لصالح متوسط درجات الطلاب فی الصورة الأولى، وبذلک فإن صورتی اختبار رافن غیر متکافئتین وفقاً لمعیار التکافؤ المستخدم وهو تساوی متوسطی درجات الطلاب على الصورتین الاختباریتین، وعدم التکافؤ ینتج عنه عدم القدرة على المقارنة بین مستوى ذکاء الطلاب الذین أجابوا على صور مختلفة من الاختبار، وبذلک تکون صورتا الاختبار فی حاجة إلى إجراء عملیة معادلة للدرجات لإتخاذ قرارات صحیحة بشأن مستوى ذکاء الطلاب على الصورتین.

وقبل إجراء عملیة المعادلة بین درجات الطلاب على صورتی الاختبار، تم التحقق من توافر شروط نظریة الاستجابة للمفردة( أحادیة البعد- الاستقلال الموضعی- التحرر من السرعة- توافر خاصیة المنحنى الممیز للمفردة ICC) وذلک لکل صورة من صورتی الاختبار، کما ورد عند الاجابه عن السؤال الأول.

وبعد أن تم التأکد من توافر شروط نظریة الاستجابة للمفردة، وکذلک جودة المفردات المشترکة فی صورتی الاختبار، سیتم الإجابة على السؤال الذی ینص على " ما مدى تحقق معاییر الفعالیة للمعادلة العمودیة لصورتی اختبار رافن للمصفوفات المتتابعة الملون فی ظل الاحتفاظ بالفقرات ذات الأداء التفاضلی للعمر فی ضوء نموذج فیشر؟ 

وللإجابة عن هذا السؤال، تم تحدید طرق المعادلة المستخدمة فی ضوء نموذج فیشر لنظریة الاستجابة للمفردة، وهی کالتالی:

أ‌-      معادلة المتوسط/ المتوسط.

ب‌-    معادلة المتوسط/ الانحراف المعیاری.

ولحساب المعادلة بطریقة المتوسط/ المتوسط وکذلک طریقة المتوسط/ الانحراف المعیاری، یستلزم ذلک حساب بارامتر المفردة( الصعوبة) لأن النموذج المستخدم هو نموذج فیشر، حیث یکون فیه بارامتر التمییز للمفردات قیمة ثابتة وتساوی الواحد الصحیح أو قیمة قریبة منها ویتم تثبیتها فی البرنامج المستخدم لجمیع المفردات، وکذلک بارامتر التخمین مساویاً للصفر، ولتقدیر بارامترات الصعوبة الخاصة بمفردات صورتی الاختبار فقد تم استخدام برنامج IRTEQ  وقد تم ضبط البرنامج بحیث یکون معامل التدریج D = 1.7 أی فی حالة القیاس الطبیعی، وقد تم الحصول على بارامترات صعوبة المفردات لکل صورة من صورتی الاختبار، وجدول 3 یوضح ذلک.

 

جدول  3

بارامتر الصعوبة لکل مفردة من مفردات صورتی الاختبار ( ن= 1065)للصورة

الأولى، (ن= 965) للصورة الثانیة عدد المفردات لکل صورة اختباریة(22) مفردة

رقم المفردة بالصورة الاختباریة الأولى

بارامتر الصعوبة المقدر

(b- parameter)

رقم المفردة بالصورة الاختباریة الثانیة

بارامتر الصعوبة المقدر

(b- parameter)

1

-2.576

1

-2.954

2

-1.321

2

0.189

3

-0.995

3

-1.278

4

-1.321

4

0.0415

5

-1.284

5

-0.4263

6

-0.2048

6

-0.2117

7

-0.920

7

-1.254

8

-1.101

8

0.0048

9

0.2214

9

-0.5288

10

-1.233

10

1.847

11

-1.534

11

-0.3375

12

0.2429

12

-0.5678

13

-1.32

13

1.226

14

0.1978

14

1.425

15

0.0855

15

-1.785

16

0.0178

16

-0.715

17

-0.8955

17

0.9856

18

1.175

18

0.6580

19

-0.859

19

0.5890

20

0.244

20

0.2895

21

-0.4187

21

0.4352

22

0.981

22

-0.5947

یلاحظ من جدول 3 اختلاف بارامترات الفقرات من رقم (13- 22) بالرغم من أنها مفردات مشارکة فی الصورتین الاختباریتین، ویرجع ذلک لاختلاف الأفراد الذین طبقت          علیهم الصورتین.

          ویمکن الحصول على معاملات صعوبة وتمییز المفردات المشترکة کما یوضحها جدول 4.

جدول  4

متوسط تمییز وصعوبة المفردات المشترکة والانحراف المعیاری لها على الصورتین الاختباریتین الأولى والثانیة، عدد المفردات المشترکة (10) مفردات

المؤشر الاحصائی                             الصورة الاختباریة

الصورة الأولى

الصورة الثانیة

متوسط تمییز المفردات المشترکة

1.00

1.00

متوسط صعوبة المفردات المشترکة

-0.486

-0.152

الانحراف المعیاری للمفردات المشترکة

0.850

0.778

یتضح من جدول 4 أن متوسط تمییز المفردات المشترکة لکل من صورتی الاختبار ثابت ویساوی الواحد الصحیح، وذلک لأن نموذج فیشر ( النموذج المعمم لنموذج راش) یقوم بتثبیت معلم التمییز وجعله مساویاً للواحد الصحیح، وکذلک فإن متوسطی صعوبة المفردات المشترکة لکل من الصورة الأولى والثانیة (-0.486، -0.152) على الترتیب، بینما کان الانحراف المعیاری للمفردات المشترکة على صورتی الاختبار(0.850، 0.778)                  على الترتیب.

أ‌-     معادلة المتوسط/ المتوسط:

ولإیجاد معاملات المعادلة (A, B) عن طریق المتوسط/ المتوسط، یمکن استخدام                  تلک المعادلات:

µ(a j)

 

=

 

A

µ(a i)

 

B = µ(b J)  - A µ(b I)

 

حیث أن

µ(a I) هو متوسط تمییز المفردات المشترکة بالصورة الاختباریة الأولى (الهدف).

µ(a J) هو متوسط تمییز المفردات المشترکة بالصورة الاختباریة الثانیة (القاعدة).

µ(b I) هو متوسط صعوبة المفردات المشترکة بالصورة الاختباریة الأولى (الهدف).

µ(b J)هو متوسط صعوبة المفردات المشترکة بالصورة الاختباریة الثانیة (القاعدة).

ویوضح جدول 5 ثوابت التحویل الخاصة بطریقة المتوسط/ المتوسط.

جدول  5

ثوابت التحویل الخاصة بطریقة المتوسط/ المتوسط

B

A

0.334

1.00

وبعد الحصول على ثوابت التحویل (A, B) فإن میزان الصورة الأولى سیتحول إلى میزان الصورة الثانیة، حیث أن الصورة الأولى عبارة عن المقیاس (الهدف)، وقد تم اختیار الصورة الثانیة کمرجع (قاعدة) لها وذلک لأن معامل ثبات الصورة الثانیة أعلى من الصورة الأولى، وجدول 44 یوضح ذلک التحویل فی میزان الصورة الأولى.

جدول  6

بارامتر الصعوبة لکل مفردة من مفردات الصورة

 الاختباریة الأولى قبل عملیة التحویل وبعدها وفقاً لطریقة المتوسط/ المتوسط

رقم المفردة بالصورة الاختباریة الأولى

بارامتر الصعوبة المقدر قبل عملیة التحویل

بارامتر الصعوبة المقدر بعد عملیة التحویل

1

-2.576

-2.242

2

-1.321

-0.987

3

-0.995

-0.661

4

-1.321

-0.987

5

-1.284

-0.95

6

-0.2048

0.1292

7

-0.920

-0.586

8

-1.101

-0.767

9

0.2214

0.5554

10

-1.233

-0.899

11

-1.534

-1.2

12

0.2429

0.5769

13

-1.32

-0.986

14

0.1978

0.5318

15

0.0855

0.4195

16

0.0178

0.3518

17

-0.8955

-0.5615

18

1.175

1.509

19

-0.859

-0.525

20

0.244

0.578

21

-0.4187

-0.0847

22

0.981

1.315

 

یلاحظ من جدول 6 أن الصورة الاختباریة الأولى ( الهدف) تحولت إلى میزان الصورة الاختباریة الثانیة (القاعدة).

ومن خلال البرامج الاحصائیة یمکننا الحصول على الدرجات الخام للصورة الأولى والقدرات المقابلة لها والدرجات المعادلة للدرجات الخام على الصورة الثانیة وفقاً لطریقة (المتوسط/ المتوسط)، وجدول 7 یوضح ذلک.

جدول  7

الدرجات الخام على الصورة الأولى والقدرات المقابلة لها

 والدرجات المعادلة لها على الصورة الثانیة وفقاً لطریقة المتوسط/ المتوسط

الدرجة الخام على الصورة الأولى

القدرة المقابلة لکل درجة

الدرجة المعادلة لها على الصورة الثانیة

1

-2.136

0.64

2

1.0076

1.32

3

0.568

2.04

4

-1.007

2.84

5

0.962

3.51

6

-1.23682

4.26

7

0.452677

5.05

8

0.72233

5.90

9

-1.17613

6.63

10

0.898326

7.45

11

1.249737

8.29

12

-1.10017

9.18

13

1.006393

10.02

14

-1.26298

10.98

15

-1.73738

11.88

16

-2.08938

12.87

17

0.413

13.66

18

0.822894

14.65

19

0.352942

16.65

20

-1.09636

17.56

21

-0.56818

18.65

22

0.547673

19.55

ویوضح جدول 7 الدرجات الخام على الصورة الأولى( الهدف)، والقدرات المقابلة لها، وکذلک الدرجة المعادلة لها على الصورة الثانیة( القاعدة)، فالطالب الذی تکون قدرته مساویة (-2.136) تکون درجته على الصورة الأولى(1) والدرجة المعادلة لها على الصورة الثانیة ( 0.64)، والطالب الذی تکون قدرته مساویة (0.413) تکون درجته على الصورة الأولى(17) والدرجة المعادلة لها على الصورة الثانیة ( 13.66).

 

ثانیاً: نتائج السؤال الثانی ومناقشتها: 

وینص السؤال الثانی على " هل تحقق معاییر الفعالیة للمعادلة العمودیة لصورتی اختبار رافن للمصفوفات المتتابعة الملون عند حذف الفقرات ذات الأداء التفاضلی للعمر فی ضوء نموذج فیشر؟

وللإجابة عن هذا السؤال: تم أولاً الکشف عن الفقرات ذات الأداء التفاضلی فی صورتی اختبار رافن، وذلک من خلال استخدام برنامج DIFAS4.0، بأن یکون طلاب الدراسات العلیا مجموعة مرجعیة وطلاب الفرقتین الأولى والرابعة مجموعة مستهدفة،  أو العکس – حیث أظهر برنامج DIFAS4.0 نفس الفقرات بالترتیب عند وضع طلاب الدراسات العلیا مجموعة مستهدفة وطلاب الفرقتین الأولى والرابعة مجموعة مرجعیة-  وأظهرت نتائج البرنامج وجود 18 فقرة من فقرات الاختبارین ذات أداءاً تفاضلیاً، ثمانی فقرات بالصورة الاختباریة الأولى هم الفقرة رقم (1، 7، 9، 11، 12، 13، 18، 21)، وعشر فقرات بالصورة الاختباریة الثانیة هم الفقرة رقم (1، 6، 9، 12، 15، 16، 17، 19، 20، 21).

وقبل إجراء عملیة المعادلة بین درجات الطلاب على صورتی الاختبار، کان من الضروری التحقق من توافر شروط نظریة الاستجابة للمفردة( أحادیة البعد- الاستقلال الموضعی- التحرر من السرعة- توافر خاصیة المنحنى الممیز للمفردة ICC) وذلک لکل صورة من صورتی الاختبار خاصة بعد حذف الفقرات ذات الأداء التفاضلی.

وبعد أن تم التأکد من توافر شروط نظریة الاستجابة للمفردة، وکذلک جودة المفردات المشترکة فی صورتی الاختبار، سیتم الإجابة على السؤال الذی ینص على " ما مدى تحقق معاییر الفعالیة للمعادلة العمودیة لصورتی اختبار رافن للمصفوفات المتتابعة الملون عند حذف الفقرات ذات الأداء التفاضلی للعمر فی ضوء نموذج فیشر؟ 

وللإجابة عن هذا السؤال، تم تحدید طرق المعادلة المستخدمة فی ضوء نظریة الاستجابة للمفردة، وهی کالتالی:

أ‌-            معادلة المتوسط/ المتوسط.

ب‌-          معادلة المتوسط/ الانحراف المعیاری.

ولحساب المعادلة بطریقة المتوسط/ المتوسط وکذلک طریقة المتوسط/ الانحراف المعیاری، یستلزم ذلک حساب بارامتر المفردة( الصعوبة) لأن النموذج المستخدم هو نموذج فیشر وکما أشرنا إلى أن نموذج فیشر هو نموذج دینامیکی معمم لنموذج راش، حیث یکون فیه بارامتر التمییز للمفردات قیمة ثابتة وتساوی الواحد الصحیح أو قیمة قریبة منها ویتم تثبیتها فی البرنامج المستخدم لجمیع المفردات، وکذلک بارامتر التخمین مساویاً للصفر، ولتقدیر بارامترات الصعوبة الخاصة بمفردات صورتی الاختبار فقد تم استخدام برنامج IRTEQ  وقد تم ضبط البرنامج بحیث یکون معامل التدریج D = 1.7 أی فی حالة القیاس الطبیعی، وقد تم الحصول على بارامترات صعوبة المفردات لکل صورة من صورتی الاختبار، وجدول 8 یوضح ذلک. 

جدول  8

بارامتر الصعوبة لکل مفردة من مفردات صورتی

 الاختبار ( ن= 1065)للصورة الأولى، (ن= 935) للصورة الثانیة

 عدد المفردات للصورة الأولى(14) مفردة، عدد المفردات للصورة الثانیة(12) مفردة

رقم المفردة بالصورة الاختباریة الأولى

بارامتر الصعوبة المقدر

(b- parameter)

رقم المفردة بالصورة الاختباریة الثانیة

بارامتر الصعوبة المقدر

(b- parameter)

1

-1.341

1

0.199

2

-0.965

2

-1.278

3

-1.371

3

0.1515

4

-1.294

4

-0.4563

5

-0.2248

5

-1.354

6

-1.121

 

 

7

-1.253

 

 

8

0.1908

6

0.0248

9

0.1855

7

1.857

10

0.0198

8

-0.3365

11

-0.8655

9

1.236

12

-0.889

10

1.445

13

0.294

11

0.6780

14

0.987

12

-0.5907

 

یلاحظ من جدول 8 اختلاف بارامترات الفقرات من رقم (8- 14) بالرغم من أنها مفردات مشارکة فی الصورتین الاختباریتین، ویرجع ذلک لاختلاف الأفراد الذین طبقت     علیهم الصورتین.

ویمکن الحصول على معاملات صعوبة وتمییز المفردات المشترکة کما یوضحها جدول 9.

جدول  9

متوسط تمییز وصعوبة المفردات المشترکة والانحراف المعیاری لها على الصورتین الاختباریتین الأولى والثانیة، عدد المفردات المشترکة (7) مفردات

المؤشر الاحصائی                        الصورة الاختباریة

الصورة الأولى

الصورة الثانیة

متوسط تمییز المفردات المشترکة

1.00

1.00

متوسط صعوبة المفردات المشترکة

-0.576

-0.272

الانحراف المعیاری للمفردات المشترکة

0.830

0.750

یتضح من جدول 9 أن متوسط تمییز المفردات المشترکة لکل من صورتی الاختبار ثابت ویساوی الواحد الصحیح، وذلک لأن نموذج فیشر ( المعمم لنموذج راش) یقوم بتثبیت معلم التمییز وجعله مساویاً للواحد الصحیح، وکذلک فإن متوسطی صعوبة المفردات المشترکة لکل من الصورة الأولى والثانیة (-0.576، -0.272) على الترتیب، بینما کان الانحراف المعیاری للمفردات المشترکة على صورتی الاختبار(0.830، 0.750) على الترتیب.

أ‌-     معادلة المتوسط/ المتوسط:

ولإیجاد معاملات المعادلة (A, B) عن طریق المتوسط/ المتوسط، یمکن استخدام                   تلک المعادلات:

µ(a J)

 

=

 

A

µ(a I)

 

B = µ(b J)  - A µ(b I)

 

حیث أن

µ(a I) هو متوسط تمییز المفردات المشترکة بالصورة الاختباریة الأولى (الهدف).

µ(a J) هو متوسط تمییز المفردات المشترکة بالصورة الاختباریة الثانیة (القاعدة).

µ(b I) هو متوسط صعوبة المفردات المشترکة بالصورة الاختباریة الأولى (الهدف).

µ(b J)هو متوسط صعوبة المفردات المشترکة بالصورة الاختباریة الثانیة (القاعدة).

ویوضح جدول 10 ثوابت التحویل الخاصة بطریقة المتوسط/ المتوسط.

جدول  10

ثوابت التحویل الخاصة بطریقة المتوسط/ المتوسط

B

A

0.304

1.00

وبعد الحصول على ثوابت التحویل (A, B) فإن میزان الصورة الأولى سیتحول إلى میزان الصورة الثانیة، حیث أن الصورة الأولى عبارة عن المقیاس (الهدف)، وقد تم اختیار الصورة الثانیة کمرجع (قاعدة) لها وذلک لأن معامل ثبات الصورة الثانیة أعلى من الصورة الأولى، وجدول 11 یوضح ذلک التحویل فی میزان الصورة الأولى.

جدول  11

بارامتر الصعوبة لکل مفردة من مفردات الصورة

 الاختباریة الأولى قبل عملیة التحویل وبعدها وفقاً لطریقة المتوسط/ المتوسط

رقم المفردة بالصورة الاختباریة الأولى

بارامتر الصعوبة المقدر قبل عملیة التحویل

بارامتر الصعوبة المقدر بعد عملیة التحویل

1

-1.341

-1.037

2

-0.965

-0.661

3

-1.371

-1.067

4

-1.294

-0.99

5

-0.2248

0.0792

6

-1.121

-0.817

7

-1.253

-0.949

8

0.1908

0.4948

9

0.1855

0.4895

10

0.0198

0.3238

11

-0.8655

-0.5615

12

-0.889

-0.585

13

0.294

0.598

14

0.987

1.291

یلاحظ من جدول 11 أن الصورة الاختباریة الأولى ( الهدف) تحولت إلى میزان الصورة الاختباریة الثانیة (القاعدة).

ومن خلال البرامج الاحصائیة یمکننا الحصول على الدرجات الخام للصورة الأولى والقدرات المقابلة لها والدرجات المعادلة للدرجات الخام على الصورة الثانیة وفقاً لطریقة (المتوسط/ المتوسط)، وجدول 12 یوضح ذلک.

جدول  12

الدرجات الخام على الصورة الأولى والقدرات المقابلة لها

 والدرجات المعادلة لها على الصورة الثانیة وفقاً لطریقة المتوسط/ المتوسط

الدرجة الخام على الصورة الأولى

القدرة المقابلة لکل درجة

الدرجة المعادلة لها على الصورة الثانیة

1

-2.166

0.69

2

1.0170

1.38

3

0.589

2.16

4

-1.027

2.98

5

0.982

3.69

6

-1.252

4.56

7

0.4677

5.45

8

0.743

6.23

9

-1.176

6.93

10

0.8956

7.85

11

1.2447

8.69

12

-1.1027

9.68

13

1.036

10.52

14

-1.498

11.02

ویوضح جدول 12 الدرجات الخام على الصورة الأولى( الهدف)، والقدرات المقابلة لها، وکذلک الدرجة المعادلة لها على الصورة الثانیة( القاعدة)، فالطالب الذی تکون قدرته مساویة (-2.166) تکون درجته على الصورة الأولى(1) والدرجة المعادلة لها على الصورة الثانیة ( 0.69)، والطالب الذی تکون قدرته مساویة (0.743) تکون درجته على الصورة الأولى(8) والدرجة المعادلة لها على الصورة الثانیة ( 6.23).

وللتحقق من فاعلیة المعادلة عند حذف الفقرات ذات الأداء التفاضلی أو فی ظل الابقاء علیها للعمر فی ضوء نموذج فیشر، تم حساب معامل الصدق التقاطعی للمعادلة العمودیة، وقد بلغ معامل الصدق التقاطعی فی ظل الاحتفاظ بالفقرات ذات الأداء التفاضلی (0.0008)، فی حین بلغ معامل الصدق التقاطعی عند حذف الفقرات ذات الأداء التفاضلی (0.0005)، وکلا المعاملین یشیرا إلى توافر الفاعلیة للمعادلة العمودیة بدرجة مقبولة، وبمقارنة قیم معامل الصدق التقاطعی الناتجة عن إجراء المعادلة العمودیة لمستویی الاختبار (صورتی الاختبار) فی ظل الاحتفاظ بالفقرات ذات الأداء التفاضلی للعمر، نلاحظ أن قیمة هذا المعامل انخفضت من (0.0008) إلى ( 0.0005) عند حذف الفقرات ذات الأداء التفاضلی للعمر مما یدل على زیادة دقة المعادلة العمودیة لصورتی الاختبار عند استبعاد الفقرات ذات الأداء التفاضلی، وأکد ذلک کل من (حسین عبد القادر، 1994؛ نضال الشریفین، 2003؛ أروى الحواری وأحمد عودة، 2008) فی دراساتهم حیث توصلوا إلى أنه کلما قل معامل الصدق التقاطعی دل ذلک على دقة المعادلة، ویتفق مع هذه النتیجة دراسة (Hidalog, M.& Lopez, J., 2002) والتی أکدت أن الفقرات ذات الأداء التفاضلی قد تأثر بدرجة کبیرة على دقة المعادلة العمودیة، ومن المهم تحدید هذه الفقرات وتقلیل تأثیرها، فقد تحسنت درجة دقة المعادلة عند حذف الفقرات ذات الأداء التفاضلی، لذلک یجب أخذ الأداء التفاضلی للفقرات بعین الاعتبار عند إجراء المعادلة لدرجات الاختبارات وذلک لتقلیل أثر الأداء التفاضلی على دقة فاعلیة المعادلة.

- أوجه الاستفادة من البحث :

فی ضوء نتائج البحث الحالی یمکن تقدیم هذه التوصیات:

ü      یقوم المتخصصون فی الحقل التربوی ببناء الکثیر من الاختبارات لنهایة کل فصل دراسی، ویتطلب ذلک وقتاً کبیراً وجهداً مضاعفاً، ومن خلال إجراء معادلة للاختبارات یمکننا التغلب على هذه المشکلات بصورة حقیقیة، وعلى العاملین بالحقل التربوی دراسة هذا الموضوع بشیء من التفصیل، وإعطائه المزید من الاهتمام والعنایة.

ü      إن توافر صور متکافئة أو بدیلة للاختبار تسهل من عملیة إعادة اختبار المفحوصین عندما یکون ذلک ضروریاً أو مرغوباً فیه للحفاظ على سریة الاختبار ولمنع أثر الاختلاط بین الأفراد الذین طبق علیهم الاختبار والذین سیطبق علیهم فیما بعد.

ü     إن الاعتماد بشکل کبیر على اختبارات الذکاء عند استخدامها فی الدراسات أو البحوث، کأداة رئیسة أو محک أو غیر ذلک یجعل من الأهمیة بمکان إعداد صوراً متکافئة، لذا کان من الضروری عمل معادلة لصورتی اختبار رافن للذکاء.

قائمة المراجع

-             أروى الحواری وأحمد عوده (2008). الخصائص السیکومتریة لصور مختارة من اختبارات الرخصة الدولیة لقیادة الحاسوب فی الأردن، ومعادلة درجاتها، المجلة الأردنیة فی العلوم التربویة، 4(4)، ص ص                   297 – 319.

-             إسماعیل حسن فهیم الولیلی (2005). تکافؤ درجات الاختبارات فی ضوء نظریتی القیاس الکلاسیکیة والحدیثة ( دراسة سیکومتریة مقارنة)، مجلة کلیة التربیة جامعة بنها، 15(63)، ص ص99 – 149.

-             حسین محمد عبد القادر أیوب(1994). المقارنة بین أربع طرق للمعادلة عندما یکون التصمیم من مجموعات متکافئة وغیر متکافئة، رسالة دکتوراه، کلیة الدراسات العلیا، الجامعة الأردنیة.

-             راشد حماد الدوسری ( 2001). معادلة الاختبارات مفهومها، وطرقها، ومشکلات تطبیقها، مجلة العلوم التربویة والنفسیة ، 1(4)، ص ص                     107 – 141.

-             صلاح الدین محمود علام(2002). القیاس والتقویم التربوی والنفسی أساسیاته وتوجهاته المعاصرة، القاهرة: دار الفکر العربی.

-             صلاح الدین محمود علام(2005). نماذج الاستجابة للمفردة الاختباریة أحادیة البعد ومتعددة الأبعاد وتطبیقاتها فی القیاس النفسی والتربوی، القاهرة:               دار الفکر العربی.

-             على ماهر خطاب ( 2001). علم النفس الفارق ط 3، القاهرة ، مکتبة                          الأنجلو المصریة.

-             عماد احمد حسن على (2014). المصفوفات المتتابعة الملونة للأطفال                       (تعدیل وتقنین)، ط 1، القاهرة: الانجلو المصریة.

-             عماد أحمد حسن على(1996). العمر والخبرة وعلاقتهما بالبناء العاملى للقدرة المکانیة، رسالة دکتوراه، کلیة التربیة، جامعة أسیوط.

-             عماد أحمد حسن علی(2016). تقنین اختبار رافن الملون للمصفوفات المتتابعة للکبار. القاهرة: الأنجلو المصریة.

-             میمی السید إسماعیل(2007). الخصائص السیکومتریة لاختبار القدرة العقلیة باستخدام نموذج راش لدى طلبة المرحلة الثانویة العامة، رسالة ماجستیر، کلیة التربیة – جامعة الزقازیق.

-             نضال کمال محمد الشریفین (2003). مدى تحقق معاییر الفاعلیة فی معادلة اختبارین أحدهما ثنائی التدریج والآخر متعدد التدریج وفق نماذج النظریة الکلاسیکیة والنظریة الحدیثة فی القیاس، رسالة دکتوراه، کلیة العلوم التربویة، جامعة عمان العربیة للدراسات العلیا.

Baghaei, H. & Kubinger, M.( 2015). Linear Logistic Test Modeling with R, Practical Assessment, Research & Evaluation, 20 ( 1), pp., 1-11.

Chong Ho Yu, A. (2005).  Test Equating by Common Items and Common Subjects: Concepts and Applications, A peer-reviewed electronic journal, 10(4). PP., 1-5.

 Fischer,  H.  (1973).  The  linear  logistic  test  model  as  an  instrument  in  educational  research Acta Psychologica, 37(1), pp., 359-374.

Fischer, H., (1982). Some Applications of Logistic Latent Trait Models with Linear Constraints on the Parameters, Applied Psychological Measurement, 6(4), pp., 397- 416.

Haertel, E. (2004). The Behavior of   zn Linking Items in Test Equating.  CSE, 1-8.

 Hambleton,  R.& Swaminathan ,H.( 1989).Item response theory:                            Principals and application. Boston, MA: Kluwer, NIJ publishing.

Harris, A.& Carlton, S.(1995). Pattern of gender differences on mathematics items on the scholastic Applied Measurement in Education, 6(2), pp137-150.

Harwell, S. (1997). Cities and Camps of the ConfederateStates, Univresity of Illinois, United States of America.

Hidalgo –Montesinos, M.& Lopez-Pina, J.(2002).Two Stage Equating in Differential Item Functioning Detection Under the Graded Response and the Lord Statistic. Educational and Psychological Measurement, 62(1),32.

Husen, T. &Postlethwaite, T., ( 1995). Item Response Theory, the Intenational Encyclopedia of Education, 1(5), pp., 351- 355.

Korawan, S.& Sirichai, K.& Nonglak, W. (2016). Student factors affecting latent transition of mathematics achievement measuring from latent transition analysis with a mixture item response theory measurement model, Procedia - Social and Behavioral Sciences, 1(217), pp., 729- 739.  

Kolen , M. & Brennan , R. (2004) . Test equating, scaling, and linking: methods and practices. 2nd Ed. The United States of America, Springer.

Kolen, M.  (1991). Comparison of traditional and item response theory methods for equating tests. Journal of Educational Measurement, 18( 1),  pp                           ,. 1-     11.

 Philipp, S.(2008). Using the LLTM to evaluate an item-generating system for reading comprehension, sychology Science Quarterly, 50(3), pp., 345-362.

Pono,  I,.( 2002). On the Applicability of some IRT Models For Repeated Measurement Designs: Conditions, Consequences, and Goodness- of- Fit Tests, Methods of Psychological Research on line, 7(1), pp., 21- 40.

Purya, B.& Klaus, K.(2015). Linear Logistic Test Modeling with R, Practical Assessment, Research & Evaluation, 20(1), pp., 2-10.     

Roos, L.(2002). Testing the Robustness of Item Response Theory Equating to Violation of the Condition of Equivalent Item Difficulty parameters in both the Extant pool Infused Items: A Comparison of the Effects on True-Score and Observed-Score Equating. Ph. D.. University of Nebraska.

Stephen, H.(2007).  The impact of differential discrimination on vertical equating, Murdoch University, Western Australia.

 

Susan E., W., & Lisa M. S., (1981). Information Structure for Geometric Analogies: A Test Theory Approach, Applied psychological Measurement. 5 (3), pp, 383-397

Wiberg, M.( 2004). Classical test theory vs Item response theory, an evaluation of the theory test in the Swedish driving-license test, Universities-Umea, 1(50), pp., 1- 25.

Yen, M. & Edwardson, S.(1999). Item response theory Approach in scale development, Official Journal of the Eastern Nursing Research Society and the Institute of Nursing,  1(48), pp., 234- 238.

Zhonghua, Z. (2010). Comparison of Different Equating Methods and An Application to link Testlet- Based Tests. Ph. D., the Chinese university of Hong Kong.

Zwick, R.,& Mazzeo, J.( 1997). Descriptive and inferential procedures for assessing differential item functioning in polytomous items, Applied Measurement in Education, 1(10), pp.                    , 321- 334. 

 

 

 

 

-             أروى الحواری وأحمد عوده (2008). الخصائص السیکومتریة لصور مختارة من اختبارات الرخصة الدولیة لقیادة الحاسوب فی الأردن، ومعادلة درجاتها، المجلة الأردنیة فی العلوم التربویة، 4(4)، ص ص                   297 – 319.
-             إسماعیل حسن فهیم الولیلی (2005). تکافؤ درجات الاختبارات فی ضوء نظریتی القیاس الکلاسیکیة والحدیثة ( دراسة سیکومتریة مقارنة)، مجلة کلیة التربیة جامعة بنها، 15(63)، ص ص99 – 149.
-             حسین محمد عبد القادر أیوب(1994). المقارنة بین أربع طرق للمعادلة عندما یکون التصمیم من مجموعات متکافئة وغیر متکافئة، رسالة دکتوراه، کلیة الدراسات العلیا، الجامعة الأردنیة.
-             راشد حماد الدوسری ( 2001). معادلة الاختبارات مفهومها، وطرقها، ومشکلات تطبیقها، مجلة العلوم التربویة والنفسیة ، 1(4)، ص ص                     107 – 141.
-             صلاح الدین محمود علام(2002). القیاس والتقویم التربوی والنفسی أساسیاته وتوجهاته المعاصرة، القاهرة: دار الفکر العربی.
-             صلاح الدین محمود علام(2005). نماذج الاستجابة للمفردة الاختباریة أحادیة البعد ومتعددة الأبعاد وتطبیقاتها فی القیاس النفسی والتربوی، القاهرة:               دار الفکر العربی.
-             على ماهر خطاب ( 2001). علم النفس الفارق ط 3، القاهرة ، مکتبة                          الأنجلو المصریة.
-             عماد احمد حسن على (2014). المصفوفات المتتابعة الملونة للأطفال                       (تعدیل وتقنین)، ط 1، القاهرة: الانجلو المصریة.
-             عماد أحمد حسن على(1996). العمر والخبرة وعلاقتهما بالبناء العاملى للقدرة المکانیة، رسالة دکتوراه، کلیة التربیة، جامعة أسیوط.
-             عماد أحمد حسن علی(2016). تقنین اختبار رافن الملون للمصفوفات المتتابعة للکبار. القاهرة: الأنجلو المصریة.
-             میمی السید إسماعیل(2007). الخصائص السیکومتریة لاختبار القدرة العقلیة باستخدام نموذج راش لدى طلبة المرحلة الثانویة العامة، رسالة ماجستیر، کلیة التربیة – جامعة الزقازیق.
-             نضال کمال محمد الشریفین (2003). مدى تحقق معاییر الفاعلیة فی معادلة اختبارین أحدهما ثنائی التدریج والآخر متعدد التدریج وفق نماذج النظریة الکلاسیکیة والنظریة الحدیثة فی القیاس، رسالة دکتوراه، کلیة العلوم التربویة، جامعة عمان العربیة للدراسات العلیا.
Baghaei, H. & Kubinger, M.( 2015). Linear Logistic Test Modeling with R, Practical Assessment, Research & Evaluation, 20 ( 1), pp., 1-11.
Chong Ho Yu, A. (2005).  Test Equating by Common Items and Common Subjects: Concepts and Applications, A peer-reviewed electronic journal, 10(4). PP., 1-5.
 Fischer,  H.  (1973).  The  linear  logistic  test  model  as  an  instrument  in  educational  research Acta Psychologica, 37(1), pp., 359-374.
Fischer, H., (1982). Some Applications of Logistic Latent Trait Models with Linear Constraints on the Parameters, Applied Psychological Measurement, 6(4), pp., 397- 416.
Haertel, E. (2004). The Behavior of   zn Linking Items in Test Equating.  CSE, 1-8.
 Hambleton,  R.& Swaminathan ,H.( 1989).Item response theory:                            Principals and application. Boston, MA: Kluwer, NIJ publishing.
Harris, A.& Carlton, S.(1995). Pattern of gender differences on mathematics items on the scholastic Applied Measurement in Education, 6(2), pp137-150.
Harwell, S. (1997). Cities and Camps of the ConfederateStates, Univresity of Illinois, United States of America.
Hidalgo –Montesinos, M.& Lopez-Pina, J.(2002).Two Stage Equating in Differential Item Functioning Detection Under the Graded Response and the Lord Statistic. Educational and Psychological Measurement, 62(1),32.
Husen, T. &Postlethwaite, T., ( 1995). Item Response Theory, the Intenational Encyclopedia of Education, 1(5), pp., 351- 355.
Korawan, S.& Sirichai, K.& Nonglak, W. (2016). Student factors affecting latent transition of mathematics achievement measuring from latent transition analysis with a mixture item response theory measurement model, Procedia - Social and Behavioral Sciences, 1(217), pp., 729- 739.  
Kolen , M. & Brennan , R. (2004) . Test equating, scaling, and linking: methods and practices. 2nd Ed. The United States of America, Springer.
Kolen, M.  (1991). Comparison of traditional and item response theory methods for equating tests. Journal of Educational Measurement, 18( 1),  pp                           ,. 1-     11.
 Philipp, S.(2008). Using the LLTM to evaluate an item-generating system for reading comprehension, sychology Science Quarterly, 50(3), pp., 345-362.
Pono,  I,.( 2002). On the Applicability of some IRT Models For Repeated Measurement Designs: Conditions, Consequences, and Goodness- of- Fit Tests, Methods of Psychological Research on line, 7(1), pp., 21- 40.
Purya, B.& Klaus, K.(2015). Linear Logistic Test Modeling with R, Practical Assessment, Research & Evaluation, 20(1), pp., 2-10.     
Roos, L.(2002). Testing the Robustness of Item Response Theory Equating to Violation of the Condition of Equivalent Item Difficulty parameters in both the Extant pool Infused Items: A Comparison of the Effects on True-Score and Observed-Score Equating. Ph. D.. University of Nebraska.
Stephen, H.(2007).  The impact of differential discrimination on vertical equating, Murdoch University, Western Australia.
 
Susan E., W., & Lisa M. S., (1981). Information Structure for Geometric Analogies: A Test Theory Approach, Applied psychological Measurement. 5 (3), pp, 383-397
Wiberg, M.( 2004). Classical test theory vs Item response theory, an evaluation of the theory test in the Swedish driving-license test, Universities-Umea, 1(50), pp., 1- 25.
Yen, M. & Edwardson, S.(1999). Item response theory Approach in scale development, Official Journal of the Eastern Nursing Research Society and the Institute of Nursing,  1(48), pp., 234- 238.
Zhonghua, Z. (2010). Comparison of Different Equating Methods and An Application to link Testlet- Based Tests. Ph. D., the Chinese university of Hong Kong.
Zwick, R.,& Mazzeo, J.( 1997). Descriptive and inferential procedures for assessing differential item functioning in polytomous items, Applied Measurement in Education, 1(10), pp.                    , 321- 334.