مقارنة الخصائص السيکومترية بين الاختبارات التحصيلية الإلکترونية والورقية

نوع المستند : المقالة الأصلية

المؤلف

مدرس علم النفس التربوي کلية التربية ـ جامعة المنيا کلية التربية ـ جامعة الإمام عبد الرحمن بن فيصل

10.12816/0054507

المستخلص

هدف البحث الحالي إلى مقارنة الخصائص السيکومترية بين الاختبار التحصيلي الإلکتروني والورقي، وذلک من خلال مقارنة الإحصاءات الخاصة بمعاملات صعوبة المفردات ومعاملات تمييزها وقيم الثبات والصدق التلازمي للاختبار التحصيلي عند تقديمه بثلاث طرق مختلفة: الطريقة الإلکترونية أثناء المحاضرة، والطريقة الإلکترونية عن بعد، والطريقة الورقية. وقد قارن البحث ثبات الاتساق الداخلي للاختبار بصوره الثلاثة محسوباً بطريقتين: طريقة التجزئة النصفية، وطريقة ألفا کرونباخ. کما قارن البحث الصدق التلازمي للاختبار بصوره الثلاثة محسوباً بمعامل ارتباط سبيرمان بين درجة الطلاب على الاختبار التحصيلي التکويني المستخدم واختبار نهاية الفصل الدراسي کمحک. وقد استخدم البحث اختباراً تحصيلياً تکوينياً من عشرين مفردة من نوع الاختيار من متعدد ذات أربع بدائل في مقرر "مهارات التفکير"، واستخدم المنهج التجريبي، حيث تم اختيار ثلاث شعب متکافئة في التحصيل من طالبات کلية التربية بجامعة الإمام عبد الرحمن بن فيصل.
أخذت المجموعة الأولى الاختبار إلکترونياً أثناء المحاضرة من خلال نظام البلاک بورد (Blackboard)، مع ضبط خيارات النظام، بحيث يتيح للممتحن محاولةً واحدة، وتم توقيت الاختبار بتحديد 25 دقيقة کزمن للإجابة، وقُدِّمت الأسئلة للممتحنين بشکل عشوائي، کما وُزِّعت بدائل الإجابة بشکل عشوائي، وتم تقديم جميع الأسئلة في صفحة واحدة؛ مما يتيح للممتحن التنقل بين الأسئلة ومراجعة الإجابات.
وأخذت المجموعة الثانية الاختبار إلکترونياً عن بعد من خلال نظام البلاک بورد، وتم ضبط خيارات تقديم الاختبار بحيث يکمل الممتحن الاختبار في جلسة واحدة، مع حظر الرجوع؛ مما يمنع الممتحن من التنقل بين الأسئلة، وتم توقيت الاختبار بتحديد 25 دقيقة کزمن للإجابة، وقُدِّمت الأسئلة للممتحنين بشکل عشوائي، کما وُزِّعت بدائل الإجابة بشکل عشوائي.
وأخذت المجموعة الثالثة الاختبار في صورة ورقية. وأظهرت النتائج وجود فروق ذات دلالة إحصائية بين معاملات صعوبة المفردات عند تقديمه إلکترونياً عن بعد، وعند تقديمه إلکترونياً أثناء المحاضرة أو ورقياً، وکانت الفروق لصالح الصورة الأولى "الإلکترونية عن بعد"، بينما لم توجد فروق ذات دلالة إحصائية بين معاملات تمييز مفردات الاختبار التحصيلي بصوره الثلاثة "إلکترونياً عن بعد وإلکترونياً أثناء المحاضرة وورقياً"، وتم الحصول على أفضل معامل ثبات للاختبار وأفضل معامل للصدق التلازمي عند تقديمه إلکترونياً أثناء المحاضرة، وکان أقل معامل للثبات وأقل معامل للصدق التلازمي عند تقديم الاختبار إلکترونياً عن بعد.
وفي ضوء هذه النتائج يوصي البحث بتقديم الاختبار إلکترونياً بتواجد المعلم، وعدم تقديمه إلکترونياً عن بعد، کما يوصي بتطوير إجراءات ضبط تقديم الاختبار عن بعد؛ ليتيح للمعلم مراقبة أداء الممتحنين أثناء تقديم الاختبار.
The present study aimed at comparing the psychometric characteristics of both the electronic achievement tests versus the pencil and paper ones through making a comparison of the statistical analysis of the difficulty index and its discrimination index as well as the reliability and the concurrent validity of the achievement test when presenting it in three different ways: computer based testing through the lecture, computer based testing at home and Paper-pencil testing. The co-efficient reliability was calculated by two different ways of the internal consistency: Cronbach’s alpha and the split half-reliability coefficient, and calculating the concurrent validity of the test through calculating the coefficient correlation of students' scores on the formative achievement test and the summative one. The formative test consisted of twenty MCQ items with four alternatives in the Thinking Skills Course using the experimental research design. Three groups were selected from among the Faculty of Education for girls in Imam Abdulrahman Bin Faisal University. The first group was tested electronically using the Blackboard system during lectures making sure of giving students only one trial to answer the test. The allotted time was twenty five minutes. Shuffling questions as well as the alternatives where considered. All questions were presented in one page as to give students the chance to revise their answers before submission. The second group was tested asynchronously using the Blackboard system. Students were allowed to answer the test in one session and there were not allowed to go back to review questions. Shuffling questions as well as the alternatives where considered as to reduce the opportunities for cheating the answers to minimum, while the third group was tested conventionally (paper-pencil test). Results revealed that there was a statistical difference between difficulty indexes of the achievement test items in presenting it asynchronously and when presenting it while lecturing and conventionally (paper-pencil test),and there was no statistical difference between discrimination indexes of the achievement test items in presenting it while lecturing and when presenting it asynchronously and conventionally (paper-pencil test)  The value of the reliability coefficient and the concurrent validity was extremely high when conducting the test during lectures and it was extremely low when conducting the test asynchronously. In the light of these results, the present study recommends developing the procedures of managing tests asynchronously as to give teachers more opportunities to monitor students while conducting tests.

الموضوعات الرئيسية


 

               کلیة التربیة

        کلیة معتمدة من الهیئة القومیة لضمان جودة التعلیم

        إدارة: البحوث والنشر العلمی ( المجلة العلمیة)

    =======

 

مقارنة الخصائص السیکومتریة بین الاختبارات التحصیلیة الإلکترونیة والورقیة

 

 

إعــــداد

د / سومیه شکری محمد محمود

مدرس علم النفس التربوی

کلیة التربیة ـ جامعة المنیا

کلیة التربیة ـ جامعة الإمام عبد الرحمن بن فیصل

 

 

 

}     المجلد الرابع والثلاثون– العدد السادس -یونیه 2018م {

http://www.aun.edu.eg/faculty_education/arabic

ملخص البحث:

هدف البحث الحالی إلى مقارنة الخصائص السیکومتریة بین الاختبار التحصیلی الإلکترونی والورقی، وذلک من خلال مقارنة الإحصاءات الخاصة بمعاملات صعوبة المفردات ومعاملات تمییزها وقیم الثبات والصدق التلازمی للاختبار التحصیلی عند تقدیمه بثلاث طرق مختلفة: الطریقة الإلکترونیة أثناء المحاضرة، والطریقة الإلکترونیة عن بعد، والطریقة الورقیة. وقد قارن البحث ثبات الاتساق الداخلی للاختبار بصوره الثلاثة محسوباً بطریقتین: طریقة التجزئة النصفیة، وطریقة ألفا کرونباخ. کما قارن البحث الصدق التلازمی للاختبار بصوره الثلاثة محسوباً بمعامل ارتباط سبیرمان بین درجة الطلاب على الاختبار التحصیلی التکوینی المستخدم واختبار نهایة الفصل الدراسی کمحک. وقد استخدم البحث اختباراً تحصیلیاً تکوینیاً من عشرین مفردة من نوع الاختیار من متعدد ذات أربع بدائل فی مقرر "مهارات التفکیر"، واستخدم المنهج التجریبی، حیث تم اختیار ثلاث شعب متکافئة فی التحصیل من طالبات کلیة التربیة بجامعة الإمام عبد الرحمن بن فیصل.

أخذت المجموعة الأولى الاختبار إلکترونیاً أثناء المحاضرة من خلال نظام البلاک بورد (Blackboard)، مع ضبط خیارات النظام، بحیث یتیح للممتحن محاولةً واحدة، وتم توقیت الاختبار بتحدید 25 دقیقة کزمن للإجابة، وقُدِّمت الأسئلة للممتحنین بشکل عشوائی، کما وُزِّعت بدائل الإجابة بشکل عشوائی، وتم تقدیم جمیع الأسئلة فی صفحة واحدة؛ مما یتیح للممتحن التنقل بین الأسئلة ومراجعة الإجابات.

وأخذت المجموعة الثانیة الاختبار إلکترونیاً عن بعد من خلال نظام البلاک بورد، وتم ضبط خیارات تقدیم الاختبار بحیث یکمل الممتحن الاختبار فی جلسة واحدة، مع حظر الرجوع؛ مما یمنع الممتحن من التنقل بین الأسئلة، وتم توقیت الاختبار بتحدید 25 دقیقة کزمن للإجابة، وقُدِّمت الأسئلة للممتحنین بشکل عشوائی، کما وُزِّعت بدائل الإجابة بشکل عشوائی.

وأخذت المجموعة الثالثة الاختبار فی صورة ورقیة. وأظهرت النتائج وجود فروق ذات دلالة إحصائیة بین معاملات صعوبة المفردات عند تقدیمه إلکترونیاً عن بعد، وعند تقدیمه إلکترونیاً أثناء المحاضرة أو ورقیاً، وکانت الفروق لصالح الصورة الأولى "الإلکترونیة عن بعد"، بینما لم توجد فروق ذات دلالة إحصائیة بین معاملات تمییز مفردات الاختبار التحصیلی بصوره الثلاثة "إلکترونیاً عن بعد وإلکترونیاً أثناء المحاضرة وورقیاً"، وتم الحصول على أفضل معامل ثبات للاختبار وأفضل معامل للصدق التلازمی عند تقدیمه إلکترونیاً أثناء المحاضرة، وکان أقل معامل للثبات وأقل معامل للصدق التلازمی عند تقدیم الاختبار إلکترونیاً عن بعد.

وفی ضوء هذه النتائج یوصی البحث بتقدیم الاختبار إلکترونیاً بتواجد المعلم، وعدم تقدیمه إلکترونیاً عن بعد، کما یوصی بتطویر إجراءات ضبط تقدیم الاختبار عن بعد؛ لیتیح للمعلم مراقبة أداء الممتحنین أثناء تقدیم الاختبار.

Abstract:                                                                                         

The present study aimed at comparing the psychometric characteristics of both the electronic achievement tests versus the pencil and paper ones through making a comparison of the statistical analysis of the difficulty index and its discrimination index as well as the reliability and the concurrent validity of the achievement test when presenting it in three different ways: computer based testing through the lecture, computer based testing at home and Paper-pencil testing. The co-efficient reliability was calculated by two different ways of the internal consistency: Cronbach’s alpha and the split half-reliability coefficient, and calculating the concurrent validity of the test through calculating the coefficient correlation of students' scores on the formative achievement test and the summative one. The formative test consisted of twenty MCQ items with four alternatives in the Thinking Skills Course using the experimental research design. Three groups were selected from among the Faculty of Education for girls in Imam Abdulrahman Bin Faisal University. The first group was tested electronically using the Blackboard system during lectures making sure of giving students only one trial to answer the test. The allotted time was twenty five minutes. Shuffling questions as well as the alternatives where considered. All questions were presented in one page as to give students the chance to revise their answers before submission. The second group was tested asynchronously using the Blackboard system. Students were allowed to answer the test in one session and there were not allowed to go back to review questions. Shuffling questions as well as the alternatives where considered as to reduce the opportunities for cheating the answers to minimum, while the third group was tested conventionally (paper-pencil test). Results revealed that there was a statistical difference between difficulty indexes of the achievement test items in presenting it asynchronously and when presenting it while lecturing and conventionally (paper-pencil test),and there was no statistical difference between discrimination indexes of the achievement test items in presenting it while lecturing and when presenting it asynchronously and conventionally (paper-pencil test)  The value of the reliability coefficient and the concurrent validity was extremely high when conducting the test during lectures and it was extremely low when conducting the test asynchronously. In the light of these results, the present study recommends developing the procedures of managing tests asynchronously as to give teachers more opportunities to monitor students while conducting tests.

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

مقدمة:

یشهد العصر الحالی تطوراً معرفیاً متسارعاً کمیاً ونوعیاً، مما یدفع المؤسسات التعلیمیة للبحث عن أدوات تمکنها من متابعة ذلک النمو المتلاحق للمعرفة، ولم یعد هناک بُد من دعم بیئات التعلم ببرمجیات الحاسوب وتکنولوجیا المعلومات؛ لما تقدمه من میزات متعددة، أهمها سهولة الوصول للمعلومة، ودعم بیئة التعلم بمعینات بصریة وسمعیة تمکن المتعلمین من معالجة المعلومات المعقدة، وتعین المعلمین على شرح المفاهیم المجردة، کما أنها تضیف إلى بیئة التعلم عاملی التشویق والإثارة، مما یحسن دافعیة المتعلمین. ومن المتوقع أن تحل المدرسة الإلکترونیة محل المدرسة التقلیدیة؛ لقدرتها على علاج الکثیر من مشکلات التعلیم فی الدول الفقیرة؛ لأنها تتیح الخدمة التعلیمیة لعدد کبیر من المتعلمین دون الحاجة لإمکانات لوجستیة ضخمة، وتقضی على الحدود الجغرافیة للمدرسة، وتتیح الفرصة للاستعانة بمعلمین أکفاء من أی مکان بالعالم. حیث تتیح الفصول الافتراضیة الاتصال والتفاعل بین الطلاب والمعلم عبر بیئات جغرافیة من مختلف أنحاء العالم وتدعم بیئة التعلم بالعدید من الوسائط وأدوات التعلم الفعالة (غریب، 2014: 144). وکلما تحولت البیئات التعلیمیة إلى استخدام تقنیة الحاسوب والمعلومات فی التدریس والتعلم فإنه من الأجدى أن تتناسب البیئات الاختباریة مع البیئات التعلیمیة والتدریسیة (الخزی والذکری،2011: 193).            

وعلى الرغم من توفر العدید من تقنیات إعداد الاختبارات الإلکترونیة وإتاحتها على شبکة الإنترنت إلا أنها لم تحظ بعد بالاهتمام من قبل التربویین، وقد یرجع ذلک إلى الاعتقاد بصعوبة إعدادها أو تطبیقها، أو إلى عدم الثقة فی نتائجها، ومن ناحیة أخرى هناک اتجاه سالب لدى المتعلمین تجاه الاختبارات الإلکترونیة، فهناک نزعة لدى المتعلمین لمقاومة التغییر، لذا أصبح من الضروری دراسة الخصائص السیکومتریة للاختبارات الإلکترونیة مقارنة بالاختبارات الورقیة التقلیدیة، مما یتیح لکل من التربویین والمتعلمین مزیداً من المعلومات حول هذه الاختبارات، وتقییمها بشکل موضوعی قائم على الأدلة العلمیة، کما یتیح لمصممی تقنیات الاختبارات الإلکترونیة المعرفة اللازمة لتطویر تلک التقنیات، والشروط اللازمة لجعل نتائج هذه الاختبارات ذات موثوقیة عالیة.

مشکلة البحث:

اهتم کثیر من الباحثین فی السنوات الأخیرة بالاختبارات الإلکترونیة، وتنوع مجال هذا الاهتمام، فبعض الدراسات اهتمت بدراسة فاعلیة الاختبارات الإلکترونیة کأداة تعلیمیة تستخدم لتدریب المتعلمین ورفع مستوى أدائهم فی الاختبارات التحصیلیة، کما اهتم المختصون فی مجال تکنولوجیا التعلیم بالاختبارات الإلکترونیة من حیث مقارنة جودة البرمجیات المختلفة المستخدمة فی إعداد هذه الاختبارات من الناحیة الفنیة والتقنیة، وأعدوا برامج تعلیمیة لتمکین المعلمین من استخدام الاختبارات الإلکترونیة ووضع معاییر لجودة هذه الاختبارات.

أما من الناحیة السیکومتریة فهناک ندرة ملحوظة فی الدراسات التی بحثت فی الخصائص السیکومتریة للاختبارات الإلکترونیة مقارنة بالاختبارات الورقیة التقلیدیة، خاصة أن هناک حالة من تباین الاتجاه حول فاعلیة الاختبارات الإلکترونیة فی قیاس التحصیل. فبعض المختصین یرون أن الاختبارات الإلکترونیة تقدم العدید من المزایا؛ حیث یتم من خلالها إعداد المفردات وإخراجها بطریقة صحیحة وسهلة، وتقدیمها للممتحنین، وتسجیل استجاباتهم، وتصحیحها، وتقدیم التغذیة المرتدة الفوریة، ورصد درجات الاختبار، وتخزین النتائج. فی حین یشکک البعض الآخر فی دقة نتائج هذه الاختبارات، خاصة عند تطبیقها عن بعد؛ لأنها حینئذ تهیئ فرص الغش للممتحنین، فقد یقدم الاختبار على الشاشة شخص                 آخر غیر الممتحن، لذا أصبح من الضروری دراسة تأثیر طریقة تقدیم الاختبار                        (ورقیاً / إلکترونیاً ) على خصائصه السیکومتریة. 

وقد أعرب کل من خبراء التقییم والباحثین والممارسین والمستخدمین عن قلقهم                    بشأن إمکانیة مقارنة الدرجات بین أسلوبی تقدیم الاختبار إلکترونیاً وورقیاً               (Wang. et al., 2008: 5). کما أن هناک العدید من الطلاب یزید لدیهم قلق الاختبار فی حالة تطبیق الاختبارات الإلکترونیة، خاصة إذا ما تم توقیت الاختبار، مما یثیر التساؤل عن مدى تأثیر ذلک على ثبات الاختبار وصدقه.

ولم یقتصر تأثیر تقنیات الحاسوب والمعلومات فی التعلیم على الدول المتقدمة فحسب، إنما امتد أیضاً إلى مؤسسات التعلیم فی الشرق الأوسط، ولکن انحسرت هذه الاستخدامات فی التعلم والتدریس، ولم تستخدم فی قیاس التحصیل؛ نظراً لظن التربویین بعدم مصداقیتها، مما جعل دراسة کفاءة الاختبارات الإلکترونیة أمراً غایة فی الأهمیة، تفرضه الفجوة الحاصلة بین التوجه السریع فی استخدام الحاسوب فی عملیة التعلیم من جهة والبطء الشدید فی اعتماد الاختبارات الإلکترونیة من جهة أخرى (الخزی والذکری،2011: 169-170). ولاشک أن الاختبارات الإلکترونیة وسیلة مهمة فی تطویر عملیة التقویم والعملیة التعلیمة بشکل عام؛ لأنها توفر الکثیر من الجهد للمعلم، مما یهیئ له فرصة جیدة للاهتمام بأنشطة التعلم الأخرى،  ولذلک هناک حاجة إلى مزید من الدراسات لتقییم طرق تقدیم الاختبارات الإلکترونیة؛ لتوجیه المستخدمین إلى الطریقة الصحیحة؛ لاستخدامها والاستفادة منها.

تساؤلات البحث:

  1. هل تختلف قیم معاملات صعوبة المفردات باختلاف طریقة تقدیمه ( إلکترونیاً أثناء المحاضرة / إلکترونیاً عن بعد / ورقیاً )؟
  2. هل تختلف قیم معاملات تمییز المفردات باختلاف طریقة تقدیمه ( إلکترونیاً أثناء المحاضرة / إلکترونیاً عن بعد / ورقیاً )؟
  3. هل تؤثر طریقة تقدیم الاختبار التحصیلی ( إلکترونیاً أثناء المحاضرة / إلکترونیاً عن بعد / ورقیاً ) على معامل ثباته؟
  4. هل تؤثر طریقة تقدیم الاختبار التحصیلی ( إلکترونیاً أثناء المحاضرة / إلکترونیاً عن بعد / ورقیاً ) على معامل صدقه التلازمی؟

فروض البحث:

  1. لا توجد فروق ذات دلالة إحصائیة عند مستوى دلالة ( α ≤ 0.05) بین معاملات صعوبة مفردات الاختبار التحصیلی عند تقدیمه إلکترونیاً أثناء المحاضرة وتقدیمه إلکترونیاً عن بعد، وتقدیمه ورقیاً.
  2. لا توجد فروق ذات دلالة إحصائیة عند مستوى دلالة ( α ≤ 0.05) بین معاملات تمییز صعوبة مفردات الاختبار التحصیلی عند تقدیمه إلکترونیاً أثناء المحاضرة وتقدیمه إلکترونیاً عن بعد، وتقدیمه ورقیاً.
  3. لا تختلف قیمة معامل ثبات الاتساق الداخلی للاختبار التحصیلی عند تقدیمه إلکترونیاً أثناء المحاضرة وتقدیمه إلکترونیاً عن بعد، وتقدیمه ورقیاً.
  4. لا تختلف قیمة معامل الصدق التلازمی للاختبار التحصیلی عند تقدیمه إلکترونیاً أثناء المحاضرة وتقدیمه إلکترونیاً عن بعد، وتقدیمه ورقیاً.

أهداف البحث:

  1. التعرف على أثر طریقة تقدیم الاختبار التحصیلی على کل من الخصائص السیکومتریة للاختبار (الصدق والثبات) والخصائص السیکومتریة للفقرات (الصعوبة والتمییز).
  2. الکشف عن الطریقة الأفضل لتقدیم الاختبار التحصیلی.
  3. تقییم مصداقیة الاختبارات التحصیلیة الإلکترونیة عند تطبیقها عن بعد.

أهمیة البحث:

أولاً- الأهمیة النظریة:

یقدم البحث معلومات عن مدى مصداقیة الاختبارات التحصیلیة الإلکترونیة، خاصة عند تقدیم الاختبار عن بعد، فهناک ندرة فی هذه المعلومات فی الأدبیات السیکولوجیة، حیث یقدم البحث أدلةً لتأکید أو دحض الظن الشائع لدى التربویین بانعدام موثوقیة الاختبارات الإلکترونیة عند تطبیقها عن بعد، رغم توفر العدید من القیود، کضبط الزمن المتاح للحل، وظهور المفردة للممتحن مرة واحدة، وعدم قدرته للرجوع لها بعد تقدیم الإجابة، وترتیب کل من المفردات وبدائلها بطریقة عشوائیة، بحیث یختلف الترتیب تماماً بین الممتحنین.

ثانیاً- الأهمیة التطبیقیة:

  1. إمداد التربویین بالمعلومات اللازمة لاختیار الطریقة المناسبة لتقدیم الاختبارات التحصیلیة.
  2. توجیه اهتمام مصممی برمجیات الاختبارات الإلکترونیة إلى تطویر خیارات تقدیم الاختبارات بما یتناسب مع تحقیق الشروط السیکومتریة للاختبار التحصیلی الجید.
  3. التحقق من دقة نتائج الاختبارات التحصیلیة الإلکترونیة قبل الاندفاع فی تعمیمها على المراحل التعلیمیة المختلفة.  

حدود البحث:

یتحدد البحث الحالی بما یلی:

  1. الأداة المستخدمة: وهی اختبار تحصیلی تکوینی فی مقرر مهارات التفکیر من 20 مفردة من نوع الاختیار من متعدد، یقیس أربعة مستویات معرفیة طبقاً لتصنیف بلوم للأهداف، هی: ( التذکر / الفهم / التطبیق / التحلیل).
  2. عینة البحث: وشملت 83 طالبة ممن یدرسون المقرر بکلیة التربیة، بجامعة الإمام عبد الرحمن بن فیصل.
  3. النظام المستخدم فی تقدیم الاختبار إلکترونیاً: وهو برنامج إدارة التعلم "البلاک بورد" (Blackboard).

التعریف الإجرائی لمصطلحات البحث:

  1. الاختبار التحصیلی: هو أداة قیاس تحدد درجة تحصیل الممتحن لمحتوى تعلیمی محدد جیداً، من خلال إجابته عن عینة من المفردات تمثل الأهداف السلوکیة للمحتوى، ویتم إعداده وفق طریقة منظمة من عدة خطوات تخضع لشروط وقواعد محددة.
  2. الاختبار الإلکترونی: هو اختبار یتم تقدیمه والاستجابة على مفرداته وتصحیحها فوریاً باستخدام برمجیات حاسوبیة.
  3. ثبات الاختبار: هو الاتساق والدقة فی نتائج الاختبار، وتعنی الدقة خلو الدرجة المقدرة على الاختبار من مصادر الخطأ، ویعنی الاتساق الاستقرار فی علامات الفرد إذا أخذ الاختبار نفسه عدة مرات فی نفس الظروف.
  4. معاملثباتالاتساقالداخلیللاختبار: هو معامل یتم تقدیره لیعبر عن درجة التجانس الداخلی بین فقرات الاختبار. وتم تقدیره فی هذا البحث باستخدام کل من معامل ألفا کرونباخ، ومعامل ثبات التجزئة النصفیة المصحح بطریقة سبیرمان براون.
  5. الصدقالتلازمی للاختبار: هو اتساق نتائج الاختبار مع نتائج محک خارجی مستقل یقیس السمة نفسها، ویتم تطبیقه بالتزامن مع الاختبار. وتم تقدیره فی هذا البحث من خلال حساب معامل ارتباط سبیرمان بین درجات الطالبات فی الاختبار ودرجاتهم فی الاختبار النهائی لنفس المقرر.
  6. صعوبة المفردة: هی نسبة الممتحنین الذین أجابوا عن المفردة إجابة صحیحة من المجموع الکلی للممتحنین.
  7. تمییز المفردة: هو قدرة الفقرة على التمییز بین الممتحنین المتقنین والممتحنین غیر المتقنین. وتم حساب معاملات التمییز للفقرات باستخدام معامل ارتباط بوینت بایسیریال (Point biserial)  بین درجات الممتحنین على الفقرة ودرجاتهم الکلیة على الاختبار.

الإطار النظری:

لقد زادت العملیة التعلیمیة تعقیداً نتیجة للزیادة فی أعداد التلامیذ والتقدم العلمی والتکنولوجی الهائل والمتدفق بصورة متلاحقة ( سمعان،2012 :44). وتعد الاختبارات الإلکترونیة سلاحاً ذا حدین، فهی - من ناحیة - وسیلة مهمة لدعم وتطویر العملیة التعلیمیة؛ لأنها تقدم عدة ممیزات تسهم فی حل هذا التعقید، ومن ناحیة أخرى هناک شکوک حول مصداقیتها خاصة عند تقدیمها خارج حجرة الصف. رغم أن تطبیق الاختبار الإلکترونی خارج حجرة الصف له میزة کبیرة، بشرط توفر مجموعة من الضمانات لتحقق المصداقیة؛ لأن ذلک یسمح بتوفیر جزء من الوقت للمعلم والطلاب یمکن استثماره فی أنشطة التعلم، کما أن تطبیق الاختبار عن بعد یعد نشاطاً تربویاً إذا ما استهدف تنمیة الرقابة الذاتیة لدى الطلاب، بالإضافة إلى أن الاختبارات الإلکترونیة جزء أساسی من التعلم عن بعد، والذی تتم فیه جمیع أنشطة التعلم والتقویم عن بعد من خلال شبکة الإنترنت.  

ویمثل الاختبار موقفاً مثیراً من مجموعة من المشکلات یتطلب لحلها مجموعة استجابات تمثل أدلة على امتلاک الممتحن لمستوى محدد من السمة المستهدفة بالقیاس. وتتوقف فاعلیة الاختبار على خصائصه السیکومتریة المرتبطة بالصدق والثبات والقدرة على تمییز المستویات المختلفة للسمة المقاسة. وتتعدد أنواع الاختبار بتعدد محک التصنیف، وإذا اعتبرنا طریقة تقدیم الاختبار للممتحنین محکاً للتصنیف ینتج عن ذلک نوعان: الاختبارات الورقیة، والاختبارات الإلکترونیة التی یمکن أن تقدم بعدة طرق مختلفة داخل                        الصف وخارجه.

   وقد عرف مندور (2013: 397-398) الاختبارات الإلکترونیة على أنها الاختبارات التی تتم بواسطة تقنیات الکمبیوتر وشبکاته، فمن خلالها یتم القیام بکافة أنشطة الاختبارات، مثل: إعداد مهام التقییم، وعرضها على الطلاب، واستقبال الاستجابات، وتصحیحها، وتقدیم تغذیة مرتدة للمستجیبین، وتقدیر درجاتهم، ورصد نتائج الاختبار، وتفسیرها، وتخزینها، وتوفیر إجراءات الأمان حفاظاً على السریة.

وتضم الاختبارات الإلکترونیة جمیع الاختبارات التی یمکن تصمیمها وإنتاجها من خلال الحاسوب، سواء کانت قائمة على الإنترنت WBT أو قائمة على الکمبیوتر CBT                    (غریب، 2014: 149)، حیث یتم عرض بنود الاختبار على الشاشة، ویجیب الطالب عنها مباشرة باستخدام أدوات الإدخال (الخزی وذکری،2011: 171).

وفی هذا السیاق یجب أن نمیز بین الاختبارات الإلکترونیة والاختبارات المکیفة أو التفریدیة، حیث إن الاختبارات المکیفة هی نوع خاص من الاختبارات الإلکترونیة، یتم فیه اختیار المفردات التی تقدم للممتحن بناء على استجابته للمفردات السابقة، ولذلک یشترط أن تعتمد الاختبارات المکیفة على مفردات مدرجة طبقاً لأحد نماذج نظریة الاستجابة للمفردة، فهی تعتمد على التقدیر الآنی لقدرة الممتحن من خلال استجابته على مفردة محددة، ثم یقوم النظام بسحب مفردات تناسب هذا المستوى من القدرة؛ بهدف الوصول إلى أعلى درجة ممکنة من دقة تقدیر القدرة فی أقل زمن ممکن وباستخدام أقل عدد من المفردات، وبذلک یختلف الاختبار المستخدم من ممتحن لآخر، وهو ما یطلق علیه الاختبار المرن                            (المصری، 2002: 204-205).

وتتعدد برامج إدارة التعلم الإلکترونی التی تستخدم فی بناء الدروس والبرامج التعلیمیة والاختبارات الإلکترونیة على شبکة الإنترنت، وتعمل هذه البرامج على تصمیم المحتوى التعلیمی باستخدام قوالب جاهزة، یمکن تعدیلها وترکیبها بسهولة، بما یتناسب مع طبیعة  المحتوى، ومن أشهر هذه البرامج:  Moodle, A tutor,  Docbo AT, Clar online, Dokeos, Interact  ( بدوی، 2014: 147 )

ویعد نظام إدارة التعلم "البلاک بورد"  Blackboardواحداً من أقوى أنظمة إدارة التعلم الإلکترونیة؛ إذ تستخدمه أکثر من 3600 مؤسسة تعلیمیة على مستوى العالم فی تقدیم خدمات تعلیمیة راقیة للمعلم والطالب، کما ساعد کثیراً من المؤسسات التعلیمیة فی نشر التعلیم بقوة عن طریق الإنترنت لتمیزه بالمرونة وقابلیته للتطویر ( شعیب، 2004: 183).

أنواع الاختبارات الإلکترونیة:

یمکن تصنیف الاختبارات الإلکترونیة فی فئتین، فهناک الاختبار المعتمد على الحاسوب CBTحیث یتم تطبیق الاختبار دون الحاجة للاتصال بشبکة الإنترنت، والاختبار المعتمد على الشبکة NBT ، حیث توفر الشبکة فرصة الاختبار عن بعد، ویعد نظام إدارة التعلم "البلاک بورد" المستخدم فی البحث الحالی من النوع الأخیر.

وتتعدد ممیزات الاختبارات الإلکترونیة؛ لأنها تتیح للممتحن الانتقال بسهولة من سؤال لآخر، وکذلک تعدیل إجابته دون أن یترک أثراً للتعدیل کما هو الحال فی الاختبارات التقلیدیة                       ( البلوی، 2013: 208)، کما توصلت دراسة التخاینة وأبو موسى (2009) إلى فاعلیة الاختبارات الإلکترونیة التکوینیة فی زیادة التحصیل الأکادیمی لطلاب کلیة التربیة وتحسین اتجاههم نحوها ( التخاینة وأبو موسى، 2009: 117).

وتقدم الاختبارات الإلکترونیة للمعلم العدید من بدائل تصمیم الاختبار، منها: اختیار نوع الأسئلة المناسب؛ حیث تصل أنواع المفردات التی یمکن أن یختار منها المعلم إلى عشرة أنواع، وتتیح إدراج الصور الملونة، أو مقاطع الصوت، أو الفیدیو، بالإضافة لتنوع طرق عرض الأسئلة والإجابة عنها، سواء أکانت مرتبة وفق نظام معین أم بشکل عشوائی، بحیث یقدَّم الاختبار الواحد بأکثر من شکل، بما یحد من ظاهرة الغش ( بدوی، 2014: 148 )، کما تقدم الاختبارات الإلکترونیة ممیزات هامة تتعلق بتکیف الأداء الاختباری لذوی الاحتیاجات الخاصة، وأثناء تعلم اللغات الأجنبیة، حیث تتیح التحکم فی حجم الخط، وتحویل النص إلى صوت (Hansen & Mislevy, 2005: 214).

کما توفر الاختبارات الإلکترونیة الوقت والجهد المستغرق فی إخراج الاختبارات وطباعتها ونسخها وتوزیعها على الطلاب وتصحیحها ورصد درجاتها، بالإضافة إلى أن بعض البرمجیات تقدم تحلیلاً إحصائیاً لمفردات الاختبار، وتفسیراً دقیقاً لمعاملات صعوبة المفردات ومعاملات التمییز، کما توفر وقت الطالب أثناء أداء الاختبار؛ فقد توصلت دراسة الخزی وذکری (2011: 172) إلى أن الوقت المستغرق فی أداء الاختبار الإلکترونی أقل بشکل دال مقارنة بالوقت المستغرق فی أداء الاختبار الورقی.

ورغم تلک الممیزات تواجه الاختبارات الإلکترونیة عدة انتقادات، فبالإضافة للشک السائد فی مصداقیتها، یرى بعض المربون أن تقدیم الاختبار إلکترونیاً یمثل عبئاً معرفیاً على الممتحن، مما یؤثر على أدائه فی الاختبار، بینما بینت دراسة Prisacari & Danielson (2017) أن عدم وجود فرق معنوی فی العبء المعرفی الذی ینتج عن الاختبارات یرجع إلى طریقة تقدیمه (إلکترونیاً أو ورقیاً)، وأن الاختبار الإلکترونی یمکن تنفیذه فی البیئات التعلیمیة دون أن یمثل ذلک عبئاً معرفیاً على الممتحنین.

وتعد الاختبارات التحصیلیة من أهم أدوات التقییم فی النظام التعلیمی؛ لما تتمتع به من موضوعیة، ویتوقف نجاح الاختبار التحصیلی فی تحقیق الهدف منه على خصائصه السیکومتریة. وتشمل الخصائص السیکومتریة للاختبار تلک المعلومات المتعلقة بصدقه وثباته، ویشیر المفهوم الإحصائی لثبات الاختبار إلى نسبة التباین الحقیقی إلى التباین الکلی سواء کان مرتبطاً بالسمة المقیسة أو لا یرتبط بها، بینما یشیر مفهوم الصدق إلى نسبة التباین الحقیقی المرتبط أو المنسوب للسمة المقاسة إلى التباین الکلی (عودة، 2010: 334- 336). ویقصد بثبات الاختبار مدى الاتساق والدقة فی نتائجه، أما الدقة فتعنی خلو الدرجة المقدرة على الاختبار من مصادر الخطأ، وأما الاتساق فیعنی الاستقرار فی علامات الفرد إذا أخذ الاختبار نفسه عدة مرات فی نفس الظروف.

ومع تعدد طرق حساب ثبات الاختبار، تم اختیار ثبات الاتساق الداخلی للاختبار فی هذا البحث؛ نظراً لمناسبته للاختبارات التحصیلیة، وتغلبه على مشکلات التذکر فی طریقة إعادة التطبیق، وتأثیر الملل والإرهاق على الأداء فی طریقة الصور المتکافئة. ویعبر هذا النوع من الثبات عن تجانس الاختبار، وما إذا کانت تشترک مفرداته المختلفة فی قیاس السمة نفسها، ویقاس بعدة طرق: کمعامل الارتباط بین المفردة والدرجة الکلیة للمقیاس، والتجزئة النصفیة، ومعامل ألفا کرونباخ، ومعامل کیودر- ریتشاردسون. وتستخدم  طریقة معامل الارتباط بین المفردة والدرجة الکلیة للاختبار عندما نهدف إلى تحدید المفردات التی تتنبأ بالدرجة الکلیة للاختبار بشکل أفضل؛ بهدف تقلیص طول الاختبار لأسباب متعلقة بالزمن المتاح للتطبیق، حیث یتم حساب معاملات الارتباط بین درجات المفحوصین على المفردة والدرجة الکلیة على الاختبار بعد استبعاد هذه المفردة. أما فی طریقة التجزئة النصفیة فیتم حساب معامل الارتباط بین درجات الممتحنین على نصفی الاختبار، ومن عیوب هذه الطریقة أن معامل الثبات الناتج یکون منخفضاً نتیجة التجزئة. أما فی کل من طریقة ألفا کرونباخ وطریقة کیودر - ریتشاردسون فیتم حساب متوسط جمیع معاملات ثبات التجزئة النصفیة الممکنة للاختبار، ومن ممیزات هذه الطرق إمکانیة تحدید المفردات التی تؤدی إلى انخفاض الاتساق الداخلی للاختبار، ویعتمد تفسیر قیمة معامل ألفا کرونباخ على عدد المفردات، فکلما زاد طول الاختبار احتجنا قیمة أعلى لألفا کرونباخ کدلیل على ثباته، ومن ناحیة أخرى فإن ارتفاع قیمة ألفا کرونباخ إلى 0.9 یعد مؤشراً لتکرار المفردات، أو بمعنى آخر عدم استقلالیة مفردات الاختبارات. (Todd & Bradely, 2001: 29- 30)

ویرتبط صدق الاختبار بثباته، فلکی یکون الاختبار صادقاً یجب أن یکون ثابتاً، والعکس لیس صحیحاً دوماً؛ فالاختبار الثابت لیس بالضرورة أن یکون صادقاً، فقد یکون الاختبار ثابتاً بینما لا یقیس ما یدعی قیاسه. وهناک علاقة بین صدق المحتوى والاتساق الداخلی للاختبار، فالاختبار ذو الاتساق الداخلی المرتفع قد یعانی من الإطناب فی مفرداته، وقد یشیر ذلک إلى عدم تمثیل المفردات جمیع الجوانب المختلفة للسمة، لذا یجب أن تتراوح القیم المقبولة لمعامل ألفا کرونباخ بین 0.7 إلى 0.8 (Todd & Bradely, 2001: 34). ومع تنوع طرق حساب صدق الاختبارات، فإن طریقة صدق المحتوى تعد الأنسب للتحقق من صدق الاختبارات التحصیلیة؛ حیث یتم فیها مراجعة مفردات الاختبار، والتأکد من تمثیلها للمحتوى المستهدف بالقیاس، ومطابقتها للأهداف السلوکیة المقاسة. کما یمکن استخدام طریقة الصدق المرتبط بمحک، التی تعتمد على التحقق من صدق الاختبار من خلال حساب الارتباط بین نتائج الاختبار ونتائج اختبار آخر یقیس نفس السمة، وینقسم الصدق المرتبط بمحک إلى نوعین: الأول هو الصدق التنبؤی، وذلک عندما یکون المحک هو أداء الممتحنین فی مهام مستقبلیة مرتبطة بالسمة التی یقیسها الاختبار، والثانی هو الصدق التلازمی، وذلک عندما یکون المحک هو أداء الممتحنین على مهام آنیة مرتبطة بالسمة التی یقیسها الاختبار. وقد استخدام البحث طریقة صدق المحتوى للتحقق من صدق الاختبار المستخدم وتمثیله للمحتوى المستهدف بالقیاس، واستخدام طریقة الصدق التلازمی لدراسة تأثیر طریقة تطبیق الاختبار على صدقه.

أهم الدراسات السابقة:

  شغلت الاختبارات الإلکترونیة اهتمام العدید من الباحثین، وتنوع مجال ذلک الاهتمام کماً وکیفاً، فاهتمت معظم الدراسات بمقارنة أداء الممتحنین بین الاختبارات الإلکترونیة والاختبارات الورقیة، ومن هذه الدراسات دراسةOzalp & Cagiltay (2010) التی هدفت إلى بحث تأثیر طریقة تقدیم الاختبار (إلکترونیاً / ورقیاً) على أداء الطلبة فی اختبارات مقرر الکیمیاء، وبینت النتائج عدم وجود فرق معنوی بین أداء الطلبة على الاختبارات الورقیة والاختبارات الإلکترونیة. وتتفق نتائج هذه الدراسة مع دراسة Anakwe (2008) التی هدفت إلى بحث تأثیر طریقة تقدیم الاختبار (إلکترونیاً / ورقیاً ) على أداء الطلبة فی اختبارات مقرر المحاسبة. کما قامت دراسة (Wang, et al. 2008) بعمل تحلیل بعدی لنتائج الدراسات التی اهتمت بمقارنة أداء الطلاب فی اختبارات القراءة من مرحلة ریاض الأطفال حتى الصف الثانی عشر فی الولایات المتحدة الأمریکیة على کل من الاختبارات الإلکترونیة والاختبارات الورقیة، وکشفت الدراسة أنه لم یکن لطریقة تقدیم الاختبار (إلکترونیاً / ورقیاً) أی تأثیر ذی دلالة إحصائیة فی أداء الممتحنین فی اختبار تحصیل القراءة فی هذه المرحلة.

کما هدفت دراسة Maguire, et al.,2010)) إلى مقارنة أداء مجموعتین من الطلاب على الاختبارات الإلکترونیة والاختبارات الورقیة، وأشارت النتائج إلى أن الطلاب الذین أکملوا جمیع التقییمات إلکترونیاً کان أداؤهم أعلى بکثیر من أداء الطلاب الذین استکملوا جمیع التقییمات ورقیاً. أما بالنسبة للطلاب ذوی صعوبات التعلم، فقد بینت نتائج دراسة      (Flowers, et al., 2011) أن أداء هؤلاء الطلاب کان مرتفعاً بشکل دال فی حال أخذ الاختبار ورقیاً.

وهدفت دراسة الخزى والزکری (2011) إلى اختبار تکافؤ الاختبارات الإلکترونیة والاختبارات الورقیة فی قیاس التحصیل الجامعی، وأثر تناول الاختبار إلکترونیاً على الاتجاه نحو الاختبارات الإلکترونیة، وقد بینت النتائج تکافؤ الاختبارات الإلکترونیة والورقیة فی قیاس التحصیل الدراسی، مع وجود فروق ذات دلالة إحصائیة فی الوقت اللازم لأداء الاختبارات لصالح الاختبارات الإلکترونیة، وتحسن اتجاه الطلاب نحو الاختبارات الإلکترونیة بعد خبرتهم بها. کما توصلت دراسة Piaw (2012) إلى عدم وجود فروق دالة بین درجات المفحوصین فی اختبار للدافعیة وآخر للتحصیل ترجع إلى طریقة تقدیم الاختبار ورقیاً                 أو إلکترونیاً.

واهتمت فئة أخرى من الدراسات بالجانب التقنی والفنی للاختبارات الإلکترونیة، حیث هدفت دراسة هنداوی (2010) إلى بحث أثر ثلاث طرق لتصمیم الاستجابة فی الاختبارات الإلکترونیة (استجابة النقطة النشطة، استجابة إدخال النص، استجابة المنطقة المستهدفة) على معدل الأداء الفوری والمؤجل، وتوصلت الدراسة إلى عدم وجود فروق بین التصمیمات الثلاث فی الأداء الفوری، بینما کان تصمیم استجابة المنطقة المستهدفة أکثر فاعلیة من التصمیمین الآخرین فی الأداء المؤجل، ومن النتائج المثیرة للاهتمام فی هذه الدراسة إمکانیة التحکم فی خصائص المفردات وتصمیم الاستجابة فی الاختبار الإلکترونی؛ لزیادة تفاعل الممتحن مع المفردات أثناء الاستجابة وتقدیم التغذیة الفوریة؛ مما یزید من بقاء التعلم فی الذاکرة، وینقل مکانة الاختبار فی العملیة التعلیمیة من مجرد أداة للقیاس إلى أداة للتعلم.

کما هدفت دراسة بدوی (2014) إلى دراسة فاعلیة برنامج مقترح فی التعلیم الإلکترونی لتنمیة مهارات تصمیم الاختبارات الإلکترونیة والاتجاه نحو التقویم الإلکترونی لدی طلاب الدراسات العلیا، وتوصلت الدراسة إلى فاعلیة البرنامج المقترح کما ظهر ذلک من خلال تطور کل من الأداء العملی والتحصیلی فی کفایة مهارات تصمیم وإنتاج الاختبارات الإلکترونیة، وکذلک تحسن اتجاه العینة نحو التقویم الإلکترونی.

وهدفت دراسة آل ملوذ والشربینی (2015) إلى محاولة التعرف على مدى تحقق معاییر الجودة فی الاختبارات الإلکترونیة من منظور أعضاء هیئـة التـدریس والطالبـات فی جامعـة الملـک خالد، وأوصت الدراسة بوضع لائحة تتـضمن ضـوابط إجـراء الاختبـارات الإلکترونیـة ومعـاییر جـودتها، ورفع الکفاءة المهنیة لأعضاء هیئة التـدریس فی إعـدادها، وإنشاء لجنة للاختبارات والتقویم الإلکترونی بجمیع کلیات الجامعة، تکون مهمتها: فحص الاختبارات الإلکترونیة، وتقییم مدى تضمنها معاییر الجودة، وتصمیم اختبارات إلکترونیة توجه الطالب نحو التعلم وتکشف عـن  إبداعاته، وتفعیل الأنشطة الإلکترونیة لتقویم الطلاب بشکل مستمر.

کما هدفت دراسة آل جدیع (2017) إلى الکشف عن اتجاهات أعضاء هیئة التدریس فی جامعة تبوک نحو تطبیق نظام الاختبـارات الإلکترونیـة، ومعرفة المعوقات التی تحول بین عضو هیئة التدریس وتطبیق هذا النوع من الاختبارات، وأشارت نتائج هذه الدراسة إلى وجود اتجاهات إیجابیة لدى أعضاء هیئة التدریس نحو نظام الاختبارات الإلکترونیة، حیث أکد أعضاء هیئة التدریس أن هـذا النـوع مـن الاختبـارات یوفر علیهم الوقت والجهد والمال، إلا أن هناک بعض المعوقات التی تحول دون التوسع فی استخدام هذا النوع                  من الاختبارات.

کما اهتمت فئة أخرى من الدراسات بدراسة تأثیر عدة عوامل مختلفة على الأداء فی الاختبارات الإلکترونیة، فتناولت دراسة الخزی (2010) أثر قلق الاختبار والجنس وتخصص الطلاب وخبرتهم فی استخدام الحاسوب على أدائهم فی الاختبارات الإلکترونیة، وتوصلت الدراسة إلى أن التخصص یؤثر على أداء الطلاب فی الاختبارات الإلکترونیة، وأن هناک علاقة ارتباط عکسیة بین خبرة الطلاب بالحاسوب وقلق الاختبار الإلکترونی، وأوصت الدراسة بتعمیم الثقافة التکنولوجیة فی مجال التقویم.

وقامت دراسة Prisacari & Danielson (2017) بدراسة تأثیر طریقة تقدیم الاختبار على العبء المعرفی الناتج عن أداء الاختبار، وأوضحت النتائج عدم وجود فروق فی العبء المعرفی لأداء الاختبار ترجع لطریقة تقدیمه. 

ومن الدراسات التی اهتمت بمقارنة الخصائص السیکومتریة للاختبارات الإلکترونیة والاختبارات الورقیة دراسة Retnawati (2010) حیث هدفت إلى مقارنة دقة درجات اختبار الکفاءة فی اللغة الإنجلیزیة عند تقدیمه ورقیاً PPT وعند تقدیمه إلکترونیاً CPT، فتم حساب ثبات درجات الاختبار بناء على النظریة الکلاسیکیة فی القیاس، وحساب دالة معلومات الاختبار بناء على النظریة الحدیثة، وتوصلت الدراسة إلى تشابه تقدیرات الثبات للاختبارات الورقیة والإلکترونیة، وکذلک تشابه دالة المعلومات للعدید من الاختبارات الفرعیة للاختبار، إلا أن تقدیر دالة المعلومات کانت أفضل فی الاختبارات الإلکترونیة بالنسبة للمستوى المتوسط من القدرة، وکانت دالة المعلومات أفضل فی الاختبارات الورقیة بالنسبة للمستویات المتطرفة من القدرة (Retnawati,2010: 135). واتفقت مع نتائج هذه الدراسة دراسة المومنی (2012) التی قارنت بین معاملات صدق الاختبار وثباته عند تقدیمه ورقیاً وإلکترونیاً، حیث تم تقدیم اختبار للغة الإنجلیزیة للصف الخامس الابتدائی بثلاث طرق مختلفة هی: الطریقة الورقیة والطریقة الإلکترونیة مع ثبات ترتیب الفقرات بالنسبة للممتحنین، والطریقة الإلکترونیة مع اختلاف ترتیب الفقرات بالنسبة للممتحنین، وتوصلت الدراسة إلى عدم وجود فروق ذات دلالة إحصائیة فی دالة المعلومات التی یقدمها الاختبار أو معاملات الثبات ترجع لطریقة تقدیمه، بینما کانت هناک فروق بین مستویات القدرة لصالح الطریقة الثالثة، وتتعارض نتائج هذه الدراسة مع دراسة حجازی والشریف(2016) التی هدفت إلى تقصی الخصائص السیکومتریة لاختبار تحصیلی فی الریاضیات بصورتیه الورقیة والإلکترونیة، حیث أشارت النتائج إلى وجود فرق ذی دلالة إحصائیة بین معاملی الصدق المحکی للاختبار لصالح الصورة الورقیة، بینما لا توجد فروق ذات دلالة إحصائیة بین معاملات ثبات الاختبار عند تقدیمه ورقیاً أو إلکترونیاً.

یتضح من خلال الدراسات السابقة اهتمام معظمها بمقارنة الأداء فی الاختبارات الإلکترونیة والورقیة، وأن هناک ندرة فی الدراسات التی قارنت الخصائص السیکومتریة للاختبارات الورقیة والاختبارات الإلکترونیة، مع وجود تعارض فی نتائج هذه الدراسات.

إجراءات البحث:

عینة البحث:

تکونت عینة الدراسة من (83) طالبة، هن مجموع الطالبات المسجلات فی ثلاث شعب لمقرر "مهارات التفکیر" بالفصل الدراسی الأول 2017 م، ویبین الجدول التالی توزیع أفراد العینة طبقاً لطریقة تقدیم الاختبار، ونظراً لأن الخصائص السیکومتریة للمفردات تتأثر بخصائص عینة الممتحنین، فقد تم اختیار ثلاث مجموعات متکافئة من الطالبات، وتم التحقق من التکافؤ بإجراء البدیل اللابارامتری لاختبار تحلیل التباین الأحادی، وهو اختبار کروسکال ویلز؛ وذلک لقیاس دلالة الفروق بین المجموعات فی التحصیل العام، کما یقاس بالمعدل العام للتحصیل GPA . ویتضح من الجدول التالی عدم وجود فروق ذات دلالة إحصائیة بین المجموعات الثلاث فی معدل التحصیل العام، مما یدل على تکافؤ المجموعات.

جدول (1)

نتائج اختبار کروسکال ویلز لدلالة الفروق بین المجموعات فی المعدل العام للتحصیل

المجموعة

طریقة تقدیم الاختبار

حجم العینة

متوسط الرتب

کا2

مستوى الدلالة

الأولى

إلکترونیاً أثناء المحاضرة

23

43.83

 

0.333

 

 

0.847

 

الثانیة

إلکترونیاً عن بعد

29

42.07

الثالثة

ورقیاً

31

40.24

منهج البحث:

للإجابة عن أسئلة البحث تم استخدام المنهج التجریبی، حیث تم اختیار ثلاث مجموعات من الطالبات اللاتی یدرسن المقرر، وتم إعداد اختبار تکوینی موحد یقیس التحصیل فی مقرر مهارات التفکیر، وتم تقدیم الاختبار للمجموعة الأولى إلکترونیاً أثناء المحاضرة، وأخذت المجموعة الثانیة الاختبار إلکترونیاً عن بعد، وأخذت الثالثة                      الاختبار ورقیاً.

أداة البحث:

تتمثل أداة البحث فی اختبار تحصیلی تکوینی فی مقرر مهارات التفکیر. تم إعداد الاختبار من خلال الخطوات التالیة:

  1. تحدید الغرض من الاختبار: التقویم التکوینی لتحصیل الطالبات فی مقرر مهارات التفکیر.
  2. تحدید مجال الاختبار: یغطى الاختبار موضوعات (التفکیر الناقد / التفکیر الإبداعی / استراتیجیة حل المشکلات / استراتیجیة اتخاذ القرار / عوامل نجاح تعلیم التفکیر).
  3. إعداد جدول مواصفات الاختبار: حیث تم تحدید الوزن النسبی لکل موضوع بناءً على الزمن المستغرق فی التدریس، وتم تحدید الأهمیة النسبیة لمستویات الأهداف بناءً على نواتج التعلم، وقد اقتصرت المفردات على قیاس الأهداف من مستویات التذکر والفهم والتطبیق والتحلیل، التی اختلفت أوزانها النسبیة تبعاً لکل موضوع من موضوعات المحتوى. ویوضح الجدول التالی جدول مواصفات الاختبار التکوینی المستخدم.

جدول (2)

جدول مواصفات الاختبار التحصیلی

المحتوى

التذکر

الفهم

التطبیق

التحلیل

المجموع

مهارات التفکیر الناقد      (30%)

-

(10%)

مفردتان

 (10%)

مفردتان

(10%)

مفردتان

 (30%)

6 مفردات

مهارات التفکیر الإبداعی   (30%)

-

(10%)

مفردتان

 (10%)

مفردتان

(10%)

مفردتان

 (30%)

6 مفردات

استراتیجیة حل المشکلات  (15%)

(5%)

مفردة

 (5%)

مفردة

(5%)

مفردة

-

(15%)

3 مفردات

استراتیجیة اتخاذ القرار     (15%)

(5%)

مفردة

 (5%)

مفردة

(5%)

مفردة

-

(15%)

 3 مفردات

عوامل نجاح تعلیم التفکیر  (10%)

-

-

(10%)

مفردتان

-

(10%)

مفردتان

المجموع

 (10 %)

مفردتان

 (30 %)

6 مفردات

 (40 %)

8 مفردات

 (20 %)

4 مفردات

 (100 %)

20 مفردة

  1. کتابة مفردات الاختبار: تم کتابة (20) مفردة من نوع الاختیار من متعدد، مع مراعاة شروط الصیاغة الجیدة.
  2. التحقق من صدق محتوى الاختبار: تم التحقق من صدق محتوى الاختبار بمراجعة ثلاثة من أعضاء هیئة التدریس لجدول المواصفات، والحکم على مدى مطابقة المفردات للأهداف المستهدفة بالقیاس، ومراجعة المفردات، والتأکد من توفر شروط الصیاغة الجیدة لمفردات الاختیار من متعدد.
  3. إخراج الاختبار: تم إخراج الاختبار فی ثلاث صور:

أولاً: الصورة الإلکترونیة باستخدام نظام البلاک بورد أثناء المحاضرة. وتم تحدید خیارات التقدیم التی تناسب أداء الاختبار أثناء المحاضرة، وهی:

أ ـ  إظهار البدائل بترتیب عشوائی.

ب ـ فرض الإکمال: أی ینبغی على المتعلم إنهاء الاختبار فی جلسة واحدة وإرساله، ولا یسمح له بإعادة المحاولة.

ج ـ تعیین مؤقت، وهو 25 دقیقة.

د ـ تقدیم کل المفردات فی وقت واحد، أی تظهر جمیع الأسئلة للممتحن على شاشة الحاسوب مرة واحدة مما یسمح له بالتنقل بین الأسئلة واختیار نقطة البدایة                    ومراجعة الإجابات.

ه ـ ترتیب عشوائی للمفردات؛ فلا تظهر المفردات بالترتیب نفسه لدى جمیع الممتحنین.

ثانیاً: الصورة الإلکترونیة باستخدام نظام البلاک بورد عن بعد. وتم تحدید خیارات التقدیم التی تناسب أداء الاختبار عن بعد خارج وقت المحاضرة، حیث تم تحدید خیارات أکثر تقییداً ، وتمثلت هذه الخیارات فیما یلی:

أ ـ  إظهار البدائل بترتیب عشوائی.

ب ـ فرض الإکمال: أی ینبغی على المتعلم إنهاء الاختبار فی جلسة واحدة وإرساله، ولا یسمح له بإعادة المحاولة.

ج ـ تعیین مؤقت، وهو 25 دقیقة.

د ـ تقدیم کل مفردة على حدة، وحظر الرجوع، أی یظهر للممتحن على شاشة الحاسوب مفردة واحدة فی کل مرة، وعلیه إرسال الإجابة عن المفردة لتظهر المفردة التالیة، ولا یُسمح للممتحن بالرجوع إلى المفردة السابقة مرة أخرى.

ه ـ ترتیب عشوائی للمفردات؛ فلا تظهر المفردات بالترتیب نفسه لدى جمیع الممتحنین؛ مما یقلل فرص العش.

ثالثاً: الصورة الورقیة. وتم توزیع موقع البدیل الصحیح فی کل مفردة بشکل متساوٍ على مفردات الاختبار، مع کتابة تعلیمات الاختبار بشکل واضح.

تطبیق الأدوات: تم تطبیق الاختبار بصوره الثلاثة: الإلکترونیة أثناء المحاضرة، والإلکترونیة عن بعد، والورقیة، فی الموعد المحدد للاختبار الفصلی فی الخطة الدراسیة للمقرر.

أسالیب المعالجة الإحصائیة المستخدمة: (وقد تم إجراء جمیع الأسالیب بالاستعانة ببرنامج SPSS)

  1. اختبار کروسکال ویلز للمقارنة بین متوسطات رتب المجموعات فی معدل                  التحصیل العام.
  2. معامل الارتباط الثنائی المتسلسل لحساب معاملات تمییز مفردات الاختبار فی الطرق الثلاث لتقدیم الاختبار.
  3. معادلة کرونباخ ألفا لحساب معامل ثبات الاختبار.
  4. معادلة سبیرمان - براون لحساب معامل ثبات التجزئة النصفیة للاختبار.
  5. معامل ارتباط سبیرمان لحساب معامل الصدق التلازمی للاختبار فی الطرق الثلاث لتقدیم الاختبار.
  6. اختبار فریدمان لاختبار دلالة الفروق بین متوسطات رتب کل من:
  • معاملات صعوبة المفردات المحسوبة فی کل طریقة من طرق تقدیم الاختبار.
  • معاملات تمییز المفردات المحسوبة فی کل طریقة من طرق تقدیم الاختبار.

نتائج البحث:

الفرض الأول: "لا توجد فروق ذات دلالة إحصائیة عند مستوى دلالة ( α ≤ 0.05) بین معاملات صعوبة مفردات الاختبار التحصیلی عند تقدیمه إلکترونیاً أثناء المحاضرة وتقدیمه إلکترونیاً عن بعد، وتقدیمه ورقیاً". لاختبار هذا الفرض تم حساب معاملات صعوبة المفردات عند تقدیم الاختبار إلکترونیاً أثناء المحاضرة، وعند تقدیمه إلکترونیاً عن بعد، وعند تقدیمه ورقیاً، کما هو موضح فی جدول رقم (3)، ثم تم حساب دلالة الفروق بین متوسطات رتب معاملات الصعوبة الناتجة باستخدام اختبار فریدمان Friedman Test، کما هو موضح فی جدول رقم (4).

جدول (3)

معاملات الصعوبة تبعاً لطریقة تقدیم الاختبار

ورقیاً

إلکترونیاً

عن بعد

إلکترونیاً

أثناء المحاضرة

 

المفردة

ورقیاً

إلکترونیاً

عن بعد

إلکترونیاً

أثناء المحاضرة

 

المفردة

0.87

0.89

0.87

Item 11

0.81

0.89

0.74

Item 1

0.9

0.89

0.83

Item 12

0.87

0.93

0.83

Item 2

0.81

0.79

0.78

Item 13

0.81

0.89

0.78

Item 3

0.65

0.93

0.83

Item 14

0.9

0.96

0.87

Item 4

0.71

0.93

0.78

Item 15

0.84

0.93

0.87

Item 5

0.68

1

0.87

Item 16

0.74

1

0.87

Item 6

0.87

0.89

0.74

Item 17

0.68

0.82

0.48

Item 7

0.39

0.5

0.35

Item 18

0.52

0.79

0.26

Item 8

0.68

0.86

0.78

Item 19

0.74

0.82

0.48

Item 9

0.87

0.5

0.87

Item 20

0.81

0.89

0.74

Item 10

 

 

شکل (1) توزیع معاملات الصعوبة عند تقدیم الاختبار بالطرق الثلاث

وتراوحت معاملات الصعوبة بین (0.26) و (0.87) عند تقدیمه إلکترونیاً أثناء المحاضرة، وبین (0.5) و (1) عند تقدیمه إلکترونیاً عن بعد، وتراوحت بین (0.39)              و (0.90) عند تقدیمه ورقیاً،. ویتضح من الشکل رقم (1) أن معاملات الصعوبة کانت أعلى عند تقدیم الاختبار إلکترونیاً عن بعد.

جدول (4)

نتائج اختبار فریدمان للفروق بین معاملات الصعوبة

کا2

درجات الحریة

عدد المفردات

مستوى الدلالة

18.9

2

20

0.00

وکانت قیمة کا2 دالة عند مستوى (0.01)، أی أنه توجد فروق ذات دلالة إحصائیة بین معاملات صعوبة مفردات الاختبار التحصیلی عند تقدیمه إلکترونیاً أثناء المحاضرة وتقدیمه إلکترونیاً عن بعد، وتقدیمه ورقیاً، ولتحدید مصدر هذه الفروق تم استخدام اختبار ویلکوکسون للفروق بین الرتب Wilcoxon Signed Ranks Test.

جدول (5)

نتائج المقارنات الثنائیة للفروق بین معاملات الصعوبة

 

إلکترونیاً أثناء المحاضرة - إلکترونیاً عن بعد

إلکترونیاً أثناء المحاضرة - ورقیاً

إلکترونیاً عن بعد - ورقیاً

Z

- 3.175

- 1.045

2.987

مستوى الدلالة

0.002

0.296

0.003

یتضح من الجدول السابق عدم وجود فروق ذات دلالة إحصائیة بین معاملات صعوبة المفردات عند تقدیم الاختبار إلکترونیاً أثناء المحاضرة وعند تقدیمه ورقیاً، بینما هناک فروق ذات دلالة إحصائیة عند مستوى دلالة ( α ≤ 0.05) بین معاملات صعوبة المفردات عند تقدیم الاختبار إلکترونیاً أثناء المحاضرة وعند تقدیمه إلکترونیاً عن بعد. وهناک فروق ذات دلالة إحصائیة عند مستوى دلالة ( α ≤ 0.05) بین معاملات صعوبة المفردات عند تقدیم الاختبار ورقیاً وعند تقدیمه إلکترونیاً عن بعد. ومن ثم فقد کانت معاملات صعوبة المفردات أکبر عند تقدیم الاختبار إلکترونیاً عن بعد مقارنة بمعاملات الصعوبة عند تقدیمه أثناء المحاضرة إلکترونیاً أو ورقیاً، ویمکن تفسیر ذلک اعتماداً على توفر الرقابة على أداء الاختبار أثناء المحاضرة، ومن ذلک نستنتج أن أداء الاختبار التحصیلی عن بعد یترتب علیه ارتفاع فی معاملات الصعوبة، أی زیادة نسبة الممتحنین الذین استطاعوا الإجابة عن المفردة إجابة صحیحة، وقد یرجع ذلک إلى احتمالین: الأول هو انخفاض الرقابة الذاتیة لدى الممتحنین، مما یترتب علیه الاستعانة بمصادر للتعلم أو الاستجابة فی مجموعات على فقرات الاختبار. والثانی هو الفرصة المتاحة للممتحنین فی التحکم فی بیئة الاختبار، وانخفاض معدل                     قلق الاختبار.

الفرض الثانی: "لا توجد فروق ذات دلالة إحصائیة عند مستوى دلالة ( α ≤ 0.05) بین معاملات تمییز صعوبة مفردات الاختبار التحصیلی عند تقدیمه إلکترونیاً أثناء المحاضرة وتقدیمه إلکترونیاً عن بعد، وتقدیمه ورقیاً". لاختبار هذا الفرض تم حساب معامل ارتباط بوبینت بایسیریال بین درجات الممتحنین على المفردة ودرجاتهم الکلیة، کما هو موضح فی جدول (6)، ثم تم حساب دلالة الفروق بین معاملات التمییز باستخدام اختبار فریدمان Friedman Test، کما هو موضح فی جدول رقم (7).

جدول (6)

معاملات التمییز تبعاً لطریقة تقدیم الاختبار

ورقیاً

إلکترونیاً

عن بعد

إلکترونیاً

أثناء المحاضرة

 

المفردة

ورقیاً

إلکترونیاً

عن بعد

إلکترونیاً

أثناء المحاضرة

 

المفردة

0.17

0.39

0.16

Item 11

0.32

0.39

0.38

Item 1

0.01

0.21

0.25

Item 12

0.24

0.24

0.13

Item 2

0.37

0.18

0.56

Item 13

0.46

0.09

0.7

Item 3

0.55

0.24

0.09

Item 14

0.38

0.22

0.34

Item 4

0.28

0.31

0.63

Item 15

0.4

0.24

0.04

Item 5

0.23

0

0.25

Item 16

0.44

0

0.59

Item 6

0.5

0.09

0.62

Item 17

0.58

0.67

0.5

Item 7

0.37

0.68

0.37

Item 18

0.37

0.73

0.21

Item 8

0.46

0.25

0.21

Item 19

0.29

0.77

0.65

Item 9

0.14

-0.49

0.42

Item 20

0.44

0.53

0.15

Item 10

 

شکل (2) توزیع معاملات التمییز عند تقدیم الاختبار بالطرق الثلاث

وقد تراوحت معاملات التمییز بین (0.04) و (0.7) عند تقدیم الاختبار إلکترونیاً أثناء المحاضرة، وبین (-0.49) و (0.77) عند تقدیمه إلکترونیاً عن بعد، ومن (0.01) إلى (0. 58) عند تقدیمه ورقیاً.

جدول (7)

نتائج اختبار فریدمان للفروق بین معاملات التمییز

کا2

درجات الحریة

عدد المفردات

مستوى الدلالة

0.1

2

20

0.951

وکانت قیمة کا2 غیر دالة، إذ إن قیمة الخطأ من النوع الأول بلغت (0.951)، لذا لا یمکن رفض الفرض الصفری، أی أنه لا توجد فروق ذات دلالة إحصائیة بین معاملات تمییز صعوبة مفردات الاختبار التحصیلی عند تقدیمه إلکترونیاً أثناء المحاضرة وتقدیمه إلکترونیاً عن بعد وتقدیمه ورقیاً، ورغم عدم دلالة الفروق بین معاملات التمییز، یلاحظ من الشکل رقم (2) أن المفردات (3، 5، 6، 11، 12، 16، 17، 20) میزت بطریقة مختلفة تماماً؛ نتیجة اختلاف طریقة تقدیم الاختبار. 

الفرض الثالث: "لا تختلف قیمة معامل ثبات الاتساق الداخلی للاختبار التحصیلی عند تقدیمه إلکترونیاً أثناء المحاضرة وتقدیمه إلکترونیاً عن بعد، وتقدیمه ورقیاً". ولاختبار هذا الفرض تم حساب معامل الثبات باستخدام کل من طریقة ألفا کرونباخ والتجزئة النصفیة، وتصحیح المعامل باستخدام معادلة سبیرمان براون، ویوضح جدول (8) قیم معاملات                        الثبات المحسوبة.

جدول (8)

معامل الثبات باستخدام طریقة ألفا کرونباخ تبعاً لطریقة تقدیم الاختبار

طریقة تقدیم الاختبار

إلکترونیاً أثناء المحاضرة

إلکترونیاً عن بعد

ورقیاً

قیمة ألفا کرونباخ

0.669

0.442

0.638

قیمة معامل ثبات التجزئة النصفیة

0.471

0.164

0.570

عدد الممتحنین

23

29

31

یتضح من الجدول السابق أن أقصى قیمة لألفا کرونباخ (0.669) تم الحصول علیها عند تقدیم الاختبار إلکترونیاً أثناء المحاضرة، وأن أدنى قیمة لألفا کرونباخ (0.442) تم الحصول علیها عند تقدیم الاختبار إلکترونیاً عن بعد، وأن قیمة ألفا کرونباخ عند تقدیم الاختبار ورقیاً بلغت (0.638)، وهی قریبة جداً من قیمتها فی حالة تقدیم الاختبار إلکترونیاً أثناء المحاضرة، وأن أقصى قیمة لمعامل ثبات التجزئة النصفیة (0.570) تم الحصول علیها عند تقدیم الاختبار ورقیاً، وأن أدنى قیمة لمعامل ثبات التجزئة النصفیة (0.164) تم الحصول علیها عند تقدیم الاختبار إلکترونیاً عن بعد، وأن قیمة معامل ثبات التجزئة النصفیة عند تقدیم الاختبار إلکترونیاً أثناء المحاضرة (0.471) کانت قریبة من قیمتها فی حالة تقدیم                الاختبار ورقیاً.

ویمکن تفسیر انخفاض ثبات الاختبار عند تقدیمه إلکترونیاً عن بعد فی ضوء معاملات الصعوبة؛ حیث تؤثر صعوبة المفردات فی قیم معاملات الثبات، فیزید معامل الثبات کلما اقتربت قیم معاملات الصعوبة من (0.5)، وعندما یتکون الاختبار من مجموعة مفردات متطرفة الصعوبة یقل تباین درجات الممتحنین على الاختبار، مما ینعکس سلباً على معامل الثبات، فعندما تکون مجموعة المفردات ذات معامل صعوبة مرتفع ینجح معظم الممتحنین فی الإجابة عنها، وعندما تکون مجموعة المفردات ذات معامل صعوبة منخفض یفشل معظم الممتحنین فی الإجابة عنها، وفی کلتا الحالتین لا ینجح الاختبار فی الکشف عن الفروق بین الأفراد فی السمة المقاسة، ویقل تباین الدرجات، وبالتالی ینخفض معامل الثبات.

کما أن معامل ثبات التجزئة النصفیة کان متشابهاً عند تقدیم الاختبار ورقیاً وعند تقدیمه إلکترونیاً أثناء المحاضرة، وقد ترجع الزیادة الطفیفة فی قیمة معامل ثبات التجزئة النصفیة عند تقدیم الاختبار ورقیاً إلى زیادة عدد الممتحنین الذین أخذوا الاختبار ورقیاً، فکلما زاد حجم العینة ارتفع معامل الثبات.

الفرض الرابع "لا تختلف قیمة معامل الصدق التلازمی للاختبار التحصیلی عند تقدیمه إلکترونیاً أثناء المحاضرة وتقدیمه إلکترونیاً عن بعد، وتقدیمه ورقیاً". لاختبار هذا الفرض تم حساب معامل ارتباط سبیرمان بین درجات المجموعات على الاختبار الفصلی ودرجاتهم على الاختبار النهائی، حیث تم استخدام الاختبار النهائی کمحک. وذلک نظراً لعدم تحقق شرط اعتدالیة توزیع الدرجات؛ حیث کان توزیع الدرجات سالب الالتواء، وهذا یتسق مع نتائج الاختبارات التحصیلیة فی البرامج المعتمدة؛ حیث یتوقع أن یحقق غالبیة المتعلمین نواتج التعلم. ویوضح جدول (10) معاملات الصدق التلازمی للاختبار المقابلة للطرق الثلاث لتقدیمه، کما یعبر عنها معامل ارتباط سبیرمان.

جدول (10)

معامل الصدق التلازمی للاختبار تبعاً لطریقة تقدیمه

طریقة تقدیم الاختبار

إلکترونیاً أثناء المحاضرة

إلکترونیاً عن بعد

ورقیاً

معامل الصدق التلازمی

0.791**

0.247

0.670**

مستوى الدلالة

0.00

0.197

0.00

عدد الممتحنین

23

29

31

یتضح من الجدول السابق أن معامل الصدق التلازمی للاختبار کان دالا ًإحصائیاً عند مستوى دلالة (0.01) عند تقدیم الاختبار إلکترونیاً أثناء المحاضرة أو ورقیاً، مع الأفضلیة عند تقدیمه إلکترونیاً أثناء المحاضرة (0.791)، بینما کان معامل الصدق التلازمی للاختبار ضعیفاً وغیر دال عند تقدیمه إلکترونیاً عن بعد (0.247)، مما یعد مؤشراً على تدنی مصداقیة الاختبارات التحصیلیة عند تقدیمها إلکترونیاً عن بعد، وتتسق تلک النتیجة مع ارتفاع معاملات صعوبة المفردات حال تقدیم الاختبار إلکترونیاً عن بعد، مما یدل على أن تقیید أداء الاختبار بعامل الوقت وتوزیع کل من المفردات والبدائل بشکل عشوائی وحظر الرجوع للمفردات لا یکفی لتحقیق مصداقیة الاختبار التحصیلی عند تقدیمه إلکترونیاً عن بعد.

مناقشة النتائج والتوصیات:

تتسق نتائج البحث الحالی فی الجزء الخاص بتقدیم الاختبار إلکترونیاً أثناء المحاضرة وورقیاً مع نتائج دراسة Retnawati (2010) ودراسة المومنی (2012) اللتین أشارتا إلى تشابه تقدیرات الصدق والثبات للاختبارات الورقیة والإلکترونیة. بینما تتعارض مع دراسة حجازی والشریف (2016) فیما یتعلق بوجود فرق ذی دلالة إحصائیة بین معاملی الصدق المحکی للاختبار لصالح الصورة الورقیة، وتتفق معها فیما یتعلق بعدم دلالة الفروق بین معاملات تمییز مفردات الاختبار عند تقدیمه ورقیاً أو إلکترونیاً. ولم تتناول أی دراسة سابقة - فی حدود علم الباحثة - الخصائص السیکومتریة للاختبارات الإلکترونیة عند تقدیمها                عن بعد.

ویوصی البحث المعلمین باستخدام الاختبارات الإلکترونیة، والاستفادة من مزایاها، على أن یتم تقدیم الاختبار فی الصف، مع ضبط بیئة الاختبار بشکل مقنن بالنسبة لجمیع الممتحنین، کما یوصی بعدم الاعتماد على نتائج الاختبارات الإلکترونیة عند تقدیمها عن بعد. ولأن هذه الاختبارات لا غنى عنها فی برامج التعلم عن بعد فإن البحث ینشد من مطوری تقنیات الاختبارات الإلکترونیة إضافة مزید من خیارات ضبط أداء الاختبار الإلکترونی عند تقدیمه عن بعد، کأن یرتبط دخول الممتحن بالبصمة الشخصیة، أو أن یقوم جهاز الحاسوب الذی یقدَّم علیه الاختبار بتسجیل صورة مقدم الاختبار. کما یوصی البحث الحالی بإجراء مزید من الأبحاث التی تتناول نفس المتغیرات عند استخدام أنواع مختلفة من المفردات، وعند قیاس مستویات مختلفة من الأهداف.


المراجع:

  1. آل جدیع، مفلح بن قبلان بن بجاد (2017). اتجاهات أعضاء هیئة التدریس نحو إجراء الاختبارات الإلکترونیة ومعوقات تطبیقها بجامعة تبوک. المجلة الدولیة التربویة المتخصصة، 6 (2)، 77-87.   
  2. آل ملوذ، حصة محمد و الشربینی، غادة حمزة (2015). معاییر جودة الاختبارات الإلکترونیة من وجهة نظر أعضاء هیئة التدریس والطالبات فی جامعة الملک خالد. المجلة الدولیة التربویة المتخصصة، 4 (4 )، 25-42.
  3. بدوی، محمد محمد عبد الهادی (2014). فعالیة برنامج مقترح فی التعلیم الإلکترونی لتنمیة مهارات تصمیم الاختبارات الإلکترونیة. المجلة الدولیة التربویة المتخصصة، 3 (5)، 146-176.
  4. البطاح، عماد رمضان (2007). أثر طریقة اختیار فقرات الاختبار فی خصائصه السیکومتریة (رسالة ماجستیر غیر منشورة). جامعة مؤته، الکرک -الأردن.
  5. البلوی، سالم بن عبد الرحمن (2013). التحقق من فاعلیة برنامج اختباری محوسب فی العملیة الاختباریة. مجلة القراءة والمعرفة -مصر، (138)، 197-214.
  6. التخاینة، بهجت حمد عفنان و أبو موسى، مفید (2009). أثر استخدام استراتیجیة التقویم التکوینی المحوسب فی تحصیل طلبة التربیة فی الجامعة العربیة المفتوحة واتجاهاتهم نحوها. مجلة دراسات فی المناهج وطرق التدریس -مصر، (145)، 116-132.
  7. الحجاج، أیمن عودة (2013). أثر ترتیب الفقرات حسب خصائصها السیکومتریة على أداء الأفراد والخصائص السیکومتریة للاختبار) رسالة ماجستیر غیر منشورة). جامعة مؤتة، الکرک -الأردن.
  8. حجازی، تغرید عبد الرحمن محمد، و الشریف، نایف (2017). الخصائص السیکومتریة لصورتی اختبار فی الریاضیات للمرحلة المتوسطة: دراسة مقارنة. مجلة الدراسات التربویة والنفسیة - سلطنة عمان، 11 (1)، 178-190.
  9. الخزی، فهد عبد الله (2010). أثر قلق الاختبار وبعض المتغیرات الدیموغرافیة على أداء طلبة جامعة الکویت فی الاختبارات الإلکترونیة: دراسة وصفیة ارتباطیة. مجلة جامعة صنعاء للعلوم التربویة والنفسیة –الیمن،               7 (1)، 219-270.
  10. الخزی، فهد عبد الله و الزکری، محمد بن إبراهیم (2011). تکافؤ الاختبارات الإلکترونیة مع الاختبارات الورقیة فی قیاس التحصیل الدراسی: دراسة تجریبیة على طلبة کلیة التربیة بجامعة الکویت.  مجلة دراسات الخلیج والجزیرة العربیة (الکویت)، (143)، 167-198.
  11. الذنیبات، سجى أحمد (2013).  أثر اختلاف نمط الاختبار على الخصائص السیکومتریة للاختبار )رسالة ماجستیر غیر منشورة). جامعة مؤتة، تکریت -الأردن.
  12. شعیب، إیمان محمد مکرم مهنی (2014). أثر برنامج تدریبی مقترح لإکساب أعضاء هیئة التدریس بجامعة حائل مهارات بناء الاختبارات الإلکترونیة بنظام إدارة التعلم بلاک بوردBlackboard . مجلة دراسات عربیة فی التربیة وعلم النفس - السعودیة، (53)، 179-201.
  13. عودة، أحمد سلیمان (2010): القیاس والتقویم فی العملیة التدریسیة، دار الأمل، إربد.
  14. غریب، أحمد محمود فخری (2014). أثر اختلاف أدوات التشارک بالفصول الافتراضیة على إکساب مهارات تصمیم وإنتاج الاختبارات الإلکترونیة. مجلة تکنولوجیا التعلیم -مصر، 24 (1)، 141-188.
  15. المصری، محمد عبد المجید (2002). الاختبارات المکیفة: أنموذج معاصر فی قیاس السمات والخصائص النفسیة والتربویة. مجلة البحوث والدراسات التربویة -الیمن، (16)، 96-112.
  16. معان، عماد ثابت (2012). أثر استخدام الاختبارات الإلکترونیة التشعبیة فی التدریبات الریاضیة على حل المسائل الریاضیة وتخفیف القلق الریاضی لدى تلامیذ التعلیم الإعدادی بسوهاج. المجلة التربویة -مصر،                  (31 (، 43-65.
  17. مندور، إیناس محمد الحسینی (2013). أثر برنامج تدریبی لطلاب الدراسات العلیا بکلیة التربیة فی تصمیم الاختبارات الإلکترونیة وفقاً لمعاییر الجودة المقترحة. مجلة دراسات تربویة واجتماعیة -مصر، 19 (2)،                 391-460.  
  18. المومنی، صبحة أحمد (2012).  أثر طریقة تقدیم اختبار اللغة الإنجلیزیة لدى طلبة الصف الخامس الأساسی على تقدیرات القدرة وخصائص الاختبار وخصائص فقراته السیکومتریة (رسالة ماجستیر غیر منشورة). جامعة الیرموک، إربد.
  19. هنداوی، أسامة سعید علی (2010). أثر ثلاثة تصمیمات لأنماط الاستجابة على الاختبارات الإلکترونیة على معدل الأداء الفوری والمؤجل لطلاب الجامعة فی الاختبار. مجلة العلوم التربویة -مصر، 18 (3)،                 102-143.
    1. Anakwe, B. (2008). Comparison of student performance in paper-based versus computer-based testing. Journal of Education for Business, 84 (1), 13-17.
    2. Flowers, C., Kim, D., Lewis, P., & Davis, V. C. (2011). A comparison of computer-based testing and pencil-and-paper testing for students with a read-aloud accommodation. Journal of Special Education Technology, 26 (1), 1-12.
    3. Hansen, E. G., & Mislevy, R. J. (2005). Accessibility of Computer-Based Testing for Individuals with Disablities and English Language Learners within a Validity Framework. In S. Howell, & M. Hricko (Eds.), Online Assessment and Measurement: Foundations and Challenges, (214-262).
    4. Maguire, K. A., Smith, D. A., Brallier, S. A., & Palm, L. J. (2010). Computer-based testing: A comparison of computer-based and paper-and-pencil assessment. Academy of Educational Leadership Journal, 14 (4), 117.
    5. Ozalp-Yaman, S., & Cagiltay, N. E. (2010). Paper-based versus computer-based testing in engineering education. Paper presented at Education Engineering Conference: (EDUCON). 1631-1637.
    6. Piaw, C. Y. (2012). Replacing paper-based testing with computer-based testing in assessment: Are we doing wrong? Procedia - Social and Behavioral Sciences, 64, 655-664.
    7. Prisacari, A. A., & Danielson, J. (2017). Computer-based versus paper-based testing: Investigating testing mode with cognitive load and scratch paper use. Computers in Human Behavior, 77, 1-10.
    8. Retnawati, H. (2015). The Comparison of Accuracy Scores on the Paper and Pencil Testing vs. Computer-Based Testing.TOJET: The Turkish Online Journal of Educational Technology, 14 (4), 135-142.
    9. Todd, C. & Bradely, C. (2001). Evaluating the design and development of psychological scales (Eds.), Handbook of Psychology and Diabetes: A Guide to Psychological Measurement in diabetes research and practice, (pp.15-42). New York: psychological press.
    10. Wang, S., Jiao, H., Young, M. J., Brooks, T., & Olson, J. (2008). Comparability of computer-based and paper-and-pencil testing in K–12 reading assessments: A meta-analysis of testing mode effects. Educational and Psychological Measurement, 68 (1), 5-24.
  1. آل جدیع، مفلح بن قبلان بن بجاد (2017). اتجاهات أعضاء هیئة التدریس نحو إجراء الاختبارات الإلکترونیة ومعوقات تطبیقها بجامعة تبوک. المجلة الدولیة التربویة المتخصصة، 6 (2)، 77-87.   
  2. آل ملوذ، حصة محمد و الشربینی، غادة حمزة (2015). معاییر جودة الاختبارات الإلکترونیة من وجهة نظر أعضاء هیئة التدریس والطالبات فی جامعة الملک خالد. المجلة الدولیة التربویة المتخصصة، 4 (4 )، 25-42.
  3. بدوی، محمد محمد عبد الهادی (2014). فعالیة برنامج مقترح فی التعلیم الإلکترونی لتنمیة مهارات تصمیم الاختبارات الإلکترونیة. المجلة الدولیة التربویة المتخصصة، 3 (5)، 146-176.
  4. البطاح، عماد رمضان (2007). أثر طریقة اختیار فقرات الاختبار فی خصائصه السیکومتریة (رسالة ماجستیر غیر منشورة). جامعة مؤته، الکرک -الأردن.
  5. البلوی، سالم بن عبد الرحمن (2013). التحقق من فاعلیة برنامج اختباری محوسب فی العملیة الاختباریة. مجلة القراءة والمعرفة -مصر، (138)، 197-214.
  6. التخاینة، بهجت حمد عفنان و أبو موسى، مفید (2009). أثر استخدام استراتیجیة التقویم التکوینی المحوسب فی تحصیل طلبة التربیة فی الجامعة العربیة المفتوحة واتجاهاتهم نحوها. مجلة دراسات فی المناهج وطرق التدریس -مصر، (145)، 116-132.
  7. الحجاج، أیمن عودة (2013). أثر ترتیب الفقرات حسب خصائصها السیکومتریة على أداء الأفراد والخصائص السیکومتریة للاختبار) رسالة ماجستیر غیر منشورة). جامعة مؤتة، الکرک -الأردن.
  8. حجازی، تغرید عبد الرحمن محمد، و الشریف، نایف (2017). الخصائص السیکومتریة لصورتی اختبار فی الریاضیات للمرحلة المتوسطة: دراسة مقارنة. مجلة الدراسات التربویة والنفسیة - سلطنة عمان، 11 (1)، 178-190.
  9. الخزی، فهد عبد الله (2010). أثر قلق الاختبار وبعض المتغیرات الدیموغرافیة على أداء طلبة جامعة الکویت فی الاختبارات الإلکترونیة: دراسة وصفیة ارتباطیة. مجلة جامعة صنعاء للعلوم التربویة والنفسیة –الیمن،               7 (1)، 219-270.
  10. الخزی، فهد عبد الله و الزکری، محمد بن إبراهیم (2011). تکافؤ الاختبارات الإلکترونیة مع الاختبارات الورقیة فی قیاس التحصیل الدراسی: دراسة تجریبیة على طلبة کلیة التربیة بجامعة الکویت.  مجلة دراسات الخلیج والجزیرة العربیة (الکویت)، (143)، 167-198.
  11. الذنیبات، سجى أحمد (2013).  أثر اختلاف نمط الاختبار على الخصائص السیکومتریة للاختبار )رسالة ماجستیر غیر منشورة). جامعة مؤتة، تکریت -الأردن.
  12. شعیب، إیمان محمد مکرم مهنی (2014). أثر برنامج تدریبی مقترح لإکساب أعضاء هیئة التدریس بجامعة حائل مهارات بناء الاختبارات الإلکترونیة بنظام إدارة التعلم بلاک بوردBlackboard . مجلة دراسات عربیة فی التربیة وعلم النفس - السعودیة، (53)، 179-201.
  13. عودة، أحمد سلیمان (2010): القیاس والتقویم فی العملیة التدریسیة، دار الأمل، إربد.
  14. غریب، أحمد محمود فخری (2014). أثر اختلاف أدوات التشارک بالفصول الافتراضیة على إکساب مهارات تصمیم وإنتاج الاختبارات الإلکترونیة. مجلة تکنولوجیا التعلیم -مصر، 24 (1)، 141-188.
  15. المصری، محمد عبد المجید (2002). الاختبارات المکیفة: أنموذج معاصر فی قیاس السمات والخصائص النفسیة والتربویة. مجلة البحوث والدراسات التربویة -الیمن، (16)، 96-112.
  16. معان، عماد ثابت (2012). أثر استخدام الاختبارات الإلکترونیة التشعبیة فی التدریبات الریاضیة على حل المسائل الریاضیة وتخفیف القلق الریاضی لدى تلامیذ التعلیم الإعدادی بسوهاج. المجلة التربویة -مصر،                  (31 (، 43-65.
  17. مندور، إیناس محمد الحسینی (2013). أثر برنامج تدریبی لطلاب الدراسات العلیا بکلیة التربیة فی تصمیم الاختبارات الإلکترونیة وفقاً لمعاییر الجودة المقترحة. مجلة دراسات تربویة واجتماعیة -مصر، 19 (2)،                 391-460.  
  18. المومنی، صبحة أحمد (2012).  أثر طریقة تقدیم اختبار اللغة الإنجلیزیة لدى طلبة الصف الخامس الأساسی على تقدیرات القدرة وخصائص الاختبار وخصائص فقراته السیکومتریة (رسالة ماجستیر غیر منشورة). جامعة الیرموک، إربد.
  19. هنداوی، أسامة سعید علی (2010). أثر ثلاثة تصمیمات لأنماط الاستجابة على الاختبارات الإلکترونیة على معدل الأداء الفوری والمؤجل لطلاب الجامعة فی الاختبار. مجلة العلوم التربویة -مصر، 18 (3)،                 102-143.
    1. Anakwe, B. (2008). Comparison of student performance in paper-based versus computer-based testing. Journal of Education for Business, 84 (1), 13-17.
    2. Flowers, C., Kim, D., Lewis, P., & Davis, V. C. (2011). A comparison of computer-based testing and pencil-and-paper testing for students with a read-aloud accommodation. Journal of Special Education Technology, 26 (1), 1-12.
    3. Hansen, E. G., & Mislevy, R. J. (2005). Accessibility of Computer-Based Testing for Individuals with Disablities and English Language Learners within a Validity Framework. In S. Howell, & M. Hricko (Eds.), Online Assessment and Measurement: Foundations and Challenges, (214-262).
    4. Maguire, K. A., Smith, D. A., Brallier, S. A., & Palm, L. J. (2010). Computer-based testing: A comparison of computer-based and paper-and-pencil assessment. Academy of Educational Leadership Journal, 14 (4), 117.
    5. Ozalp-Yaman, S., & Cagiltay, N. E. (2010). Paper-based versus computer-based testing in engineering education. Paper presented at Education Engineering Conference: (EDUCON). 1631-1637.
    6. Piaw, C. Y. (2012). Replacing paper-based testing with computer-based testing in assessment: Are we doing wrong? Procedia - Social and Behavioral Sciences, 64, 655-664.
    7. Prisacari, A. A., & Danielson, J. (2017). Computer-based versus paper-based testing: Investigating testing mode with cognitive load and scratch paper use. Computers in Human Behavior, 77, 1-10.
    8. Retnawati, H. (2015). The Comparison of Accuracy Scores on the Paper and Pencil Testing vs. Computer-Based Testing.TOJET: The Turkish Online Journal of Educational Technology, 14 (4), 135-142.
    9. Todd, C. & Bradely, C. (2001). Evaluating the design and development of psychological scales (Eds.), Handbook of Psychology and Diabetes: A Guide to Psychological Measurement in diabetes research and practice, (pp.15-42). New York: psychological press.
    10. Wang, S., Jiao, H., Young, M. J., Brooks, T., & Olson, J. (2008). Comparability of computer-based and paper-and-pencil testing in K–12 reading assessments: A meta-analysis of testing mode effects. Educational and Psychological Measurement, 68 (1), 5-24.