الأخطاء الشائعة في إجراءات التحقق من ثبات وصدق أدوات القياس المستخدمة في البحوث التربوية العربية

نوع المستند : المقالة الأصلية

المؤلف

مدرس بقسم علم النفس التربوي کلية التربية بجامعة المنيا (مصر)، وجامعة الإمام عبد الرحمن بن فيصل (السعودية)

المستخلص

هدفت الدراسة الحالية إلى تحديد الأخطاء الشائعة في إجراءات التحقق من ثبات وصدق أدوات القياس المستخدمة في البحوث التربوية العربية، حيث تم حصر طرق حساب ثبات وصدق أدوات القياس المستخدمة في عينة من 72 بحثاً منشوراً في مجلة الجامعة الإسلامية للدراسات التربوية والنفسية، خلال عام 2012 وعام2016، وبلغ عدد أدوات القياس المستخدمة في هذه البحوث 92 أداة، کان 85% منها من إعداد الباحثين، وقد تم رصد 12 خطأً متکرراً في إجراءات التحقق من الثبات، و9 أخطاء متکررة في إجراءات حساب الصدق، کما اعتمد الباحثون بشکل أساسي على طريقة الاتساق الداخلي لحساب ثبات أدوات القياس، فبلغ مجموع نسبة استخدام التجزئة النصفية أو معادلة ألفا أو کيودر ريتشاردسون منفردة أو مع طرق أخرى 87% تقريباً، وبلغت نسبة استخدام طريقة إعادة التطبيق منفردة أو مع طرق أخرى 32%، کما کانت طريقة الصدق المرتبط بالمحتوى هي الأکثر استخداماً، إذ بلغت نسبة استخدامها منفردة أو مع طرق أخرى 77%، دون الاعتماد على أي طريقة کمية للتقدير، کما استُخدمت طريقة الاتساق الداخلي کطريقة لحساب الصدق في أکثر من نصف البحوث، حيث بلغت نسبة استخدام هذه الطريقة منفردة أو مع طرق أخرى 52%، وقد وضَّحت الدراسة الفرق بين استخدام طريقة الاتساق الداخلي لحساب الصدق، واستخدامها لحساب الثبات. وأوصت الدراسة بإعداد مقياس علمي لتقدير دقة إجراءات التحقق من صدق وثبات أدوات القياس في البحوث التربوية.
This study aimed at identifying the Common mistakes in reliability and validity  procedures of the measuring tools used in the Arabic educational research. The procedures of reliability and validity of the measuring tools used in a sample of 72 papers published in 2012 and 2016 in the Journal of the Islamic University for Educational and Psychological Studies were evaluated. The number of measuring tools used in these researches was 92 tools 85% were created by the researchers. Twelve frequent mistakes were detected in reliability procedures and nine repeated mistakes were detected in validity procedures. The most frequent method of reliability was the internal consistency including split-half method, Alpha coefficient and Kudar –Richardson. The most frequent method of validity was the content related  validity with the percentage of use alone or with other methods 77% without applying any quantitative method of estimation the content validity index. More than half of the researches used the method of "internal consistency" as a method of measuring validity. The study clarified the difference between using the "internal consistency" method to detect validity   and using it to detect reliability. The study recommended creating an analytical rubric to assess the accuracy of reliability and validity procedures.
 

الكلمات الرئيسية

الموضوعات الرئيسية


 

                       کلیة التربیة

        کلیة معتمدة من الهیئة القومیة لضمان جودة التعلیم

        إدارة: البحوث والنشر العلمی ( المجلة العلمیة)

    =======

 

 

 

الأخطاء الشائعة فی إجراءات التحقق من ثبات وصدق أدوات القیاس المستخدمة فی البحوث التربویة العربیة

 

 

 

إعـــــــــداد

د/ سومیة شکری محمد محمود

مدرس بقسم علم النفس التربوی

 کلیة التربیة بجامعة المنیا (مصر)، وجامعة الإمام عبد الرحمن بن فیصل (السعودیة)

 

 

 

}     المجلد الخامس والثلاثون– العدد السابع – یولیو 2019م {

http://www.aun.edu.eg/faculty_education/arabic

الملخص:

هدفت الدراسة الحالیة إلى تحدید الأخطاء الشائعة فی إجراءات التحقق من ثبات وصدق أدوات القیاس المستخدمة فی البحوث التربویة العربیة، حیث تم حصر طرق حساب ثبات وصدق أدوات القیاس المستخدمة فی عینة من 72 بحثاً منشوراً فی مجلة الجامعة الإسلامیة للدراسات التربویة والنفسیة، خلال عام 2012 وعام2016، وبلغ عدد أدوات القیاس المستخدمة فی هذه البحوث 92 أداة، کان 85% منها من إعداد الباحثین، وقد تم رصد 12 خطأً متکرراً فی إجراءات التحقق من الثبات، و9 أخطاء متکررة فی إجراءات حساب الصدق، کما اعتمد الباحثون بشکل أساسی على طریقة الاتساق الداخلی لحساب ثبات أدوات القیاس، فبلغ مجموع نسبة استخدام التجزئة النصفیة أو معادلة ألفا أو کیودر ریتشاردسون منفردة أو مع طرق أخرى 87% تقریباً، وبلغت نسبة استخدام طریقة إعادة التطبیق منفردة أو مع طرق أخرى 32%، کما کانت طریقة الصدق المرتبط بالمحتوى هی الأکثر استخداماً، إذ بلغت نسبة استخدامها منفردة أو مع طرق أخرى 77%، دون الاعتماد على أی طریقة کمیة للتقدیر، کما استُخدمت طریقة الاتساق الداخلی کطریقة لحساب الصدق فی أکثر من نصف البحوث، حیث بلغت نسبة استخدام هذه الطریقة منفردة أو مع طرق أخرى 52%، وقد وضَّحت الدراسة الفرق بین استخدام طریقة الاتساق الداخلی لحساب الصدق، واستخدامها لحساب الثبات. وأوصت الدراسة بإعداد مقیاس علمی لتقدیر دقة إجراءات التحقق من صدق وثبات أدوات القیاس فی البحوث التربویة.

الکلمات المفتاحیة: الثبات - ثبات الاتساق الداخلی - الصدق – صدق التکوین الفرضی.

 

Abstract:

This study aimed at identifying the Common mistakes in reliability and validity  procedures of the measuring tools used in the Arabic educational research. The procedures of reliability and validity of the measuring tools used in a sample of 72 papers published in 2012 and 2016 in the Journal of the Islamic University for Educational and Psychological Studies were evaluated. The number of measuring tools used in these researches was 92 tools 85% were created by the researchers. Twelve frequent mistakes were detected in reliability procedures and nine repeated mistakes were detected in validity procedures. The most frequent method of reliability was the internal consistency including split-half method, Alpha coefficient and Kudar –Richardson. The most frequent method of validity was the content related  validity with the percentage of use alone or with other methods 77% without applying any quantitative method of estimation the content validity index. More than half of the researches used the method of "internal consistency" as a method of measuring validity. The study clarified the difference between using the "internal consistency" method to detect validity   and using it to detect reliability. The study recommended creating an analytical rubric to assess the accuracy of reliability and validity procedures.

Key words: Reliability - Internal consistency – Validity - construct validity.

 

 

 

 

 

 

 

مقدمة:

یمثل البحث التربوی وسیلة مهمة للنهوض بالمجتمعات؛ إذ یُسهم فی حل المشکلات المتعلقة بتربیة الإنسان وبنائه، وفی ضوء نتائجه یتم اتخاذ القرارات التی تؤثر فی عملیة التعلیم والتعلم. وتتوقف دقة نتائج البحوث التربویة على عدة عوامل، منها التحقق من ثبات وصدق أدوات القیاس المستخدمة، والمطلع على البحوث التربویة والنفسیة یجد أن معظم الباحثین یفضلون إعداد أدوات قیاس خاصة ببحثهم، بغض النظر عن مدى توفر هذه الأدوات فی الأدب النفسی والتربوی، وذلک نتیجة الاعتقاد السائد بأن قیام الباحث بإعداد أدواته الخاصة یدلل على مهاراته البحثیة، مع عدم الوعی الحقیقی بصعوبة الوصول إلى المقاییس ذات المستوى المقبول من الصدق والثبات، التی یتطلب إعدادها فریقاً مدرَّباً من الباحثین المتخصصین، وعینات کبیرة من المفحوصین، کما یتطلب جمع عدة أدلة للتحقق من ثباتها وصدقها.

مما یثیر التساؤل حول مدى دقة الإجراءات التی یتبعها الباحثون للتحقق من صدق وثبات أدوات القیاس المستخدمة فی البحوث التربویة، فاستخدام أدوات غیر مناسبة یؤدی إلى جمع بیانات خاطئة مما یقود إلى نتائج مضللة، وقد أشار عزت (2016: 8-9) إلى أن هناک العدید من الأخطاء التی یقع فیها الباحثون والمناقشون تتعلق بالخصائص السیکومتریة لأدوات البحث. وأشار باهی (2011: 1406) إلى أن هناک أخطاء کثیرة فی استخدام المصطلحات العلمیة الخاصة بکل من الثبات والصدق، حیث تم استنساخ العدید من المصطلحات التی لا أساس لها من الصحة، مما یبرز الحاجة إلى محاولة وصف هذه الحالات، وتحدید مدى انتشارها، وهل تمثل ظاهرة تتطلب المواجهة أم أنها مجرد حالات فردیة؟. 

مشکلة الدراسة:

هناک مجموعة من طرق حساب ثبات أدوات القیاس وصدقها، محددة ومعروفة فی الأدب السیکومتری، وبمطالعة البحوث التربویة العربیة المنشورة فی الدوریات العلمیة المحکمة، نجد أن هناک خلطاً لدى العدید من الباحثین بین مفهوم الثبات والصدق، فنجدهم یخلطون بین إجراءات التحقق من ثبات الاتساق الداخلی وإجراءات التحقق من صدق التکوین الفرضی لأدوات القیاس المستخدمة فی البحث، کما أن هناک أخطاء متعلقة بدقة إجراءات تقدیر کل من صدق المحتوى والصدق التمییزی، وکذلک هناک ندرة فی البحوث التی تعتمد على مقاییس مقنَّنة، فالجمیع - بغض النظر عن تخصصه - یقوم بإعداد أدوات قیاس خاصة ببحثه. وهکذا تتعدد الأخطاء فی بحوثنا التربویة، مما یلفت الانتباه إلى رصد حجمها، وهل هی أخطاء نادرة أم أنها تمثل ظاهرة تتطلب المواجهة والعلاج؟ وبناءً على ما سبق یمکن صیاغة مشکلة الدراسة فی التساؤلات التالیة:

  1. ما الطرق الأکثر استخداماً للتحقق من ثبات أدوات القیاس فی البحوث التربویة؟
  2. ما الطرق الأکثر استخداماً للتحقق من صدق أدوات القیاس فی البحوث التربویة؟
  3. ما نسبة البحوث التی تعتمد على أدوات قیاس مقنَّنة أو منشورة؟
  4. ما الأخطاء الشائعة فی إجراءات حساب ثبات أدوات القیاس فی البحوث التربویة؟
  5. ما الأخطاء الشائعة فی إجراءات التحقق من صدق أدوات القیاس فی البحوث التربویة؟

أهداف الدراسة:

  1. تحدید وتصنیف الأخطاء الشائعة فی إجراءات حساب ثبات وصدق أدوات القیاس فی البحوث التربویة.
  2. تحدید نسبة الأخطاء الشائعة فی إجراءات حساب ثبات وصدق أدوات القیاس فی البحوث التربویة.
  3. مناقشة المفاهیم المرتبطة بطرق حساب ثبات وصدق أدوات القیاس فی البحث التربوی، والتی تتداخل لدى طلاب الدراسات العلیا والباحثین.

أهمیة الدراسة:

الأهمیة النظریة:

تناقش الدراسة بعض المفاهیم المهمة فی القیاس النفسی والتربوی، وبخاصة تلک المتعلقة بثبات الاتساق الداخلی وصدق التکوین الفرضی، وهما مفهومان کثیراً ما یحدث بینهما تداخل وخلط لدى العدید من طلاب الدراسات العلیا والباحثین.

الأهمیة التطبیقیة:

  1. تُسهم الدراسة فی تحسین جودة البحث التربوی العربی من خلال تحسین مستوى ثبات وصدق أدوات القیاس المستخدمة فیه.
  2. تُسهم الدراسة فی زیادة وعی الباحثین بالإجراءات الدقیقة لحساب ثبات وصدق أدوات القیاس، والتی یتوقف علیها الثقة فی نتائج البحوث.

حدود الدراسة:

الحد الموضوعی: تتحدد نتائج الدراسة بطرق حساب ثبات وصدق أدوات القیاس فی ضوء النظریة الکلاسیکیة فی القیاس.

الحد المکانی والزمانی: تتحدد نتائج الدراسة بالمجلة المختصة التی تم اختیار عینة البحوث منها، وهی مجلة الجامعة الإسلامیة للدراسات التربویة والنفسیة، خلال عامی: 2012م، 2016م.

التعریف الإجرائی لمتغیرات الدراسة:

  1. ثبات أداة القیاس: یُقصد به ثبات درجات أداة القیاس، أی: مدى خلو تباین درجات عینة محددة من المفحوصین علیها من تباین الخطأ العشوائی.
  2. صدق أداة القیاس: هو صفة فریدة unitary لا تتعلق بالأداة فی حد ذاتها، وإنما تتعلق بتفسیر الدرجات المستمدة منها، وتعنی مدى صحة القرارات التی یتم اتخاذها فی ضوء نتائج الأداة. 

الإطار النظری والدراسات السابقة:                

یُعرف البحث التربوی بأنه تطبیق المنهج العلمی فی دراسة المشکلات التربویة، ومن ثم فهناک مجموعة من المعاییر والإجراءات التی یحددها المنهج العلمی حتى یحقق البحث التربوی الهدف منه (Oluwataya, 2012: 391)، وتتنوع أدوات جمع المعلومات فی البحث التربوی بتنوع أهدافه، فمنها الاختبارات والمقاییس النفسیة، واختبارات التحصیل، والاستبانة،          والمقابلة، والملاحظة، واستمارة تحلیل المحتوى، وأیاً کانت الأداة التی یستخدمها الباحث فعلیه                   أن یتحقق من معاییر بنائها وصلاحیتها، ومن أهم هذه المعاییر ثبات الأداة وصدقها            (عطیة، 2009: 107-108، أبو علام، 2006: 447)؛ وذلک لضمان صحة ودقة البیانات التی یتم جمعها، فالقصور فی التحقق من ثبات وصدق الأدوات یؤدی إلى جمع بیانات خاطئة، ومن ثم الوصول إلى نتائج مضللة. وقد بینت دراسة (Fong, 1994) أن العدید من البحوث التی أجریت فی مجال التربیة وعلم النفس تفتقد الواقعیة، ویصعب تعمیم نتائجها، وتقود إلى نتائج مضللة؛ بسبب الأخطاء المنهجیة فی تصمیمها وإجراءاتها، وتکمن خطورة ذلک فی طبیعة المشکلات التی یتناولها البحث التربوی، الذی یُعنَى بالإنسان بالدرجة الأولى، سواء أکان معلماً أم متعلماً، فقد تؤدی النتائج المضللة إلى توجیه العملیة التربویة والتعلیمیة فی اتجاهات خاطئة، لذا بات من الضروری التحقق من دقة إجراءات ثبات وصدق أدوات القیاس المستخدمة فی البحوث التربوی؛ لما له من دور فی تحسین جودة هذه البحوث وزیادة الثقة فی نتائجها.

ویشیر مفهوم الثبات إلى مدى اتساق نتائج المقیاس، أی: مدى إمکانیة الحصول          على نفس النتائج إذا قمنا بتطبیق المقیاس نفسه عدة مرات على نفس المفحوصین           (أبو علام، 2006: 448، میخائیل، 2015: 95)، ویقابله مفهوم الدقة Precise            (عبیدات، 2010: 330).

ویُعرف ثبات المقیاس إحصائیاً بأنه نسبة تباین الدرجات الحقیقیة إلى تباین الدرجات الملاحظة، حیث یتضمن تباین الدرجات الملاحظة فی القیاس النفسی عادة مقداراً من تباین الخطأ، وتتعدد مصادر أخطاء القیاس، فمنها ما یتعلق بالمقیاس نفسه، کالخطأ فی أسلوب معاینة الفقرات للنطاق السلوکی المستهدف بالقیاس، ومنها ما یتعلق بإجراءات التطبیق والتصحیح، کالأخطاء فی تعلیمات الاختبار الشفهیة، أو أخطاء الطباعة، أو عدم مناسبة البیئة الفیزیائیة أو النفسیة للتطبیق، ومنها مصادر تتعلق بالمختبرین، کمیلهم للتخمین أو الغش، بالإضافة لتأثیر المرغوبیة الاجتماعیة على استجاباتهم (علام، 2011: 131-143).

وتشیر أدبیات القیاس والتقویم التربوی إلى طرق متعددة لتقدیر قیم معامل الثبات، کإعادة التطبیق، والصور المتکافئة، وإعادة التطبیق بصور متکافئة، والاتساق الداخلی، وثبات تقدیرات المحکمین. ولکل طریقة مجموعة من الإجراءات والضوابط یضیق المقام بسردها هنا، والذی ینبغی الترکیز علیه أن هذه الطرق تختلف باختلاف مصدر الأخطاء العشوائیة التی نود تقدیر تأثیرها فی الدرجات الملاحظة، وهذا یعتمد على طبیعة الاختبار، وفیم تستخدم درجاته؟، لذلک لابد أن یکون هناک مبرر منطقی لاختیار طریقة حساب الثبات، بالإضافة لضرورة الالتزام بالإجراءات العلمیة لاستخدام الطریقة المختارة (أبو علام، 2006: 468، علام، 2011: 144-168، أبو دنیا، 2018: 252-257، ملحم، 2018: 302-313).

أما الصدق فیُعد أهم خاصیة من خصائص القیاس، ویشیر إلى صحة الاستدلالات التی نتوصل إلیها من درجات المقاییس، من حیث فائدتها ومعناها (أبو علام، 2006: 447)، ویکون المقیاس صادقاً عندما یقیس ما أُعد لقیاسه، ویقابله مفهوم الصحة Accurrate          (عودة، 2010: 330)، فهو یعنی مدى تلبیة المقیاس للأغراض والاستعمالات الخاصة التی صُمم من أجلها. ویُعد الصدق صفة نسبیة؛ إذ لا یوجد مقیاس صالح فی کل المواقف، إنما یتوقف صدق المقیاس على وظیفته، والغرض منه، فالاختبار الذی یتم إعداده بغرض التنبؤ قد لا یعمل بنفس درجة الصدق فی التشخیص (میخائیل، 2015: 86-87).

وعلى الرغم من ظهور مصطلحات عدیدة للتعبیر عن طرق حساب الصدق، والتی أُصطلح على تسمیتها بــ"أنواع الصدق"، فإنه من الواجب هنا التأکید على أنه لا توجد أنواع مختلفة للصدق؛ فالصدق مفهوم مجرد، وفرید، ومتعدد الأبعاد ، لذا تتعدد طرق التحقق منه، ولا تُعد هذه الطرق بدائل لبعضها البعض، لکن کلاً منها یهتم بجمع نوع معین من الأدلة یبرر جانباً من جوانب الصدق المختلفة (AERA, APA & NCME, 2014: 11).

وعلى الرغم من التصنیفات العدیدة لطرق حساب الصدق، فإن التصنیف الأکثر شیوعاً فی أدبیات ومراجع القیاس والتقویم العربیة یضعها فی ثلاث فئات رئیسیة، هی:

  1. ما یرتبط بالمحتوى Content Validity ، ویُقصد به مدى تمثیل فقرات المقیاس تمثیلاً سلیماً للمجال المستهدف بالقیاس، ولذلک فهو یتطلب تحدید هذا المجال تحدیداً واضحاً، وتحدید عناصره، وبناء مجموعة ممثلة من الفقرات، بحیث یتم مقارنة الفقرات بالمواصفات التی تحدد المجال. ولصدق المحتوى بُعدان: الأول هو الصدق الظاهری، الذی یرتبط بمدى وضوح المحتوى بالنسبة للمفحوصین، من حیث: سهولة القراءة، واتساق الأسلوب، والتنسیق، ووضوح اللغة المستخدمة، وإلى أی مدى تبدو الفقرات مرتبطة بهدف الأداة من وجهة نظر المفحوصین. أما البعد الثانی فهو الصدق العینی، الذی یُعنى بتقدیر مدى تمثیل الفقرات للمجال  المحدد بجدول المواصفات من وجهة نظر مجموعة من الخبراء.
  2. ما یرتبط بمحک Criterion–Realated Validity ، ویتم من خلال إیجاد معامل الارتباط بین درجات المقیاس ودرجات مقیاس آخر یقیس السمة نفسها وتم التحقق من صدقه، ویُعرف الأخیر بالمحک، وقد یکون المحک أداءً مستقبلیاً للمفحوصین، فحینئذ یُسمی الصدق بالصدق التنبؤی، وقد یتم تطبیق المقیاس المحک بالتزامن مع المقیاس محل الدراسة، وحینئذ یُسمی الصدق بالصدق التلازمی.
  3. ما یرتبط بالبناء أو التکوین Construct Validity ، وتُستخدم هذه الطریقة عندما یتم تصمیم المقیاس فی ضوء نظریة علمیة، أو افتراضات محددة، ویکون الهدف تحدید ما إذا کان المقیاس یمثل النظریة أم لا؟، وتعتمد هذه الطریقة على تحدید مدى الارتباط بین الجوانب التی یقیسها المقیاس وبین النظریة أو الافتراضات. ویُعد صدق البناء مفهوماً شاملاً یتضمن سائر أنواع الصدق، ویتطلب الاستنتاجات المنطقیة والوسائل التجریبیة والإحصائیة. وللکشف عن صدق البناء هناک ثلاث خطوات، أولاها: تعریف الإطار النظری للسمة المستهدفة بالقیاس. وثانیتها: اشتقاق فروض حول نتائج المقیاس فی ضوء الإطار النظری المحدد. وثالثتها: اختبار هذه الفروض منطقیاً أو تجریباً. أما إجراءات التحقق من صدق البناء فتتمثل فی الآتی:

‌أ-         دراسة العلاقة بالمقاییس الأخرى، وذلک من خلال دراسة الارتباط بین نتائج المقیاس ونتائج مقاییس أخرى تقیس مکوناً یرتبط نظریاً مع المکون المسهدف بالقیاس، أو بدراسة مدى تمایز  نتائج المقیاس محل الدرسة عن نتائج مقیاس آخر یقیس مکوناً لا یرتبط مع المکون المستهدف بالقیاس، أو بإجراء التحلیل العاملی لنتائج المقیاس؛ لتحدید نسبة التباین التی تفسرها العوامل المکونة للمقیاس بالنسبة للتباین الکلی، وفحص محتوى العوامل والاستدلال من خلالها على طبیعة المکون الفرضی.

‌ب-       الدراسات التجریبیة، وتتم باختبار تغیر درجات المقیاس عند تقدیم أنواع معینة من المعالجات التجریبیة.

‌ج-        مقارنة درجات مجموعات متمایزة فی المکون المستهدف بالقیاس.

‌د-         التحلیل الداخلی للاختبار، ویتم من خلال جمع معلومات عن محتوى الاختبار نفسه، والعملیات المستخدمة فی الاستجابة على فقراته، والارتباطات بین فقرات الاختبار، ودراسة تجانس المحتوى، والتأکد من أنه یقیس سمة أحادیة البعد، ولذلک یمکن استخدام معامل ألفا أو کیودر- ریتشاردسون کمؤشر للتجانس أو إحادیة البعد.

(أبو علام، 2006: 451-460، عبیدات، 2010: 367-386، علام، 2011: 189–228، میخائیل، 2015: 87-93، ملحم، 2018: 318-321).

وهناک العدید من الأسالیب أو المؤشرات الإحصائیة والمنطقیة التی تُستخدم فی الکشف عن صدق البناء، وقد یُستخدم أکثر من مؤشر للمقیاس الواحد؛ نظراً لتعدد الفرضیات التی یفرزها الإطار النظری، ومنها بالإضافة للتحلیل العاملی، مؤشرات الثبات، سواء ثبات الاتساق الداخلی باستخدام التجزئة النصفیة وحساب معامل ألفا أو کیودر- ریتشاردسون، أو ثبات الإعادة للکشف عن ثبات السمة وعلاقته بثبات المقیاس، حیث تُعرف السمة السیکولوجیة بأنها مجموعة من السلوکیات التی تمیل إلى الحدوث معاً، وبالتالی فإن قوة الارتباط بین الفقرات المعدة لقیاس السمة تُعد مؤشراً أولیاً لصدق البناء، وکذلک عندما یکون هناک افتراض بأن السمة المقاسة تتغیر مع مرور الزمن،  فإن معامل ثبات التجزئة النصفیة ومعامل ثبات الإعادة یُستخدمان معاً کدلیل  على صدق البناء، فإذا کان معامل ثبات التجزئة النصفیة مرتفعاً، وکان معامل ثبات  الإعادة  منخفضاً، فإن ذلک یعنی بدرجة مقبولة من الثقة أن المقیاس صادق فی قیاس هذه السمة (عبیدات، 2010: 356، 381) 

ومن ثم یُعد الاتساق الداخلی مؤشراً ضروریاً، لکنه غیر کاف لصدق البناء؛ لأنه یعکس مدى خلو المقیاس من أخطاء المعاینة، فإذا افترضنا سمة أحادیة البعد، فهناک عدد کبیر وغیر محدود من المؤشرات السلوکیة الدالة على هذه السمة، وتمثل الفقرات الموجودة فی المقیاس عینة منها، وعندما نثبت أن هناک تجانساً بین هذه الفقرات، فهذا یدل على أننا لم ندرج فی المقیاس مؤشرات تعبِّر عن سمة أخرى، غیر أن ذلک لا یثبت بأی شکل أن عینة الفقرات کافیة، فقد تکون الفقرات متجانسة، ولکن هناک العدید من المؤشرات الأساسیة الدالة على السمة خارج المقیاس،  لذا فالاتساق الداخلی یظل مؤشراً أولیاً یحتاج لمزید من الأدلة لإثبات صدق البناء عندما یکون هناک افتراض بأن السمة المستهدفة بالقیاس سمة أحادیة البعد.

وتُعد أحادیة البعد صفة مرغوبة فی القیاس النفسی؛ نظراً لصعوبة تفسیر الدرجة           الکلیة على المقاییس متعددة الأبعاد، لذا یتم تحلیل السمة متعددة الأبعاد إلى أبعاد         أحادیة؛ لیکون هناک معنى للدرجة على کل بعد، فالقیاس النفسی الجید هو الذی یسمح        بتقدیر قدرة واحـدة للممتحن فی کل مرة، ولا یسمح بإسهام مقدرتین فی درجة قیاس واحدة،          ففی المسائل اللفظیة فی الریاضیات یجب أن یبحث معـد الفقرات عن طرق بدیلة           لتقدیم الفقرات، بحیث لا یستمر الأفراد مرتفعو القدرة اللفظیة متمیزین فی الحل                     (Sijtsma & Molenaar, 2002: 18-19, Bond & Fox, 2007: 34).

 ومن الضروری أن یهدف الاختبار إلى قیاس قدرة واحدة عندما تُستعمل الدرجة الکلیة وحدها محکاً للتقییم (Sheng & Wikle, 2007: 900)، وجدیر بالذکر أنه من الصعب أن یتحقق افتراض أحادیة البعد عملیاً بشکـل تـام (Harris & Kolen, 1986: 37, Wainer & Mislevy, 2000: 91)؛ نظراً لتعدد العوامل المعرفیة والشخصیة، وتداخلها مع تلک المتعلقة بإجراءات تطبیق الاختبار، التی دائماً ما تؤثر على الأداء فی الاختبار، أو فی بعض نطاقاته علـى الأقل (Hambleton et al., 1991: 9)، وتلک العوامل تکون غیر معروفة، ویصعب التحکم فیها (Osterlind, 1992: 47)، لذلک فمـن الأفضل اعتبار أحادیة البعد متغیراً متصلاً، وعدم اعتبارها متغیراً ثنائیاً، إما أن یتحقق أو لا (Blais & Laurier, 1995: 88).

ومن الجدیر بالذکر أننا عندما نستخدم الاتساق الداخلی کمؤشر أولی على صدق     البناء، یجب أن نستخدم معامل ألفا أو معامل کیودر- ریتشاردسون کإحصاءة تعبر عن  متوسط معاملات الارتباط بین درجات جمیع الفقرات، حیث یعد الصدق صفة لنتائج المقیاس ککل، فی حین أن الاعتماد على الارتباط بین درجة الفقرة ودرجة البعد - وهو الإجراء السائد   فی البحوث التربویة العربیة - یقدم معلومات خاصة بالفقرة، وهو معامل تمییز الفقرة، حیث         إن معامل تمییز الفقرة هو معامل الارتباط بین درجة الفقرة والدرجة الکلیة على المقیاس بعد تحریر الدرجة الکلیة من درجة الفقرة (عبیدات، 2010: 279-280، علام، 2011: 280، Jeeva, 2016: 51)، ویُستخدم معامل تمییز الفقرة کموشر لصدقها، ومن ثم یتم اسـتبعاد الفقرات منخفضة التمییز (Thorndike, 1982: 53).

ویلاحظ مما سبق أن هناک تداخلاً بین إجراءات طرق التحقق من صدق البناء والطرق الأخرى من الصدق، لذا فقد قدمت معاییر القیاس النفسی - التی أعدتها الجمعیة الأمریکیة لعلم النفس ورابطة البحث التربوی الأمریکیة والمجلس الوطی للقیاس فی التربیة - تصنیفاً لطرق التحقق من صدق المقیاس یعالج هذا التداخل، فأشارت إلى أن هناک خمسة أنواع من الأدلة تدعم جوانب الصدق المختلفة، وهی کالتالی:

  1. الأدلة القائمة على المحتوى، وتعتمد على التحلیلات المنطقیة، وتقویم الخبراء لمحتوى المقیاس، الذی یتضمن: الفقرات، والمهام، والصیاغة، والإخراج، والحکم على کفایة الفقرات، ووضوحها، والعلاقة بینها وبین السمة المستهدفة بالقیاس، کما یمکن أن تتضمن مراجعة الخبراء فحص التحیز للنوع أو الثقافة أو العمر.
  2. الأدلة القائمة على عملیات الاستجابة، وتعنی تحدید مدى تلاؤم طریقة الاستجابات المطلوبة من المفحوصین مع السمة المستهدفة بالقیاس، وتتضمن ملاحظة المفحوصین أثناء الأداء على المقیاس، وإجراء مقابلات معهم لتحدید أسباب إعطاء إجابات محددة للأسئلة، وکذلک فحص الطرق التی یستخدمها المحکمون أو المصححون لأعطاء الدرجات فی ضوء المحکات المحددة للتقدیر أو التصحیح، من أجل التأکد من أنهم یستخدمون المحک کما هو مخطط له، وأن تقدیراتهم لا تتأثر بأی عوامل خارجیة لیس لها علاقة بالسمة المستهدفة بالقیاس.
  3. أدلة تعتمد على البنیة الداخلیة للمقیاس، وهنا یکون الهدف اختبار مدى اتفاق المکونات الداخلیة للمقیاس مع السمة المعرفة نظریاً، ویتم ذلک باستخدام التحلیل العاملی التوکیدی ودالة الأداء التفاضلی للفقرة Differential item function( DIF) ؛ وذلک لتحدید الفقرات المتحیزة، أی الفقرات التی یتباین احتمال نجاح الأفراد من نفس مستوى القدرة فی الإجابة علیها لأنهم ینتمون إلى مجموعات مختلفة، وهناک العدید من طرق حساب دالة الأداء التفاضلی للفقرة، بعضها یعتمد على النظریة الکلاسیکیة فی القیاس، وبعضها یعتمد على نظریة الاستجابة للفقرة.
  4. الأدلة القائمة على العلاقات مع متغیرات أخرى، وتشمل الصدق المرتبط بمحک، بنوعیه التنبؤی والتلازمی، وکذلک الصدق التقاربی، والصدق التمییزی.
  5. الدلیل القائم على نتائج الاختبار، ویتعلق بالنتائج الإیجابیة والسلبیة المتوقعة لاستخدام المقیاس، فهو یعکس مدى فائدة المقیاس.

(Goodwin & Leech, 2003: 183-184)

وهناک العدید من التهدیدات التی تواجه جودة البحث التربوی، مثل أخطاء تصمیم البحث، وطرق اختیار العینات، واستخدام الأسالیب الإحصائیة غیر المناسبة، واستخدام أدوات غیر صالحة لجمع البیانات (Oluwatayo, 2012: 398)، ومن ثم فقد اهتم عدد من الباحثین بجودة البحث التربوی، وظهر ذلک من خلال الدراسات التی اهتمت بمراجعة دقة الأسالیب الإحصائیة المستخدمة أو تحدید الأخطاء الشائعة لدى الباحثین.

فهدفت دراسة (1996) Baumberger & Bangert  إلى مراجعة البحوث التربویة المنشورة فی مجلة صعوبات التعلم   Learning disabilities، خلال الفترة من 1989م إلى 1993م ، وتوصلت إلى أن 80% من إجراءات تلک البحوث کانت غیر ملائمة.

وهدفت دراسة عفانة (2011) إلى معرفة الأخطاء الشائعة لدى طلبة الدراسات العلیا فی تصمیم البحوث التربویة فی جامعات قطاع غزة، ولتحقیق هذا الهدف تم وضع بطاقة ملاحظة یتم تطبیقها أثناء المناقشات العلمیة؛ لتحدید أهم الأخطاء الشائعة فی الهیاکل الأساسیة للبحث، وتوصلت الدراسة إلى أن هناک ثلاثة أخطاء فی رسائل الماجستیر المقدمة فی الجامعة الإسلامیة تتعلق بتساؤلات البحث، والدراسات السابقة، وعینة البحث، بینما کان هناک أربعة عشر خطأً رئیسیاً فی رسائل الماجستیر فی جامعة الأزهر بغزة، تتعلق بعنوان الرسالة، والمقدمة، والمشکلة، والتساؤلات، وصیاغة الفروض، وأهمیة البحث، وأهدافه، والدراسات السابقة، ومنهجیة البحث، وأدواته، وخطوات البحث، والأسالیب الإحصائیة، والمراجع، والطباعة، بینما کان هناک خمسة أخطاء رئیسیة فی رسائل الماجستیر المقدمة فی جامعة الأقصى بغزة، تتعلق بصیاغة العنوان، وکتابة المقدمة، وصیاغة الفروض، والدراسات السابقة، والأخطاء المطبعیة.

وأشار عفانه (2011: 327) إلى أن طلاب الدراسات العلیا بجامعات غزة یجدون صعوبة فی إعداد أدوات البحث، وبخاصة أدوات تحلیل المضمون والمقابلة والملاحظة، کما أن معظم الباحثین الذین یجرون بحوثاً تجریبیة لا یقومون بالتحقق من الخصائص السیکومتریة للأدوات؛ نظراً لعدم توفر العینات.

وهدفت دراسة (علی، وعبد الحلیم، وحسن، 3013) إلى تحدید مدى مناسبة الأسالیب الإحصائیة المستخدمة فی حساب کفاءة الأدوات فی بعض الرسائل العلمیة بالأقسام التربویة بکلیة التربیة - جامعة أسیوط، خلال الفترة من 2004م إلى 2009م، فی ضوء مستویات القیاس، ومن أهم نتائج هذه الدراسة ارتفاع نسبة الأسالیب الإحصائیة غیر المناسبة عند حساب الصدق، حیث تراوحت هذه النسبة بین 31% إلى 78.5%، ومن هذه الأخطاء قیام الباحثین عند استخدام أسلوب المقارنة الطرفیة للتحقق من صدق الاختبار بحساب دلالة الفروق بین الأقویاء والضعفاء على الاختبار محل الدراسة، ولیس على المحک. وکان من أهم نتائجها أیضاً ارتفاع نسبة الأسالیب الإحصائیة غیر المناسبة عند حساب الثبات، حیث تراوحت هذه النسبة بین 46% و71%، ومن هذه الأخطاء الخلط بین استخدام معادلة کیودر-ریتشاردسون ومعادلة ألفا، واستخدام طریقة إعادة التطبیق مع اختبارات الذکاء والذاکرة والتحصیل، وعدم الالتزام بشروط الفاصل الزمنی بین التطبیقین.

کما أشار ذبیحی  وشوبار (2017: 20) إلى الأخطاء الشائعة المتعلقة بالتحقق من الخصائص السیکومتریة للمقاییس، ومنها: الخلط بین الاتساق الداخلی والصدق، وحساب دلالة الفروق بین درجات الربع الأعلى والربع الأدنى على المقیاس نفسه، دون الرجوع إلى محک خارجی فی طریقة المقارنة الطرفیة، وکذلک استخدام طریقة التجزئة النصفیة فی حساب ثبات کل المقاییس دون التحقق من شروط استخدامها.

وقد حدد (عزت، 2016: 8-9) الأخطاء التی یقع فیها الباحثون والمناقشون المتعلقة بالخصائص السیکومتریة لأدوات البحث، ومن أبرزها: حساب الصدق قبل حساب الثبات، رغم أن الثبات شرط ضروری للصدق،؛ لأن البدء بحساب الثبات یمثل عملیة فلترة أولیة لأداة القیاس من البنود غیر الثابتة، ثم یأتی الصدق لتنقیة الأداة من العبارات غیر الصادقة، ومن تلک الأخطاء أیضاً استخدام مصطلح "صدق الاتساق الداخلی"، والصواب هو "ثبات الاتساق الداخلی"، ومنها کذلک عدم الاهتمام بتحلیل الفقرات، والاکتفاء بالتحلیل الکلی للمقیاس.

وترى الباحثة أن إجراءت التحقق من الخصائص السیکومتریة للمقاییس یجب أن تسیر بتسلسل منطقی، فإذا اهتم الباحث بالتحقق من صدق محتوى الأداة، فهنا یجب أن یبدأ بدراسة صدق المحتوى قبل الثبات، ولا یُعد ذلک کافیاَ لحساب الثبات؛ لأنه لا یمثل صدقاً مطلقاً، لکنه صدق لجانب واحد هو المحتوى؛ إذ إن الصدق مفهوم متعدد الأبعاد، فقد تمثل عینة الفقرات المجال المستهدف بالقیاس تمثیلاً جیداً، ولکن یفشل المقیاس فی تقدیم أی معلومات عن السمة المستهدفة بالقیاس، وذلک عندما لا یستطیع التمییز بین المفحوصین، ثم یأتی دور التحلیل التفصیلی للفقرات، فیتم حساب معاملات صعوبة الفقرات ومعاملات تمییزها، وذلک بهدف استبعاد الفقرات متطرفة الصعوبة، التی تُعد أحد مصادر أخطاء القیاس، حیث تؤدی هذه الفقرات إلى انخفاض التباین، ولا تقدم معلومات عن المفحوصین، فعندما تکون الفقرات سهلة جداً ینجح جمیع المفحوصین فی الإجابة عنها، وعندما تکون الفقرات صعبة جداً یفشل           جمیعهم فی الإجابة عنها، فیظهرون کعینة متجانسة (عودة، 2010: 339)، ومن ناحیة         أخرى تؤدی الفقرات متطرفة الصعوبة إلى انخفاض دافعیة المفحوصین فی الاستجابة على المقیاس  أو قد تسبب شعورهم بالملل، کما أن الفقرات الصعبة تدفع المفحوصین للتخمین فی الاختبارات المعرفیة.

وفی التحلیل التفصیلی للمقیاس یتم حساب معاملات تمییز الفقرات؛ بهدف استبعاد الفقرات منخفضة التمییز، التی لا تقدم معلومات عن تباین المفحوصین، وأخیراً یأتی التحلیل الکلی للمقیاس، ویفضَّل البدء بحساب الثبات، فإذا لم یتحقق شرط الثبات یجب التوقف وإعادة مراجعة الجوانب المختلفة للمقیاس، أما إذا تم التحقق من ثبات المقیاس فیمکن الاستمرار وجمع أدلة مختلفة للصدق طبقاً للهدف من المقیاس. 

ومن ناحیة أخرى فقد لاحظت الباحثة أن جمیع الأبحاث التی حاولت التحقق من صدق المحتوى لم تعتمد على أی أسلوب کمی لمعالجة استجابات الخبراء أو المحکمین، رغم وجود العدید من الأسالیب الکمیة للتحقق من صدق المحتوى، وقد أوردها الضوی (2015) فی دراسة بعنوان استخدام الأسالیب الکمیة فی التحقق من صدق محتوى الاختبار النفسی.

الطریقةوالإجراءات:

أولاً - منهج الدراسة:

تم اتباع المنهج الوصفی للإجابة عن تساؤلات الدراسة، وهو المنهج الذی یصف الواقع وصفاً دقیقاً من خلال التعبیر الکمی أو الکیفی عن الظواهر العلمیة، ویهدف إلى مساعدة الباحث للوصول إلى استنتاجات وتعمیمات تساعد فی تطویر الواقع محل الدراسة، من خلال تنظیم المعلومات وتصنیفها وتحلیلها (عبیدات، وعبد الحق، وعدس، 2003: 191).

ثانیاً- عینة الدراسة:

شملت العینة 72 بحثاً علمیاً محکَّماً منشوراً فی مجلة الجامعة الإسلامیة للدراسات التربویة والنفسیة، خلال عامی: 2012م، و 2016م.

ثالثاً- الخطوات الإجرائیة للدراسة:

1-      اختیار وعاء للنشر مصنَّف دولیاً، ویتیح المحتوى المنشور مجاناً على شبکة الإنترنت، مما یمکِّن من التحقق من نتائج الدراسة الحالیة کأحد شروط البحث العلمی، ومن ناحیة أخرى فإن الإتاحة المجانیة تجعل المحتوى یصل إلى أکبر عدد من الباحثین، مما یزید من خطورة الأخطاء، ویجعلها قابلة للانتشار والتکرار بین الباحثین، لذلک وقع الاختیار على مجلة الجامعة الإسلامیة للدراسات التربویة والنفسیة. وهی مجلة علمیة محکَّمة، تصدر کل شهرین عن عمادة البحث العلمی والدراسات العلیا بالجامعة الإسلامیة بغزة، وبدأ إصدارها عام 1993م لکل التخصصات العلمیة، ثم تخصصت فی العلوم التربویة والنفسیة عام 2012م، وتقوم بنشر البحوث العلمیة الأصیلة فی المجالات المختلفة للتربیة وعلم النفس، باللغتین العربیة والإنجلیزیة، من نتاج الباحثین فی داخل الجامعة الإسلامیة وخارجها، والتی لم یسبق نشرها من قبل، وتحمل الرقم المعیاری الدولی:  ISSN: 2410-3152، وتتیح جمیع الأبحاث المنشورة منذ عام 2012م حتى الآن، على الرابط الآتی:

https://journals.iugaza.edu.ps/index.php/IUGJEPS/issue/archive

2- حصر الأبحاث المنشورة منذ 2012م حتى الآن، ویوضحها جدول (1).

جدول (1): عدد الأبحاث المنشورة بمجلةالجامعةالإسلامیةللدراساتالتربویةوالنفسیة

السنة

2012

2013

2014

2015

2016

2017

2018

2019

مجموع الأبحاث

عدد المجلدات

2

4

4

4

4

4

6

4

عدد الأبحاث

42

71

33

33

30

77

169

154

609

3- اختیار أعداد محددة بهدف مراجعة کل الأبحاث المتضمنة بها وتحلیل إجراءاتها؛ للإجابة عن تساؤلات البحث، وقد تم اختیار الأعداد المنشورة فی عامی: 2012م، و2016م، أی بمعدل زمنی کل 4 سنوات، ویرجع اختیار العام (2012) إلى أنه البدایة الفعلیة لتخصص المجلة فی العلوم التربویة والنفسیة، والبدایة الفعلیة لإتاحة المحتوى المنشور مجاناً على شبکة الإنترنت، أما اختیار العام (2016) فیرجع إلى تضاعف أعداد الأبحاث المنشورة من بعده تضاعفاً کبیراً. وقد ضم هذان العامان 72 بحثاً، بما یعادل 12% تقریباً من الأبحاث المنشورة بالمجلة.

4- إعداد جدول لتسجیل البیانات اللازمة؛ للإجابة عن تساؤلات الدراسة، بحیث یحتوی الجدول على رقم البحث وعنوانه ورقم المجلد والعدد، وعدد الأدوات المستخدمة به، وتصنیفها ما بین (مقننة، أو من إعداد الباحث)، وتسجیل طرق حساب الصدق وطرق حساب الثبات المستخدمة فی البحث، ورصد الأخطاء فی إجراءات کل منهما إن وجدت. ویوضح جدول (2) شکل البطاقة المستخدمة.

جدول (2): جدول تسجیل البیانات المطلوبة للتحلیل

مسلسل البحث ضمن مجموعة البحوث المستهدفة، وعنوانه، وتاریخ النشر، ورقم المجلد، ورقم العدد.

عدد الأدوات المستخدمة فی البحث:

 

نوع الأدوات

مقننة

من إعداد الباحث

طرق حساب الصدق

 

الأخطاء إن وجدت

 

طرق حساب الثبات

 

الأخطاء إن وجدت

 

     

5- جمع البیانات اللازمة للتحلیل باستخدام الجدول السابق، حیث تم جمع بیانات 72 بحثاً.

6- تفریغ البیانات التی تم جمعها فی صورة جدول تکراری یوضح عدد الأدوات المستخدمة، ونسبة الأدوات المقننة منها، وتکرارات الطرق المستخدمة فی حساب الثبات، وتکرارات الطرق المستخدمة فی حساب الصدق، ونوعیة الأخطاء، وتکراراتها.

نتائج الدراسة ومناقشتها:

الإجابة عن التساؤل الأول: ما الطرق الأکثر استخداماً للتحقق من ثبات أدوات القیاس فی البحوث التربویة؟

للإجابة عن هذا التساؤل تم حصر طرق حساب الثبات فی البحوث التی تم استقراؤها، وکان إجمالی عدد الأدوات المستخدمة فی البحوث محل الدراسة 92 أداة. ویوضح جدول (3) طرق حساب الثبات وتکراراتها ونسبتها المئویة بالنسبة لعدد الأدوات.

جدول (3) طرق حساب الثبات وتکراراتها ونسبتها المئویة

م

طریقة / طرق حساب ثبات المقیاس

التکرار

النسبة

1

إعادة التطبیق

12

13 %

2

الاتساق الداخلی باستخدام التجزئة النصفیة

10

11 %

3

الاتساق الداخلی باستخدام معامل کیودر- ریتشاردسون

4

4.3 %

4

الاتساق الداخلی باستخدام معامل ألفا

23

25 %

5

إعادة التطبیق + الاتساق الداخلی باستخدام التجزئة نصفیة

1

1 %

6

إعادة التطبیق + الاتساق الداخلی باستخدام معامل کیودر- ریتشاردسون

5

5.4 %

7

إعادة التطبیق + الاتساق الداخلی باستخدام  معامل ألفا

11

12 %

8

الاتساق الداخلی باستخدام تجزئة نصفیة + معامل ألفا

15

16.3 %

9

الاتساق الداخلی باستخدام تجزئة نصفیة + معامل کیودر- ریتشاردسون

1

1 %

10

إعادة التطبیق + الاتساق الداخلی باستخدام تجزئة نصفیة + معامل ألفا

1

1 %

11

ثبات التصحیح

1

1 %

12

لم تقم بحساب الثبات للاعتماد على مقاییس مقننة

8

9 %

 

المجموع

92

100 %

یتضح من الجدول السابق اعتماد الباحثین بشکل أساسی على طریقة الاتساق الداخلی لحساب ثبات أدوات المقیاس؛ حیث بلغت نسبة استخدام طریقة التجزئة النصفیة أو معامل ألفا أو معامل کیودر - ریتشاردسون منفردة أو مع طریقة أخرى 87% تقریباً، وبلغت نسبة استخدام طریق إعادة التطبیق منفردة أو مع طرق أخرى 32%، مما یبین اتجاه الباحثین نحو الاعتماد على طریقة الاتساق الداخلی لحساب الثبات؛ نظراً لأنها تختصر الوقت، ولا تتطلب التطبیق         إلا مرة واحدة. ویمکن أن نستدل من النتائج السابقة على أن الباحثین یتجهون لاختیار           الطریقة العملیة لحساب الثبات، بغض النظر عن طبیعة مصادر الأخطاء غیر المنتظمة التی تهدد القیاس.

الإجابة عن التساؤل الثانی: ما الطرق الأکثر استخداماً للتحقق من صدق أدوات القیاس فی البحوث التربویة؟

للإجابة عن هذا التساؤل تم حصر طرق حساب الصدق فی البحوث التی تم استقراؤها مع الالتزام بنفس المسیمات الواردة فی تلک البحوث، وإن کانت مسمیات خاطئة، على أن یتم توضیح ذلک عند مناقشة النتائج، وکان إجمالی عدد المقاییس المستخدمة فی البحوث محل الدراسة 92 أداة، ویوضح جدول (4) طرق حساب الصدق وتکراراتها ونسبتها المئویة بالنسبة للعدد الکلی للأدوات.

جدول (4) طرق حساب الصدق کما وردت بالأبحاث وتکراراتها ونسبتها المئویة

م

طریقة / طرق حساب صدق أدوات القیاس

التکرار

النسبة

1

صدق المحکمین أو صدق المحتوى فقط

32

35 %

2

الاتساق الداخلی فقط

12

13 %

3

الصدق التمییزی فقط

1

1%

4

الصدق المرتبط بالمحتوى + الاتساق الداخلی

35

38%

5

الصدق المرتبط بالمحتوى+ التحلیل العاملی

1

1%

6

الصدق المرتبط بالمحتوى + الصدق التمییزی

2

2%

7

الصدق المرتبط بالمحتوى + الاتساق الداخلی+ الصدق التمییزی

1

1%

8

لم تقم بحساب الصدق للاعتماد على مقاییس مقننة أو منشورة

8

9 %

 

المجموع

92

100 %

یتضح مما سبق أن الباحثین یعتمدون بشکل أساسی على طریقة الصدق المرتبط بالمحتوى؛ حیث بلغت نسبة استخدام هذه الطریقة منفردة أو مع طرق أخرى 77%، تلیها طریقة الاتساق الداخلی، حیث بلغت نسبة استخدام هذه الطریقة منفردة أو مع طرق أخرى 52%. وبمراجعة إجراءات هذه الطرق فی البحوث محل الدراسة وجد أن هناک الکثیر من الأخطاء العلمیة والإجرائیة، ومنها إطلاق العدید من الباحثین مسمى "صدق المحکمین" على طریقة الصدق المرتبط بالمحتوى، کما لو کان الهدف هو التأکد من صلاحیة المحکمین لقیاس السمة، کما أفتقدت تعلیمات المحکمین إلى المعاییر الإجرائیة المستخدمة فی تقدیر صلاحیة فقرات المقیاس، ولم تستخدم أی دراسة أی طریقة کمیة لمعالجة استجابات المحکمین، وفی بعض الدراسات لم یتم وصف عینة المحکمین على الإطلاق.

ویمکن أن نستنتج من نسبة استخدام الصدق المرتبط بالمحتوى فقط، التی بلغت 35%، قصور إدراک الباحثین لمفهوم الصدق کمفهوم متعدد الأبعاد، والاکتفاء ببعد واحد فقط، هو الصدق المرتبط بالمحتوى، فرغم أهمیة هذا الجانب، فإنه غیر کافٍ، وبخاصة عند استخدام أسالیب إحصائیة تشترط اعتدالیة توزیع الدرجات؛ لأنه من الممکن أن تمثل الفقرات السمة تمثیلاً جیداً وتنتمی جمیعها للمجال المستهدف بالقیاس، لکنها تفشل فی تقدیم أی معلومات عن تباین مستوى السمة لدى المفحوصین؛ نظراً لتطرف معاملات الصعوبة، وضعف معاملات التمییز، فیحصل الجمیع على درجات متشابهة، ویظهرون کعینة متجانسة، لذلک یجب الاهتمام بقدرة أداة القیاس على التمییز بالإضافة لصدق محتواه.

وهناک إجراءان للتحقق من قدرة المقیاس على التمییز بین المستویات المختلفة للسمة المقاسة، أولهما: تحلیل داخلی وعلى مستوى الفقرات، حیث یتم حساب معامل تمییز الفقرات بحساب معامل الارتباط بین درجة الفقرة والدرجة الکلیة على المقیاس عندما یقیس سمة أحادیة البعد بعد تحریر الدرجة الکلیة من درجة الفقرة، أو حساب معامل الارتباط بین درجة الفقرة ودرجة البعد بعد تحریر درجة البعد من درجة الفقرة، وذلک عندما یتکون المقیاس من عدة أبعاد، ثم استبعاد الفقرات التی یقل معامل تمییزها عن 0,3، وسُمی هذا التحلیل بأنه تحلیل داخلی لأننا اعتمدنا على الدرجة الکلیة للمقیاس أو البعد کمحک لقیاس قدرة الفقرة على التمییز.

أما الإجراء الثانی لتقدیر الصدق التمییزی للمقیاس فهو التحلیل الخارجی وعلى مستوى الدرجة الکلیة للمقیاس، حیث یتم تصنیف المفحوصین بناءً على درجاتهم الکلیة إلى مجموعتین: واحدة مرتفعة السمة، وأخرى منخفضة السمة، ثم اختیار مقیاس خارجی یقیس السمة نفسها کمحک، وحساب دلالة الفرق بین متوسطی درجات هاتین المجموعتین على الاختبار المحک، وتعد دلالة هذا الفرق دلیلاً على قدرة المقیاس على التمییز، وهو ما یُعرف بالصدق التمییزی. وبشکل آخر یمکن اختیار محک خارجی مناسب، وتصنیف المفحوصین فی ضوئه إلى مجموعتین أو مجموعات متمایزة فی مستوى السمة المستهدفة بالقیاس، ثم حساب دلالة الفروق بین متوسطات درجات هذه المجموعات على المقیاس، وتعد دلالة هذه الفروق دلیلاً على قدرة المقیاس على التمییز.

وبمراجعة إجراءات الطریقة التی أطلق علیها الباحثون "صدق الاتساق الداخلی" نجد أن ذلک المسمى الخطأ یتضمن إجراءً صحیحاً، حیث یتم فی هذه الطریقة حساب معامل الارتباط بین درجة الفقرة والدرجة الکلیة للبعد، أو حساب معامل الارتباط بین درجة الفقرة والدرجة الکلیة للمقیاس، أی حساب معاملات تمییز الفقرات، الذی یسهم بشکل جید فی التحقق من صدق الفقرات، التی تمثل بنیة المقیاس.

وهنا یجب أن نمیز بین هذا "الاتساق الداخلی" المزعم من قبل الباحثین، الذی یجب أن یعاد تسمیته بــ"التحقق من قدرة الفقرات على التمییز"، وبین الاتساق الداخلی کأحد طرق حساب الثبات، الذی یعتمد على إیجاد متوسط معاملات الارتباطات بین کل فقرات المقیاس، وذلک باستخدام معامل ألفا أو کیودر- ریتشاردسون، والذی یمکن أیضاً أن یُستخدم کمؤشر أولی لصدق البناء، لکنه غیر کافٍ؛ لأنه یدل على تجانس الفقرات ولا یدل على کفایتها فی تمثیل المجال المستهدف، فقد تکون جمیع الفقرات متجانسة وتمثل بعداً واحداً، غیر أنها تقیس سمة أخرى مختلفة عن السمة المستهدفة بالقیاس.

الإجابة عن التساؤل الثالث: ما نسبة البحوث التی تعتمد على أدوات قیاس مقننة أو منشورة؟

للإجابة عن هذا التساؤل تم حصر أدوات القیاس التی أعدها الباحثون والأدوات المقننة أو المنشورة فی البحوث التی تم استقراؤها، حیث ظهر أن الباحثین قاموا بإعداد 78 مقیاساً من بین 92 مقیاساً، أی ما یعادل 85 % من المقاییس، وهی نسبة کبیرة، وتعد مؤشراً على عدم جودة البحث التربوی، وبخاصة مع وجود أخطاء فی إجراءات التحقق من ثبات هذه الأدوات وصدقها، فلکیّ یتم الوثوق فی نتائج البحوث لابد من الاعتماد على أدوات قیاس ذات خصائص سیکومتریة جیدة، وهنا یجب الإشارة إلى أن إعداد أدوات القیاس لیس هدفاً فی حد ذاته، لکنه وسیلة لجمع البیانات التی تسهم فی الإجابة عن تساؤلات البحث بأعلى قدر من الصحة والدقة. وقد لاحظت الباحثة أن بعض الباحثین یعیدون حساب صدق وثبات الأدوات المقننة أو المنشورة، وبعضهم لا یقوم بأی إجراء للتحقق من ثبات هذه الأدوات، وکان ینبغی على الباحث الذی تبنى مقیاساً مقنناً أن یقوم بإعادة حساب ثبات درجاته فقط على عینة مماثلة لعینة بحثه؛ لأن ثبات درجات المقیاس مرتبط بعینة البحث فی النظریة الکلاسیکیة للقیاس.

کما أن استخدام مقاییس غیر مقننة یضعف فرصة الاستفادة من نتائج البحث التربوی، والقدرة على تعمیمها؛ لأن نتائج البحث تصبح محددة بالأدوات، وکذلک لا یمکن مقارنة نتائج الدراسات المختلفة.

الإجابة عن التساؤل الرابع: ما الأخطاء الشائعة فی إجراءات التحقق من ثبات أدوات القیاس فی البحوث التربویة؟

للإجابة عن هذا التساؤل تم تصنیف الأخطاء الشائعة فی إجراءات حساب ثبات أدوات القیاس فی البحوث التربویة، ویمکن عرضها فیما یلی:

  1. فی المقاییس المکونة من عدة أبعاد، تم حساب معامل ألفا لدرجة کل بعد دون حسابه للدرجة الکلیة على المقیاس، وفی دراسات أخرى تم حساب معامل ألفا للدرجة الکلیة على المقیاس دون حسابه لدرجة کل بعد.
  2. عند استخدام إعادة التطبیق لم یتم وصف عینة حساب الثبات، أو الفاصل الزمنی، کما تم اختیار الفاصل الزمنی دون ذکرٍ لمعیار اختیار هذا الفاصل، حیث ترواح الفاصل الزمنی بین التطبیقین بین أسبوعین وثلاثة أسابیع، بغض النظر عن طبیعة العینة أو طبیعة السمة المستهدفة بالقیاس، وکذلک تم استخدام على معامل ارتباط بیرسون فی حساب الارتباط بین درجات التطبیقین دون التحقق من شرط اعتدالیة توزیع الدرجات. وتتسق هذه النتیجة مع ما أشارت إلیه دراسة الحازمی (2003)، التی هدفت إلى تقییم الأسالیب الإحصائیة الارتباطیة المستخدمة فی رسائل الماجستیر المقدمة لکلیة التربیة بجامعة أم القرى بمکة المکرمة، حیث لم یجد الباحث أی رسالة حاولت التأکد من توافر افتراضات وشروط مقاییس العلاقة، مثل: مستوى القیاس، وحجم العینة، وتجانسها، وخطیة العلاقة، واعتدالیة التوزیع.
  3. فی الدراسات النادرة التی أجرت التحلیل التفصیلی للفقرات تم دمج إجراءات حساب معاملات الصعوبة ومعاملات التمییز مع إجراءات حساب الثبات.
  4. إجراء التحلیل التفصیلی للفقرات بعد حساب الثبات.
  5. فی بعض الدراسات استخدم الباحث عدة أدوات، ووصف الطریقة المستخدمة لحساب الثبات مکتفیاً بکتابة معامل ثبات واحد فقط.
  6. الدمج بین ثبات الإعادة وثبات الاتساق الداخلی، ففی عدة أبحاث تم إعادة تطبیق الأداة على عینة صغیرة من المفحوصین، ثم تم دمج درجات التطبیقین معاً لحساب ثبات الاتساق الداخلی باستخدام معامل ألفا.
  7. عند استخدام المقاییس المقننة تم الاکتفاء بسرد معلومات الصدق والثبات المنشورة مع  المقاییس، دون إعادة حساب الثبات، على الرغم من أن الثبات مرتبط بالعینة طبقاً للنظریة الکلاسیکیة فی القیاس، ومن ثم یجب إعادة حساب الثبات على عینة استطلاعیة مشابهة لعینة البحث الأساسیة.
  8. عند استخدام الاختبارات الإنشائیة تم إهمال ثبات تقدیرات المحکمین أو المصححین، وتم الاکتفاء بثبات الاتساق الداخلی.
  9. الاعتماد على عینات صغیرة لحساب الثبات، حیث تراوح حجم العینة فی بعض البحوث ما بین 8 و15 مفحوصاً فقط.
  10. حساب الثبات باستخدام معادلة سبیرمان براون للتجزئة النصفیة للمقاییس متعددة الأبعاد، رغم أن استخدام التجزئة النصفیة  یفترض أن الاختبار مکون من  نصفین متکافئین.
  11. إعداد استبانة تضم مجموعتین من الفقرات کل منهما تقیس متغیراً مختلفاً، ثم استخدام الدرجة الکلیة للاستبیان (مجموع درجتی المتغیرین) فی حساب الثبات.
  12. نسب بعض الباحثین الثبات إلى العینة، فقال: "وکان معامل ثبات العینة یساوی ...."، رغم أن الثبات صفة من صفات درجات الاختبار.

الإجابة عن التساؤل الخامس: ما الأخطاء الشائعة فی إجراءات التحقق من صدق أدوات القیاس المستخدمة فی البحوث التربویة؟

للإجابة عن هذا التساؤل تم تصنیف الأخطاء الشائعة فی إجراءات حساب صدق أدوات القیاس، ویمکن عرضها فیما یلی:

1-      استخدام الاتساق الداخلی کطریقة لحساب الصدق، رغم أن الاتساق الداخلی هو أحد طرق حساب الثبات، کما أن إجراءات حسابه تمثلت فی حساب معامل الارتباط بین درجة الفقرة ودرجة البعد أو حساب معامل الارتباط بین درجة الفقرة والدرجة الکلیة، وهو ما یشیر إلى معامل تمییز الفقرة.

2-      بالنسبة لطریقة الصدق المرتبط بالمحتوى، کان هناک قصور فی وصف عینة المحکمین من حیث عددهم وتخصصهم، وعدم ذکر معاییر إجرائیة للتحکیم، وعدم توضیح طریقة معالجة استجابات المحکمین، أو استخدام أی طریقة کمیة للتعبیر عن الصدق المرتبط بالمحتوى.

3-      إطلاق مصطلح "صدق المحکمین" على طریقة الصدق المرتبط بالمحتوى، وأحیاناً لا یتم ذکر اسم الطریقة، ویُکتفى بشرح إجراءاتها.

4-      عند التحقق من الصدق التمییزی للمقیاس، یتم حساب الفروق بین الفئة الأعلى والفئة الأدنى على نفس المقیاس، دون الاستناد لمحک خارجی.

5-      عند التحقق من الصدق التمییزی للمقیاس، لا یتم توضیح الاختبار الإحصائی المستخدم فی مقارنة متوسطات المجموعات.

6-      القصور فی استخدام التحلیل التفصیلی للفقرات، وعند إجرائه لا یتم إعادة التحلیل بعد حذف الفقرات ضعیفة التمییز.

7-      القصور فی استخدام التحلیل العاملی، وفی الدراسة الوحیدة التی استخدمته لم یتم عرض نتائجه، ولم یتم التحقق من شرط مناسبة العینة للتحلیل، فقد تم استخدم عینة من 89 طالباً فقط لاجراء تحلیل عاملی لمقیاس مکون من 52 فقرة.

8-      ذکر أکثر من طریقة لحساب الصدق، ثم استخدام أسلوب واحد وبطریقة خاطئة، کأن یذکر الباحث أنه تم التحقق من الصدق الظاهری وصدق الاتساق الداخلی والصدق البنائی بحساب معاملات الارتباط بین درجة کل مجال والدرجة الکلیة.

9-      عدم التحقق من الجوانب المختلفة لصدق الأدوات، والاکتفاء فی معظم الأحیان بالصدق المرتبط بالمحتوى أو الطریقة المسماة خطأً "الاتساق الداخلی".

وفی ضوء ما ورد فی الإجابة عن التساؤلین الأخیرین یتضح أن نتائج الدراسة الحالیة تتسق مع نتائج دراسة باهی (2011)، التی توصلت إلى أن هناک أخطاء کثیرة فی استخدام المصطلحات العلمیة الخاصة بکل من الثبات والصدق، إذ تم استنساخ العدید من المصطلحات التی لا أساس لها من الصحة.

توصیات الدراسة:

فی ضوء نتائج الدراسة یمکن صیاغة التوصیات الآتیة:

(1)     إعادة النظر فی برامج الدراسات العلیا وتضمینها ساعات کافیة وعملیة تهدف إلى إکساب الدارسین المهارات الضروریة والمعلومات الأساسیة التی تجنبهم الوقوع فی أخطاء إجراءات التحقق من صدق وثبات المقاییس المستخدمة فی البحث التربوی.

(2)إعداد دلیل مبسط لطرق التحقق من صدق وثبات الأدوات المستخدمة فی البحث التربوی ونشره على مواقع المجلات العربیة. 

(3)إعداد مقاییس تقدیر تفصیلیة لتحکیم الأبحاث التربویة قبل قبولها للنشر، فی ضوء الخطوات العلمیة لاختیار أدوات القیاس المناسبة وإعدادها.

(4)إعداد قاعدة بیانات موحدة تحتوی على أدوات القیاس المقننة والمنشورة، واتخاذ الإجراءات المناسبة لتشجیع الباحثین على الاعتماد علیها، بما یضمن تطور مستوى البحث التربوی، ویتیح الفرصة لمقارنة نتائج الدراسات المختلفة، والوصول إلى استنتاجات عامة من خلال منهج التحلیل البعدی.

(5)المراجعة الدوریة للأبحاث المنشورة والوقوف على الأخطاء المنهجیة التی یقع فیها   الباحثون، والمتعلقة باختیار الأدوات المناسبة، وإجراءات التحقق من صدق وثبات المقاییس، واختیار الأسالیب الإحصائیة المناسبة، والتحقق من شروط استخدامها، والتفسیر التصحیح لنتائجها.


قائمة المراجع:

-      باهی، مصطفى حسین إبراهیم. (2011). بعض القضایا الهامة للتحلیل الإحصائی فی البحوث النفسیة والتربویة.  المؤتمر العلمی السنوی العربی السادس - الدولی الثالث - تطویر برامج التعلیم العالی النوعی فی مصر والوطن العربی فی ضوء متطلبات عصر المعرفة: جامعة المنصورة - کلیة التربیة النوعیة، مج 3، ص1388-1412.

-      الحازمی، عبدالعزیز بن إبراهیم بن خلیل. (2003). معاملات الارتباط وعلاقتها بمستویات القیاس: دراسة تقویمیة على رسائل الماجستیر المقدمة لکلیات التربیة جامعة أم القرى بمکة المکرمة، (رسالة ماجستیر غیر منشورة)، جامعة أم القرى، مکة المکرمة.

-      حسن، عزت عبد الحمید محمد. (2016). أخطاء الباحثین والمناقشین الشائعة فى البحوث النفسیة والتربویة.  أعمال مؤتمر: تکنولوجیا التربیة والتحدیات العالمیة للتعلیم: الجمعیة العربیة لتکنولوجیات التربیة، القاهرة، 67 – 85.

-      أبو دنیا، نادیة عبده.(2018). القیاس والتقویم النفسی والتربوی فی العملیة التعلیمیة، الدمام: مکتبة المتنبی.

-      ذبیحی، لحسن، وشوبار، لیاس. (2017). أخطاء شائعة فی البحوث العلمیة. مجلة جیل العلوم الإنسانیة والاجتماعیة: مرکز جیل البحث العلمی، (28)، ص11-23.

-      عبیدات، ذوقان، وعبد الحق، کاید، وعدس، عبد الرحمن. (2003). البحث العلمی "مفهومه أدواته أسالیبه"، القاهرة: دار الفکر.

-      الضوى، محسوب عبد القادر. (2015). استخدام الأسالیب الکمیة فی التحقق من صدق محتوى الاختبار النفسی، مجلة کلیة التربیة- جامعة الاسکندریة، 25(2)، ص21-114.

-      عطیة، محسن علی. (2009). البحث العلمی فی التربیة: مناهجه، أدواته، وسائله الإحصائیة، عمان: دار المناهج للنشر والتوزیع.

-      عفانة، عزو إسماعیل سالم. (2011). أخطاء شائعة فی تصامیم البحوث التربویة لدى طلبة الدراسات العلیا فی الجامعات الفلسطینیة. أعمال مؤتمر البحث العلمی: مفاهیمه، أخلاقیاته، توظیفه: الجامعة الاسلامیة بغزة، ص305–336.

-      علام، صلاح الدین محمود. (2011). القیاس والتقویم التربوی والنفسی، أساسیاته وتطبیقاته وتوجهاته المعاصرة، ط5، القاهرة : دار الفکر العربی.

-      أبو علام، رجاء محمود (2006). مناهج البحث فی العلوم النفسیة والتربویة، ط5 ، القاهرة: دار النشر للجامعات.

-      علی، عماد أحمد حسین، وعبد الحلیم، محمد ریاض أحمد، وحسن، علی صلاح عبدالمحسن. (2013). الممارسات الإحصائیة الخاطئة فی حساب صدق وثبات الأدوات فی الرسائل العلمیة، مجلة کلیة التربیة: جامعة أسیوط، 29(3)، ص324-348.

-      عودة، أحمد سلیمان. (2010). القیاس والتقویم فی العملیة التدریسیة. الأردن: دار إربد، ط4. 

-      ملحم، سامی محمد. (2015). القیاس والتقویم فی التربیة وعلم النفس، ط7، عمان: دار المسیرة.

-      میخائیل، أمطانیوس نایف. (2015). القیاس والتقویم التربوی للأسویاء وذوی الاحتیاجات الخاصة، ط1، عمان: دار الإعصار العلمی للنشر والتوزیع.

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

- American Educational Research Association, American  Psychological  Association & Naional Council of Measurement in Education .(1999). Standards for Educational and Psychological testing. Washinton:  American Educational Research Association.

- Goodwin, L. D., & Leech, N. L. (2003). The meaning of validity in the new standards for educational and psychological testing: Implications for measurement courses. Measurement and Evaluation in Counseling and Development, 36(3), 181-191.

- FONG, M. L., & MALONE, C. M. (1994). Defeating ourselves: Common errors in counseling research. Counselor Education and Supervision, 33(4), 356-362.

- Oluwatayo, J. A. (2012). Validity and Reliability Issues in Educational Research, Journal of Educational and  Social Research, 2 (2), 391-400.

- Baumberger JP1, Bangert AW. (1996) . Research designs and statistical techniques used in the Journal of Learning Disabilities, 1989-1993, retrived from: https://www.ncbi.nlm.nih.gov/pubmed/8732893.

- Bond, T. & Fox, C. (2007). Applying the Rasch model: Fundamental measurement in the human sciences ( 2nd ed.). New Jersey: Lawrence Erlbaum Associates.

- Sijtsma, K. & Molenaar, I. (2002). Introduction to nonparametric item response theory. London: Sage Publications.

- Sheng, Y. & Wikle, C. (2007). Comparing multiunidimens-ional and unidimensional item response theory models. Educational and Psychological Measurement, 67(6), 899-919.

- Harris, D. & Kolen, M. (1986).  Effect of examinee group on equating relationships. Applied Psychological Measurement, 10, 35-43.

- Wainer, H. & Mislevy, R. (2000). Item response theory, item calibration and proficiency estimation. In: H. Wainer, N. Dorans, R. Flaugher, B. Green, R. Mislevy, L. Steinberg & D. Thissen (Eds.), Computerized adaptive testing: A primer (2nd ed., pp. 61-100). London: Lawrence Erlbaum Associates.

- Hambleton R., Swaminathan H. & Rogers, H. (1991). Fundamentals of item response theory. London: Sage Publications.

- Osterlind, S. (1992). Constructing test items. London: Kluwer Academic Publishers.

- Blais, J. & Laurier, M. (1995). The dimensionality of a  placement test from several analytical perspectives. Language Testing, 12(1), 72-98.

- Thorndike, R. (1982). Applied psychometrics. London: Houghton Mifflin Company.

- Jeeva ,R. K.V.( 2016). CONTEMPORARY ISSUES IN TEACHER EDUCATION, retrieved from: https://books.google.com.sa/books?id= g5XDAAAQBAJ&printsec=frontcover&hl=ar#v=onepage&q&f=false.

 

 

قائمة المراجع:
-      باهی، مصطفى حسین إبراهیم. (2011). بعض القضایا الهامة للتحلیل الإحصائی فی البحوث النفسیة والتربویة.  المؤتمر العلمی السنوی العربی السادس - الدولی الثالث - تطویر برامج التعلیم العالی النوعی فی مصر والوطن العربی فی ضوء متطلبات عصر المعرفة: جامعة المنصورة - کلیة التربیة النوعیة، مج 3، ص1388-1412.
-      الحازمی، عبدالعزیز بن إبراهیم بن خلیل. (2003). معاملات الارتباط وعلاقتها بمستویات القیاس: دراسة تقویمیة على رسائل الماجستیر المقدمة لکلیات التربیة جامعة أم القرى بمکة المکرمة، (رسالة ماجستیر غیر منشورة)، جامعة أم القرى، مکة المکرمة.
-      حسن، عزت عبد الحمید محمد. (2016). أخطاء الباحثین والمناقشین الشائعة فى البحوث النفسیة والتربویة.  أعمال مؤتمر: تکنولوجیا التربیة والتحدیات العالمیة للتعلیم: الجمعیة العربیة لتکنولوجیات التربیة، القاهرة، 67 – 85.
-      أبو دنیا، نادیة عبده.(2018). القیاس والتقویم النفسی والتربوی فی العملیة التعلیمیة، الدمام: مکتبة المتنبی.
-      ذبیحی، لحسن، وشوبار، لیاس. (2017). أخطاء شائعة فی البحوث العلمیة. مجلة جیل العلوم الإنسانیة والاجتماعیة: مرکز جیل البحث العلمی، (28)، ص11-23.
-      عبیدات، ذوقان، وعبد الحق، کاید، وعدس، عبد الرحمن. (2003). البحث العلمی "مفهومه أدواته أسالیبه"، القاهرة: دار الفکر.
-      الضوى، محسوب عبد القادر. (2015). استخدام الأسالیب الکمیة فی التحقق من صدق محتوى الاختبار النفسی، مجلة کلیة التربیة- جامعة الاسکندریة، 25(2)، ص21-114.
-      عطیة، محسن علی. (2009). البحث العلمی فی التربیة: مناهجه، أدواته، وسائله الإحصائیة، عمان: دار المناهج للنشر والتوزیع.
-      عفانة، عزو إسماعیل سالم. (2011). أخطاء شائعة فی تصامیم البحوث التربویة لدى طلبة الدراسات العلیا فی الجامعات الفلسطینیة. أعمال مؤتمر البحث العلمی: مفاهیمه، أخلاقیاته، توظیفه: الجامعة الاسلامیة بغزة، ص305–336.
-      علام، صلاح الدین محمود. (2011). القیاس والتقویم التربوی والنفسی، أساسیاته وتطبیقاته وتوجهاته المعاصرة، ط5، القاهرة : دار الفکر العربی.
-      أبو علام، رجاء محمود (2006). مناهج البحث فی العلوم النفسیة والتربویة، ط5 ، القاهرة: دار النشر للجامعات.
-      علی، عماد أحمد حسین، وعبد الحلیم، محمد ریاض أحمد، وحسن، علی صلاح عبدالمحسن. (2013). الممارسات الإحصائیة الخاطئة فی حساب صدق وثبات الأدوات فی الرسائل العلمیة، مجلة کلیة التربیة: جامعة أسیوط، 29(3)، ص324-348.
-      عودة، أحمد سلیمان. (2010). القیاس والتقویم فی العملیة التدریسیة. الأردن: دار إربد، ط4. 
-      ملحم، سامی محمد. (2015). القیاس والتقویم فی التربیة وعلم النفس، ط7، عمان: دار المسیرة.
-      میخائیل، أمطانیوس نایف. (2015). القیاس والتقویم التربوی للأسویاء وذوی الاحتیاجات الخاصة، ط1، عمان: دار الإعصار العلمی للنشر والتوزیع.
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
- American Educational Research Association, American  Psychological  Association & Naional Council of Measurement in Education .(1999). Standards for Educational and Psychological testing. Washinton:  American Educational Research Association.
- Goodwin, L. D., & Leech, N. L. (2003). The meaning of validity in the new standards for educational and psychological testing: Implications for measurement courses. Measurement and Evaluation in Counseling and Development, 36(3), 181-191.
- FONG, M. L., & MALONE, C. M. (1994). Defeating ourselves: Common errors in counseling research. Counselor Education and Supervision, 33(4), 356-362.
- Oluwatayo, J. A. (2012). Validity and Reliability Issues in Educational Research, Journal of Educational and  Social Research, 2 (2), 391-400.
- Baumberger JP1, Bangert AW. (1996) . Research designs and statistical techniques used in the Journal of Learning Disabilities, 1989-1993, retrived from: https://www.ncbi.nlm.nih.gov/pubmed/8732893.
- Bond, T. & Fox, C. (2007). Applying the Rasch model: Fundamental measurement in the human sciences ( 2nd ed.). New Jersey: Lawrence Erlbaum Associates.
- Sijtsma, K. & Molenaar, I. (2002). Introduction to nonparametric item response theory. London: Sage Publications.
- Sheng, Y. & Wikle, C. (2007). Comparing multiunidimens-ional and unidimensional item response theory models. Educational and Psychological Measurement, 67(6), 899-919.
- Harris, D. & Kolen, M. (1986).  Effect of examinee group on equating relationships. Applied Psychological Measurement, 10, 35-43.
- Wainer, H. & Mislevy, R. (2000). Item response theory, item calibration and proficiency estimation. In: H. Wainer, N. Dorans, R. Flaugher, B. Green, R. Mislevy, L. Steinberg & D. Thissen (Eds.), Computerized adaptive testing: A primer (2nd ed., pp. 61-100). London: Lawrence Erlbaum Associates.
- Hambleton R., Swaminathan H. & Rogers, H. (1991). Fundamentals of item response theory. London: Sage Publications.
- Osterlind, S. (1992). Constructing test items. London: Kluwer Academic Publishers.
- Blais, J. & Laurier, M. (1995). The dimensionality of a  placement test from several analytical perspectives. Language Testing, 12(1), 72-98.
- Thorndike, R. (1982). Applied psychometrics. London: Houghton Mifflin Company.
- Jeeva ,R. K.V.( 2016). CONTEMPORARY ISSUES IN TEACHER EDUCATION, retrieved from: https://books.google.com.sa/books?id= g5XDAAAQBAJ&printsec=frontcover&hl=ar#v=onepage&q&f=false.