حجم تأثير الاختبارات الإحصائية المعلمية واللامعلمية المستخدمة في رسائل الماجستير بکلية التربية بجامعة الملک سعود

نوع المستند : المقالة الأصلية

المؤلف

جامعة الملک سعود – کلية التربية – قسم علم النفس

المستخلص

هدفت الدراسة الحالية إلى التعرف على أهم الطرق الإحصائية لحساب حجم التأثير للاختبارات الإحصائية بنوعيها المعلمية واللامعلمية والمستخدمة في رسائل الماجستير بکلية التربية بجامعة الملک سعود، والتعرف على واقع استخدام حجم التأثير، ولتحقيق هدف الدراسة؛ قام الباحث بتفريغ البيانات في نماذج معدة لکل اختبار إحصائي ( تحليل التباين الأحادي، مربع کاي، معامل ارتباط بيرسون، الفروق بين المتوسطات، اختبار مان ويتني، ومعامل الإنحدار المتعدد)، واستخدم الباحث التکرارات والنسب المؤيوة، ومعادلات حجم التأثير وقيم مربع کاي وذلک للإجابة على تساؤلات الدراسة التالية: ما الاختبارات الإحصائية المعلمية واللامعلمية المستخدمة في رسائل الماجستير بکلية التربية بجامعة الملک سعود ؟ ما واقع استخدام حجم التأثير في الاختبارات الإحصائية المعلمية واللامعلمية المستخدمة في رسائل الماجستير بکلية التربية بجامعة الملک سعود ؟ ما أحجام التأثير للاختبارات الإحصائية المعلمية واللامعلمية المستخدمة في رسائل الماجستير بکلية التربية بجامعة الملک سعود؟، واستخدم الباحث المنهج الوصفي المسحي للإجابة على هذه التساؤلات الدراسة، حيث اشتملت عينة الدراسة على 154 رسالة ماجستير، وتوصلت الدراسة إلى النتائج التالية: الأساليب المعلمية من أکثر الأساليب الإحصائية المستخدمة في کلية التربية بجامعة الملک سعود بتکرار بلغ 559 استخداماً ويمثل ذلک 93% تقريباً، وکان اختبار ت من أکثرها شيوعاً بتکرار 256 استخداماً مما يمثل نسبة 43% تقريباً، وأيضاً توصلت الدراسة أن استخدام حجم التأثير کان منخفض بشکل کبير حيث تمثل نسبته 1.3% فقط وبتکرار 2 مرة، وأوصت الدراسة بضرورة حساب حجم التأثير بالطرق المناسبة في البحوث والدرسات العلمية وعدم الإکتفاء فقط بدلالة الاختبارات الإحصائية.
The present study aimed at identifying important statistical procedures used for calculating effect size of parametric and nonparametric tests in master theses registered at Faculty of Education-King Saud University from 1995 to 2008. Moreover, it explored the current usage of effect size and whether this varies according to the methods used (i.e. descriptive or experimental) or the sample sizes (i.e. small, medium, or large. The researcher tried to answer the following questions:

What are the parametric and nonparametric tests used in master theses registered at faculty of Education King Saud University?
What is the current usage of effect size in parametric and nonparametric tests used in master theses registered at Faculty of Education King Saud University?
What are the effect sizes used in parametric and nonparametric tests used in master

theses registered at Faculty of Education King Saud University?
The study results were as follows:
1- The most statistical procedures used at Faculty of Education-King Saud University were
parametric tests (frequency=559, 93.48 %), and the t-test was the most common among
them (frequency=256,42.81%).
2- Effect size was rarely used at Faculty of Education-King Saud University (frequency=2,1.3%).
3-Effectsize for the statistical procedures used at Faculty of Education King Saud University Ranged from small to medium.
The researcher concluded with the following recommendations:

Teaching nonparametric tests and integrating them into courses for postgraduate students.
Encouraging researchers to calculate effect sizes for the statistical procedures used for testing their hypotheses.
Integrating effect size into courses for post graduate students.
In addition to the traditional use of statistical significance, the researcher encourages the inclusion of effect size in the results of published studies.

 
 

الكلمات الرئيسية

الموضوعات الرئيسية


 

 

                             کلیة التربیة

   کلیة معتمدة من الهیئة القومیة لضمان جودة التعلیم

  إدارة: البحوث والنشر العلمی ( المجلة العلمیة)

                 =======

 

 

حجم تأثیر الاختبارات الإحصائیة المعلمیة واللامعلمیة المستخدمة فی رسائل الماجستیر بکلیة التربیة

بجامعة الملک سعود

 

 

إعــــــــــداد

فیصل أحمد العبدالقادر

جامعة الملک سعود – کلیة التربیة – قسم علم النفس

 

 

}     المجلد السادس والثلاثون– العدد الرابع -  أبریل 2020م {

http://www.aun.edu.eg/faculty_education/arabic

الملخص:

هدفت الدراسة الحالیة إلى التعرف على أهم الطرق الإحصائیة لحساب حجم التأثیر للاختبارات الإحصائیة بنوعیها المعلمیة واللامعلمیة والمستخدمة فی رسائل الماجستیر بکلیة التربیة بجامعة الملک سعود، والتعرف على واقع استخدام حجم التأثیر، ولتحقیق هدف الدراسة؛ قام الباحث بتفریغ البیانات فی نماذج معدة لکل اختبار إحصائی ( تحلیل التباین الأحادی، مربع کای، معامل ارتباط بیرسون، الفروق بین المتوسطات، اختبار مان ویتنی، ومعامل الإنحدار المتعدد)، واستخدم الباحث التکرارات والنسب المؤیوة، ومعادلات حجم التأثیر وقیم مربع کای وذلک للإجابة على تساؤلات الدراسة التالیة: ما الاختبارات الإحصائیة المعلمیة واللامعلمیة المستخدمة فی رسائل الماجستیر بکلیة التربیة بجامعة الملک سعود ؟ ما واقع استخدام حجم التأثیر فی الاختبارات الإحصائیة المعلمیة واللامعلمیة المستخدمة فی رسائل الماجستیر بکلیة التربیة بجامعة الملک سعود ؟ ما أحجام التأثیر للاختبارات الإحصائیة المعلمیة واللامعلمیة المستخدمة فی رسائل الماجستیر بکلیة التربیة بجامعة الملک سعود؟، واستخدم الباحث المنهج الوصفی المسحی للإجابة على هذه التساؤلات الدراسة، حیث اشتملت عینة الدراسة على 154 رسالة ماجستیر، وتوصلت الدراسة إلى النتائج التالیة: الأسالیب المعلمیة من أکثر الأسالیب الإحصائیة المستخدمة فی کلیة التربیة بجامعة الملک سعود بتکرار بلغ 559 استخداماً ویمثل ذلک 93% تقریباً، وکان اختبار ت من أکثرها شیوعاً بتکرار 256 استخداماً مما یمثل نسبة 43% تقریباً، وأیضاً توصلت الدراسة أن استخدام حجم التأثیر کان منخفض بشکل کبیر حیث تمثل نسبته 1.3% فقط وبتکرار 2 مرة، وأوصت الدراسة بضرورة حساب حجم التأثیر بالطرق المناسبة فی البحوث والدرسات العلمیة وعدم الإکتفاء فقط بدلالة الاختبارات الإحصائیة.

الکلمات المفتاحیة: الأسالیب الإحصائیة، الدلالة الإحصائیة، حجم التأثیر کوهین،         الدلالة العملیة

 

 

 

 

 

 

 

 

Abstract

The present study aimed at identifying important statistical procedures used for calculating effect size of parametric and nonparametric tests in master theses registered at Faculty of Education-King Saud University from 1995 to 2008. Moreover, it explored the current usage of effect size and whether this varies according to the methods used (i.e. descriptive or experimental) or the sample sizes (i.e. small, medium, or large. The researcher tried to answer the following questions:

  • What are the parametric and nonparametric tests used in master theses registered at faculty of Education King Saud University?
  • What is the current usage of effect size in parametric and nonparametric tests used in master theses registered at Faculty of Education King Saud University?
  • What are the effect sizes used in parametric and nonparametric tests used in master

theses registered at Faculty of Education King Saud University?

The study results were as follows:

1- The most statistical procedures used at Faculty of Education-King Saud University were

parametric tests (frequency=559, 93.48 %), and the t-test was the most common among

them (frequency=256,42.81%).

2- Effect size was rarely used at Faculty of Education-King Saud University (frequency=2,1.3%).

3-Effectsize for the statistical procedures used at Faculty of Education King Saud University Ranged from small to medium.

The researcher concluded with the following recommendations:

  • Teaching nonparametric tests and integrating them into courses for postgraduate students.
  • Encouraging researchers to calculate effect sizes for the statistical procedures used for testing their hypotheses.
  • Integrating effect size into courses for post graduate students.
  • In addition to the traditional use of statistical significance, the researcher encourages the inclusion of effect size in the results of published studies.

 


المقدمة:

         یحتل علم الإحصاء أهمیة خاصة بین العلوم المختلفة سواء کانت طبیعیة أو إنسانیة أو اجتماعیة وذلک لأنه یتعامل مع الحاجات الإنسانیة والعلمیة فی مختلف مستویاتها وبأسالیب متنوعة بدءاً من البساطة التی تصف معلومات أولیة (بیانات إحصائیة) وصولاً إلى أسالیب أکثر تعقیداً وتطوراً لتحلیل البیانات ذات الصلة بوصف وتفسیر الظواهر والأحداث وعلاقتها مع بعضها والتنبؤ بها والسیطرة علیها فی ضوء القوانین التی تحکمها  ( الجادری ، 2003 ) .

ویعرف علم الإحصاء بأنه ذلک الفرع من العلوم الذی یختص بالطرق العلمیة لجمع البیانات و تنظیمها و تلخیصها و عرضها وتحلیلها وذلک للوصول إلى نتائج مقبولة تؤدی إلى اتخاذ قرارات سلیمه  (بری وهندی والحسینی ، 1998) ، ویوجد نوعان من الإحصاء ،           أولهما ما یسمى بالإحصاء المعلمی (البارامتری ( parametric ) والذی یهتم بالبیانات          الرقمیة الحقیقیة للمتغیرات لدى عینات کبیرة الحجم ممثلة للمجتمع الأصلی الذی          سحبت منه ، کما تتمتع باعتدالیة توزیعها (أبو زید ، 2002) ، وثانیهما الإحصاء            اللامعلمی ) اللابارامتریNonparametric (  وهو الإحصاء الذی یتحرر من القیود المسبقة لشکل التوزیع التکراری وحجم العینة وتصلح لمستویات القیاس التی لا یصلح لها الإحصاء المعلمی  وخاصة المقاییس التی تعتمد على تصنیف الأفراد أو ترتیبهم تنازلیاً أو تصاعدیاً ولکن الإحصاء اللامعلمی أقل دقة من الإحصاء المعلمی  (منسی ، 1989).

ومن الملاحظ أن بعض الباحثین یعتمدون فی تقریر نتائجهم على الدلالة الإحصائیة دون محاولة الکشف عن مقدار العلاقة القائمة بین المتغیرین ، وتصبح هناک مغالاة فی تفسیر النتائج اعتماداً على مستوى الدلالة على الرغم من أنه ربما لا تکون لها قیمة من الناحیة التطبیقیة أو العملیة ، ولذلک فإذا وجد الباحث أن القیمة دالـة إحصائیاً ، فمعنى ذلک أن المتغیر المستقل له تأثیر على المتغیر التابع ، ولکنه لا یدل على حجم التأثیر أو درجـة العلاقـة بین المتغیرین . وربما کانت الدلالـة الإحصائیة هنا لا تعنی وجود علاقـة قویة بین المتغیریـن (الشربینی ، 1995) .

وفی دراسة ( بابطین ،2002 ) عن مشکلات الدلالة الإحصائیة فی البحث التربوی والحلول البدیلة لها ، توصل إلى أن أهم مشکلات اختبارات الدلالة الإحصائیة فی البحث التربوی هی : استخدام نتائج الدلالة الإحصائیة کتفسیر لأهمیة النتائج و لتأثیر المعالجة ، واستخدام قیمة الإحتمالیة (p) لتقدیر حجم التأثیر وکتفسیر لاحتمالیة الفرضیة الصفریة نفسها ، ولتقویم إعادة النتیجة  ، إضافة إلى التحیز Biasing  للنتائج الدالة إحصائیا ً ، وصیاغة التساؤلات البحثیة والفرضیات ، والطبیعة الثنائیة لنتائج اختبار الدلالة الإحصائیة .کما توصلت الدراسة إلى أن أهم المفاهیم والأسالیب الإحصائیة التی یمکن أن تقدم حلولاً لمشکلات الدلالة الإحصائیة فی البحث التربوی هی : تحلیل القوة الإحصائیةPower analysis ، وتقدیر حجم التأثیر ، بینما یرى کوهین بأن فکرة حجم التأثیر Effect Size تعتمد على الفروق بین المتوسطاتMean Differences  وذلک باستخدام الانحراف المعیاریSD بین المتغیرات المستقلة من جهة والمتغیرات التابعة من جهة أخرى عن طریق استخراج حجم تباین المتغیر التابع الذی یمکن تفسیره عن طریق المتغیر المستقل کما هو الحال فی تحلیل التباین. (أبو هاشم ، 2005) ، ویدل حجم التأثیر على  مدى تأثیر المتغیر المستقل على المتغیر التابع موضع الاهتمام ، وهو الدلالة العملیة للنتائج (مراد ،2000) .

وکانت الدلالة العملیة لحجم التأثیر محل اهتمام کثیر من الباحثین حیث أکد کل من :(Welge,p.1990;Galaraza,etal.,1993;Olejnik,&Algina,2000;Haase,2001 ;Roberts,&Henson,2002; Thompson , 2002 ) على أهمیة حجم التأثیر      واعتباره من المحکات الأساسیة لاختبار الدلالة الاحصائیة بقصد الاستفادة من نتائجها بصورة عملیة.، هذا وقد أکدت لجنة الاستدلال الاحصائى التابعة للرابطة الأمریکیة لعلم النفس             APA على ضرورة حساب حجم التأثیر فی البحوث المنشورة فی دوریاتها العلمیة ، ووصف البحوث التی تستخدم هذا الأسلوب بالبحوث العلمیة الجیدة. (( Bird, 2002

مشکلة الدراسة

           إن الترکیز فی معظم الدراسات والبحوث النفسیة والتربویة فی البلاد العربیة على الدلالة الإحصائیة , احتمالیة رفض الفرضیة الصفریة باستخدام الأسالیب الإحصائیة المناسبة وإغفال حجم التأثیر( مدى قدرة الباحث على استخدام النتائج المتحصل علیها تفسیراً أو تطبیقاً ) أدى إلى التقلیل من قیمة نتائج الدراسات وأحیاناً إلى تضلیلها فالدلالة الإحصائیة شرط ضروری لقبول الفرض أو رفضه ولکنه لیس کافیاً فی الحکم على قیمة تأثیر المتغیر المستقل على المتغیر التابع، ومن هنا تبلورت  مشکلة الدراسة فی التعرف على واقع استخدام حجم تأثیر الاختبارات الإحصائیة المعلمیة واللامعلمیة فی رسائل الماجستیر بکلیة التربیة بجامعة         الملک سعود.

أسئلة الدراسة

 سعت هذه الدراسة إلى الإجابة عن التساؤلات التالیة:

  • ما الاختبارات الإحصائیة المعلمیة واللامعلمیة المستخدمة فی رسائل الماجستیر بکلیة التربیة بجامعة الملک سعود ؟ 
  • ما واقع استخدام حجم التأثیر فی الاختبارات الإحصائیة المعلمیة واللامعلمیة المستخدمة فی رسائل الماجستیر بکلیة التربیة بجامعة الملک سعود ؟
  • ما أحجام التأثیر للاختبارات الإحصائیة المعلمیة واللامعلمیة المستخدمة فی رسائل الماجستیر بکلیة التربیة بجامعة الملک سعود؟

أهداف الدراسة :

تسعى هذه الدراسة إلى تحقیق الأهداف التالیة:

  1. الکشف عن الاختبارات الإحصائیة المعلمیة واللامعلمیة المستخدمة فی رسائل الماجستیر بکلیة التربیة بجامعة الملک سعود
  2. التعرف على  أحجام التأثیر المستخدمة فی الاختبارات الإحصائیة المعلمیة واللامعلمیة فی رسائل الماجستیر بکلیة التربیة بجامعة الملک سعود.
  3. القیام بحساب أحجام التأثیر للاختبارات الإحصائیة المعلمیة واللامعلمیة المستخدمة فی رسائل الماجستیر.

أهمیة الدراسة:

تکمن أهمیة الدراسة فیما یلی:

  •  الدراسة الحالیة تعد من الدراسات القلیلة التی تناولت البحث عن مدى استخدام الباحثین لحجم التأثیر فی اختباراتهم الإحصائیة المعلمیة واللامعلمیة على مستوى رسائل الماجستیر بالمملکة العربیة السعودیة.
  • تعریف الباحثین بأهمیة حساب حجم التأثیر وعدم الاعتمادعلى الدلالة الإحصائیة فقط ، مما یسهم بتحسین جودة الدراسات والبحوث فی الوطن العربی، وزیادة التطبیقات العملیة لنتائج البحوث فی المجال النفسی والتربوی.

حدود الدراسة:

تتمثل محددات الدراسة بما یلی:

  • الحدود الموضوعیة: رکزت الدراسة الحالیة على  التعرف على واقع استخدام الباحثین لحجم تأثیر الاختبارات الإحصائیة المعلمیة واللامعلمیة.
  • الحدود المکانیة: اقتصرت الدراسة الحالیة على رسائل الماجستیر المقدمة من طلاب وطالبات کلیة التربیة بجامعة الملک سعود بمنطقة الریاض فی التخصصات التالیة            ( علم النفس – المناهج – الوسائل – الإدارة التربویة – التربیة البدنیة – التربیة – التربیة الخاصة).
  • الحدود الزمانیة: اقتصرت الدراسة الحالیة على رسائل الماجستیر خلال الفترة مابین 1414 هـ - 1428 هـ.

 مصطلحات الدراسة:

  1. حجم التأثیرEffect Size : هو عبارة عن قیمة کمیة تشیر إلى درجة العلاقة بین متغیرات الدراسة ضمن مجتمع محدد مسبقاً هو مجتمع الدراسة، بغض النظر عن الأسلوب الإحصائی المستخدم للتعبیر عن ذلک الأثر ( نصار، 2002 ) ویعرفه هاس Haase  بأنة مقدار التباین فی المتغیر التابع الذی یمکن تفسیره من خلال  متغیر مستقل یرتبط أو یؤثر فیه .( النجار، 2005 )
  2. الإحصاء المعلمی البارامتری :  Parametric Statistics: أی الطرق الإحصائیة التی تتطلب تحقق افتراضات معینة حول المجتمع الذی تسحب منه العینة ومن هذه الافتراضات أن یکون توزیع المجتمع طبیعیاً , وتجانس التباین , والعینات العشوائیة  . ومن الأمثلة على الطرق الإحصائیة المعلمیة اختبار ( ت ) المستخدم للمقارنة بین المتوسط الحسابی لمجموعتین . واختبار ( ف ) المستخدم فی المقارنة بین المتوسط الحسابی لعدة مجموعات         ( مراد ، 2000).
  3.  الإحصاء اللامعلمی  اللابارامتری : non- Parametric Statistics : وهی نوع من الطرق الإحصائیة الاستدلالیة التی یمکن باستخدامها التوصل إلى استنتاجات بشأن المجتمع فی ضوء العینة بغض النظر عن نوع التوزیع النظری لذلک المجتمع أو الطریقة التی تستخدم فی اختیار العینة ومن الأمثلة على الطرق الإحصائیة اللامعلمیة إختبار مان وتنی – ولکوکسن – وکندال ( توفیق ، 1985 ).

الإطار النظری:

الإحصاء المعلمى Parametric Statistics هو أحد أنواع الأسالیب الإحصائیة الاستدلالیة Inferential Statistics التی تهتم بالکشف والاستدلال على المجتمع اعتمادا ً على ما توافر من بیانات لدى الباحث خاصة بالعینة المأخوذة من هذا المجتمع ، کما تتناول أسالیب اتخاذ القرارات الإحصائیة .وعند إستخدام الإحصاء المعلمى  فلابد من التنبه إلى أنه یستخدم فی حالة العینات الکبیرة التی یشترط فیها توفر المعلومات عن مجتمعاتها ( معلمات الأصل ) مثل : أن یکون توزیع البیانات توزیعا ً إعتدالیا ً ، تجانس التباین ، العینات العشوائیة ، خطیة العلاقة ، واستقلال العینات ، وغیرها ، ویستخدم فقط مع البیانات التی تکون عددیة حقیقیة ، أى مع البیانات التی تکون من نوع النسبة أو المسافة ( الدردیر ، 2006)

ومن أشهر الأسالیب الإحصائیة المعلمیة اختبار ت  t-test والذی یقوم على افتراض أن العینة المسحوبة من مجتمع إحصائی توزیعه معتدل أو قریب من الاعتدال . بناءً على ذلک یستطیع الباحث استخدام توزیع t لإجراء اختبارات الفروض وإیجاد حدود الثقة لمتوسط المجتمع أو الفرق بین متوسطین عندما تکون أحجام العینات صغیرة وتباینات المجتمعات مجهولة . أما إذا کان توزیع المجتمع الأصلى الذی سحبت منه العینة بعیدا ً عن الاعتدال بدرجة کبیرة فمن الأفضل استخدام الإختبارات اللامعلمیه لإجراء اختبارات الفروض ( تشاو ،  1990) وفی أحیان کثیرة نحتاج إلى اختبار تساوى عدة مجتمعات طبیعیة و لیس اثنین فقط  لهذا  تصبح طریقة اختبار t  مطولة و تستغرق وقتا ً أکثر حیث یجب علینا اختبار کل مجتمعین على حدة ، ومن ثم الاستنتاج فیما إذا کانت متوسطات المجتمعات متساویة أم لا  ( سلیم و أبو حویج ، 2004) لهذا اقترح السیر رونلاد فیشر Fisher أسلوبا ً إحصائیا ً یمکنه عقد هذه المقارنات فی أن واحد وأطلق علیه تحلیل التباین Analysis of Variance (ANOVA) . وقد کان لـــبیرت Burt الریادة فی تطبیق هذا الأسلوب فی العلوم النفسیة و التربویة وهناک أشکال لتحلیل التباین تتوقف على عدد المتغیرات المستقلة و التابعة (الشربینى ، 1995 ).

ومن الأسالیب الإحصائیة المعلمیة مفهوم الانحدار Regression والذی یدل على مدى تأثر قیم المتغیر التابع بالتغیر الذی یطرأ على قیم المتغیر المستقل ویستخدم أیضاً فی التنبؤ بقیم المتغیر التابع نتیجة للتغیر الحاصل فی المتغیر المستقل. وللتمییز بین الارتباط والانحدار بشکل أساسی فالارتباط یبین قوة العلاقة بین متغیرین أما الانحدار فیدرس إمکانیة التنبؤ من المتغیر المستقل بالمتغیر التابع . ( أبو زید ، 2005) . أما فی تحلیل الانحدار المتعدد فهو یمکن الباحث من تحلیل العلاقات بین متغیر تابع ( لا بد أن یکون کمیاً )  ومتغیرین مستقلین أو أکثر , والتنبؤ بقیم المتغیر التابع بمعلومیة قیم المتغیرات المستقلة . وبالطبع یکون التنبؤ باستخدام المتغیرات المستقلة مجتمعة أفضل من التنبؤ باستخدام أی منها على حدة بشرط أن یکون الارتباط بین هذه المتغیرات المستقلة منخفضاً وأرتباط کل منها بالمتغیر التابع مرتفعاً.

أما الاختبارات اللامعلمیة فهی تستخدم فی الحالات التی لا یکون فیها نوع التوزیع الاحتمالی للمجتمع الأصل الذی سحبت منه العینة معروفا ً أو فی حالة عدم استیفاء شرط کون التوزیع النظری للمجتمع طبیعیا ً. وهناک العدید من الاختبارات اللامعلمیة التی تستخدم فی التحقق من صحة الفروض الإحصائیة التی لا تتأثر بشکل التوزیع للمجتمع الأصل ولا بضرورة الاختیار العشوائی للعینة المستخدمة فی البحث. ومن هذه الاختبارات اللامعلمیة ما توصل إلیه کارل بیرسون عام 1900 حیث توصل لأسلوب مربع کاى لاختبار الفروض  وهو طریقة لتحدید ما إذا کانت الفروق بین التکرارات النظریة والملاحظة فی أی عدد من الأقسام یمکن إرجاعها منطقیا ً إلى اختلافات فی اختیار العینات  ( سمیث ،1985) . ویرتبط توزیع χ2 بدرجة کبیرة بعدد درجات الحریة . ویعتبر هذا التوزیع متصلاً ذا قمة واحدة ، کما هو الحال مع التوزیع الطبیعی وتوزیع t ، ولکنهما یختلفان عن توزیع χ2  فی أنهما متماثلان حول وسطهما الحسابی μ  . ویعتبر توزیع χ2  توزیعا ً ملتویا ً جهة الیمین و خصوصا ً عندما تکون درجات الحریة df  صغیرة   ( عودة ، القاضی ، 2002) .

ومن ضمن الاختبارات اللامعلمیة ما قام به کل من عالمی الریاضیات الروسیین کولموجروف وسمیرنوف وذلک بتطویر اختبار یمکن أن یستخدمه الباحث فی التحقق من حسن المطابقة بین توزیعیین أحدهما توزیع تجریبی لدرجات عینة و الآخر توزیع نظری محدد . ونعنى بذلک التحقق مما إذا کانت درجات التوزیع التجریبی تعد بمثابة عینة مستمدة من المجتمع الذی تتوزع فیه الدرجات بحسب التوزیع النظری المحدد. ویعتمد هذا الاختبار على المقارنة بین التوزیع التکراری المتجمع الذی یمکن الحصول علیه من التوزیع النظری. والتوزیع التکراری المتجمع التجریبی وذلک لتحدید أکبر اختلاف بینهما واختبار ما إذا کان هذا الاختلاف یمکن عزوه إلى الصدفة ( علام ، 1993)

ومن أکثر الاختبارات اللامعلمیة استخداما ً اختبار " مان - ویتنی" لعینتین مستقلتین وخاصة فی البحوث والدراسات التی یکون فیها المتغیر التابع من النوع الرتبی أو یکون من النوع الفتری . ویرید الباحث تجنب الافتراضات المتعلقة بالاختبار المعلمی المقابل أی اختبار لعینتین مستقلتین کاعتدال توزیع المجتمعین أو تجانس التباین فیهما. الافتراض الوحید لهذا الاختبار هو عدم وجود رتب مکررة فی البیانات ( ماضی ، عثمان ،  2005  ).

ویُعد الإحصاء المعلمى أدق وأکثر کفاءة من الإحصاء اللامعلمى ، کما أنه أکثر حساسیة لخصائص البیانات التی یتم جمعها ، کما أنه یوفر فرصة ضئیلة لحدوث الخطأ من النوع الأول Type I error والخطأ من النوع الثانى Type II error ، ویؤخذ على الاختبارات المعلمیة بأنها أکثر صعوبة عند حسابها ، بالإضافة إلى محدودیة نوع البیانات التی یمکن اختبارها بواسطة تلک الاختبارات و تستغرق وقتا ً وجهدا ً فی تطبیقها ولکن مع توفر البرامج الإحصائیة مثلSPSS   أمکن التغلب على هذه السلبیات.

حجم التأثیر Effect Size

المتتبع لکثیر من البحوث والدراسات یجد بأن بعض الباحثین یعتمدون فی تقریر نتائجهم على الدلالة الإحصائیة دون محاولة الکشف عن مقدار العلاقة القائمة بین المتغیرین، وتصبح هناک مغالاة فی تفسیر النتائج اعتماداً على مستوى الدلالة على الرغم من أنه ربما لا تکون لها قیمة من الناحیة التطبیقیة أو العملیة، ولذلک فإذا وجد الباحث أن القیمة دالـة إحصائیاً، فمعنى ذلک أن المتغیر المستقل له تأثیر على المتغیر التابع ، ولکنه لا یدل على حجم التأثیر أو درجـة العلاقـة بین المتغیرین . وربما کانت الدلالـة الإحصائیة هنا لا تعنی وجود علاقـة قویة بین المتغیریـن (الشربینی ، 1995) .

ویعد مفهوم حجم التأثیر  Effect Size من الأسالیب التی یتم من خلالها          معرفة حجم الفرق أو حجم العلاقة بین متغیرین أو أکثر. ویسمى أحیانا الدلالة العملیة Practical Significance  ویطلق علیه أیضا مقاییس قوة التأثیر Strength of effect Measures، وقوة الترابط Association  . (أبو حطب وصادق ، 1991).

ویعّرف (Cohen,1992) حجم التأثیر على أنه " درجة تواجد ظاهرة ما فی مجتمع محدد أو هو درجة احتمالیة أن تکون الفرضیة الصفریة خاطئة ، بینما یعّرفه ( نصار ,2002) على أنه " قیمة کمیة تشیر إلى درجة العلاقة بین متغیرات الدراسة ضمن مجتمع محدد مسبقا ً هو مجتمع الدراسة ، بغض النظر عن الأسلوب الإحصائى المستخدم للتعبیر عن ذلک التأثیر " . و یعّرفه هاس Hays بأنه " مقدار التباین فی المتغیر التابع الذی یمکن تفسیره من خلال متغیر مستقل یرتبط به أو یؤثر فیه " ( النجار ، 2005).

     ویشیر حجم التأثیر إلى مدى قوة أو ضعف الفرض الصفری . وعندما تتوافق البیانات          ( التی تم الحصول علیها من خلال التجریب) تماما ً مع الفرض الصفری , تصبح القیمة المناظرة لحجم التأثیر = صفر . وتبتعد قیمة حجم التأثیر عن الصفر , عندما ینتج عن التجربة بیانات غیر متوافقة مع الفرض الصفری(Snyder & Lawson,1993) ویرى  Robey,2004 بأن حجم التأثیر یشیر إلى مدى قابلیة تفسیر المتغیر التابع فی ضوء           المتغیر المستقل .

ویلخص منصور (1997) الآراء المختلفة حول مفهوم حجم التأثیر فی النقاط التالیة:

أ‌.      أن أسالیب حجم التأثیر هی الوجة المکمل للاختبارات الإحصائیة بمستویات دلالاتها المختلفة . فالأولى تتحدث عن حجم التأثیرات وقوة الترابط بصرف النظر عن الثقة التی توضع فی هذا الحجم. والثانیة تعبرعن الثقة فی النتائج بصرف النظر عن حجمها.

ب‌. أن أسالیب حجم التأثیر لا تتأثر بحجم العینة على حین نجد أن مستویات الدلالة الإحصائیة للاختبارات الإحصائیة تتأثر بحجم العینة.

ت‌.  أن معامل الارتباط هو حلقة الوصل بین الأسلوبین الدلالة الإحصائیة وحجم التأثیر، فحجم المعامل بصرف النظر عن حجم العینة المبنی علیها هو حجم تأثیر وقوة ترابط أما دلالاتها إحصائیاً فتتوقف على علاقة هذا الحجم بمقدار حجم العینة.

ث‌. أن معظم اختبارات الدلالة الإحصائیة یمکن تحویلها إلى مقاییس لحجم التأثیر.

ولقد أدى قیاس الدلالة الإحصائیة إلى تفکیر الباحثین فی معنى النتائج التی یتم التوصل إلیها ،  وأن الاقتصار على استخدام قیاس الدلالة الإحصائیة فی اتخاذ القرارات ینجم عنه الکثیر من المشکلات ، فالاعتماد البسیط علیها و زیادة استخدام تحلیل القوة وتقدیرات حجم التأثیر قد یسهم فی التحسن الکلی لجودة البحوث . کما أن الباحثین الأکثر خبرة بفوائد و عیوب الدلالة الإحصائیة وحجم التأثیر وتحلیل القوة هم من المحتمل أن یکونوا أکثر قدرة على صیاغة تفسیرات مفیدة حول جدوى نتائج بحوثهم (Huston,1993) .

ومن الملاحظ أن بعض الباحثین یعتمدون فی تقریر نتائجهم على الدلالة الإحصائیة           دون محاولة الکشف عن مقدار العلاقة القائمة بین المتغیرین ، وتصبح هناک مغالاة فی تفسیر النتائج اعتمادا ً على مستوى الدلالة على الرغم من أنه ربما لا تکون لها قیمة من الناحیة النتطبیقیة أو العملیة . ولذلک ، إذا وجد الباحث أن القیمة دالة إحصائیا ً ، فمعنى ذلک أن المتغیر المستقل له تأثیر على المتغیر التابع ، و لکنه لا یدل على حجم التأثیر أو درجة العلاقة بین المتغیرین ، وربما کانت الدلالة الإحصائیة هنا لا تعنى وجود علاقة قویة بین المتغیرین                   (الشربینى ، 1995).

ویمکن أن تکون الدلالة الإحصائیة مضللة ، وأنه من المهم الرجوع إلى حجم التأثیر فی تقویم نتائج أیة تجربة ، حیث تخبرنا أحجام التأثیر عن مقدار التأثیر فی حین أن الدلالة الإحصائیة لا تخبرنا عن ذلک (Wright,2003) .

ویعتمد الکثیر من الباحثین على الاجراء الاحصائى التقلیدى المتمثل فی المقارنة بین المجموعة التجریبیة (E)   ونظیرتها الضابطة (C) عند فحص فعالیة بعض المعالجات التطبیقیة . ویعد حجم التأثیر (ES) - أو متوسط الفروق المعیاریة Standardized Mean Differences - بمثابة مؤشر لدرجة التأثیر بغض النظر عن أداة القیاس المستخدمة . ولأنه بارامتر طبیعى Natural Parameter , یفید ذلک المؤشر فی تحقیق الدمج بین العدید من النتائج المستمدة من تجارب مختلفة. 2002)  Bayarri & Mayoral ) .

وخلال العقود الماضیة ، ازداد عدد الأبحاث المنشورة التی تنتقد بدورها استخدامات الاختبارات الإحصائیة ، وقد ظهر ذلک الاهتمام واضحا فی الکثیر من العلوم ، وبالأخص علم النفس (Anderson ,Burnham & Thompson,2000) . وفی نفس الوقت أکد عدد من الباحثین على أهمیة الإشارة إلى حجوم التأثیر و تفسیرها عند صیاغة نتائج و بیانات الدراسة المراد نشرها فی الدوریات العلمیة (Huberty,2002).

واستجابة للمقالات النقدیة المنشورة بخصوص اختبارات الدلالة الإحصائیة قام مجلس إدارة الشئون العلمیة برابطة علم النفس الأمریکی (APA) بتشکیل لجنة الاستدلال الاحصائى التی نشرت تقریرها (Wilkinson ,1999) حیث اشتمل على بعض التوصیات المرتبطة بالمناقشة الحالیة لکیفیة حساب أحجام التأثیر، ویؤکد الاصدار الخامس من دلیل الرابطة الأمریکیة لعلم النفس (APA 2001) على أهمیة کتابة التقاریر بشأن حجم التأثیر:

"لکى یفهم القارىء تماماً أهمیة نتائج الدراسة العلمیة  لابد من احتوائها على بعض مؤشرات حجم التأثیر أو قوة العلاقة فی تلک النتائج . ویمکن تقدیر حجم ذلک التأثیر أو قوة هذه العلاقة بواسطة العدید من الطرق والأسالیب الاحصائیة . والقاعدة الأساسیة هی عدم الاکتفاء بتزوید القارىء بمعلومات عن الدلالة الاحصائیة فقط , بل یجب تقدیم المزید من المعلومات التی تساهم بدورها فی قیاس حجم التأثیر أو العلاقة الملحوظة "

وحالیاً  تتطلب سیاسات التحریر لـ 17 من الدوریات العلمیة التی تنشرها رابطة APA کتابة تقاریر بشأن حجوم التأثیر  بما فیها دوریة Educational and Pyschological Measurement وغیرها من الدوریات الأخرى التی تنشرها رابطة الارشاد النفسى الامریکیة American Counseling Association و الرابطة الامریکیة للأبحاث التربویة American Educational Research Association  ومجلس الأطفال الموهوبین Counsil for Exceptional Children. (Bird,2002)

     ولقد أورد هوستن Huston  عدداً من الممیزات لمقاییس الدلالة العملیة  ( حجم التأثیر)             ( محمود 2003 ) :

  • تعطی تقدیراً لدرجة وجود الظاهرة فی المجتمع وذلک من خلال قیمة على مقیاس متصل یبدأ من صفر حقیقی ( یعنی غیاب الظاهرة ) ویمتد لیقدم قیمة لحجم التأثیر لهذه الظاهرة .
  • تعطی قیمة محددة تشکل محکاً لوصف حجم التأثیر بأنه صغیر أو متوسط أو کبیر
  • یمکن استخدام نتائجها کمقیاس کمی للمقارنة بین دراستین.
  • یمکن استخدامها فی تحلیل القوة لتقدیر حجم العینة اللازمة لدراسة ما.

     کما أضاف کل من بارکر وهاجان 2007 ( Parker and Hagan )  ممیزات أخرى  لحجم التأثیر:

  1. مقیاس موضوعى لقوة التدخل Intervention Strength  و ذلک فی حالة صدق وقوة التصمیم التجریبى.
  2. مؤشر له تدریج مستمر Continuous Scale , وبالتالى یدعم القرارات التدریجیة فی المعالجة الاحصائیة .
  3.  مقیاس دقیق خصوصاً فی حالة النتائج الصغیرة و غیر الواضحة .
  4. ملخص موضوعى فی حالة عدم الاتفاق على الأحکام البصریة بشأن الرسوم البیانیة.
  5. طریقة للمقارنة بین النجاحات المختلفة للتدخل عبر أبحاث دراسة الحالة , سواء کان التحلیل أنیاً أو بعدیاً  .
  6.  مقیاس معتمد فی أبحاث دراسة الحالة بالمقارنة ً مع التقالید البحثیة الأخرى .
  7.  طریقة فعالة لتوثیق النتائج .
  8.  مقیاس جید لاستقلالیة النتائج , خصوصاً عند استخدام فترات الثقة .

اتجه بعض الباحثین فی الإحصاء التربوی والنفسی  إلى صیاغة مؤشرات إحصائیة خاصة بحساب الدلالة العملیة وذلک بقصد تعزیز القرار الإحصائی وتحسین من جودة البحوث، ولقد قام  لیمور وروتو and Rotou Elmore (2001) مؤخرا ً بتسمیة 61 من أحجام التأثیر فی الدراسات السلوکیة المختلفة .

وتم توصیف الکثیر من مؤشرات حجم التأثیر. و مع ذلک  فی التاریخ الحدیث         لنظریات الإحصاء  بُذلت جهود أکبر فی الحصول على قیم P values   دقیقة مما تم تخصیصه بشأن تطویر مؤشرات حجم  التأثیر . وهکذا ظلت هناک العدید من الإجراءات الإحصائیة التی لم تساهم فی تحدید مؤشر قیاسى أو نموذجى لحجم التأثیر ( کما هو الحال فی الکثیر من الاجراءات الخالیة من التوزیعات الحرة Distribution-free أو تلک اللابارامتریة )  (Rosnow and Rosenthal and Rubin ,2000) .

ویتفق کل من ماکسویل و دیلانى Maxwell & Delaney 2004 ) )                     و(أبو هاشم 2005) أن هناک نوعین من مؤشرات حجم التأثیر هما :

أ‌.      المؤشرات التی تدل على مقدار التأثیر فی الدراسات التی تبحث الفروق  وتهتم هذه المؤشرات بالتأثیر الذی یحدثه المتغیر المستقل فی المتغیر التابع ، وتستخدم الاختبارات الإحصائیة التی تبحث بدورها الفروق بین متوسطات درجات المجموعات . و تتصف بأن لها بنیة مشترکة تتمثل فی التغیر نتیجة الفروض الخاصة بالتباین فی ضوء                  الخطأ المعیارى . ومن أمثلتها :  }مؤشر کوهن f²  (Cohen,1988) ، مؤشر جلاس Δ  (Glass,1976) , مؤشر هدجزg  (Hedges,1981)  ، مؤشر کوهنd  (Cohen,1988)  {.

ب‌.  المؤشرات التی تدل على مقدار التأثیر فی الدراسات الارتباطیة و التنبؤیة على الرغم من وجود أنواع مختلفة من معاملات الارتباط نتیجة اختلاف نوع المعامل المستخدم تبعا ً لطبیعة البیانات ، إلا أن معامل ارتباط بیرسون هو الأکثر استخداما ً فی الدراسات التربویة والنفسیة ، ویستخدم لمعرفة العلاقة الخطیة بین متغیرین متصلین وحدوده بین ( +1، -1) ، والاشارة التی تسبق قیم هذا المعامل تدل على اتجاه العلاقة و لیس قوة العلاقة . و لها بنیة مشترکة تتمثل فی التغیرات الناتجة عن معادلة R² التی قد یشار إلیها أحیانا ً بمصطلح مُقدِرات نسبة التباین أو المقاییس المرتکزة على التباین  . ومن أمثلتها :  } مؤشر مربع إیتا لبیرسون ² η (Pearson, 1905) ، مؤشر مربع أومیغا لهاس ²ω (Hays,1963) ،مؤشر مربع أبیلسون لکیلی ²ε (Kelley,1935) { .

مؤشر کوهینCohen’s d

یعّرف Cohen مؤشر حجم التأثیر d على أنه " الفرق بین متوسطی مجموعتین M1  و M2 مقسوماً على الانحراف المعیاری σ داخل المجموعتین " و یرى کوهن أنه یمکن استخدام الانحراف المعیاری لأى مجموعة عندما تکون التباینات لکل منهما متجانسة     .   (Sanchez and Martinez and Chacon 2003)

وینتشر استخدام مؤشر  Cohen’s d بشکل خاص فی الأبحاث التجریبیة و شبه التجریبیة حیث یکون الفرق فی تأثیر المعالجة التجریبیة هاما ً بالنسبة لمتوسطات المجموعات             ( سواء تجریبیة أو ضابطة ) . ویشتمل متوسط الفروق المعیاریة على مجموعة من الإحصاءات المرتبطة ببعضها البعض , وبالتالی هناک صعوبة فی تقدیم تلک الإحصاءات نتیجة الاختلافات فی الرموز التی یستخدمها الباحثون وربما یعکس نقص المعیاریة Standardization فی الأبحاث ذلک الاهتمام الحالی بتلک الإحصاءات (Mcgrath & Meyer,2006)، ویختلف حساب حجم التأثیر باختلاف الإحصائی المستخدم فی فحص الفرضیة الصفریة . وقد أوجد کوهن Cohen طرقا ً مختلفة لحساب حجم التأثیر لـ الإحصائی ت (t) والإحصائی ف (f)          ( إبراهیم ، 1998)  .

ومن الأمثلة المعروفة للباحثین فی مجال التربیة و علم النفس حالة العینتین المستقلتین لاختبار ( ت ) مثل التصمیم التجریبی الذی یتضمن مجموعة ضابطة Control Group وأخرى تجریبیة Experimental Group .

مربع ایتاEta 2

تعتبر نسبة الارتباط () أو مربع ایتا من المؤشرات التی تقیس حجم تأثیر المعالجة  ویستخدم هذا المعامل فی حالة وجود علاقة منحنیة بین المتغیرین  أى أن الخط الأکثر ملائمة للبیانات لیس خطا ً مستقیما ً . ویفترض مربع آیتا أن خط  الانحدار یمر من خلال کل متوسط من متوسطات المعالجة ، وهذا الافتراض صحیح عندما یتم معالجة البیانات کمجتمع ، ولکن عندما یتم التعامل مع البیانات کعینة من مجتمع ، فأن نسبة الارتباط تعتبر متحیزة ، ذلک لأن متوسطات العینات خاضعة لما یسمى بخطأ المعاینة ، و هنا احتمال أن لا یمر الخط بالضبط من خلال متوسطات العینات (المنیزل ،  2000 ) .

ومربع ایتا یمثل النسبة من التباین الکلی للمتغیر التابع فی العینات موضع            البحث التی ترجع إلى أثر المتغیر المستقل . وتساوى قیمته فی تحلیل التباین الأحادی          للبیانات المستقلة بأنه مجموع المربعات بین المجموعات إلى مجموع المربعات الکلیة            (Hasse & Solomon and waechter,1982) .

وقد ذکرت الصائغ (1996) فی دراستها ممیزات مربع ایتا منها  :

1-      یعتبر مقیاسا ً مقبولاً و خصوصا ً فی البحوث التربویة لحساب الدلالة العملیة أو حجم التأثیر والمسمى بالتباین المفسر ، ویکون حسابها بدون صعوبة من جدول ANOVA الکامل فی حالة اختبار تحلیل التباین الأحادی .

2-      أن معظم الإحصائیین یوافقون على أن مربع ایتا یعطى معلومات أکثر دقة من قیمة الفرق الإحصائی حیث تأخذ فی الاعتبار حجم العینة .

3-      تظهر أهمیته وفائدته عند مراجعة الدراسات السابقة باستخدام ما یسمى بأسلوب ما وراء التحلیل أو التحلیل البعدی وهی طریقة کمیة لمراجعة الدراسات السابقة فی أى مجال من المجالات بطریقة تکاملیة ، وبأقل قدر من التحیز سواء کان هذا التحیز مراجعه ذاتیة الباحث الذی یقوم بالمراجعة أو تحیز یرجع للدراسات السابقة موضع المراجعة.

4-      یبقى لقیمة مربع آیتا دور کبیر فی تقییم الدلالة العملیة وفی بیان درجة التنبؤ الفعلی للدراسة حتى لو کانت قیمتها منخفضة للغایة .

5-      أن قیمة مربع آیتا تساوى قیمة معامل التحدید R2 المستخرج من نموذج تحلیل الانحدار الذی یتم استخدامه عند تحلیل الاختلاف فی تصمیم یشبه تحلیل ANOVA

6-      یشکل مربع آیتا رابطة قویة بین التحلیل التقلیدی للتباین من ناحیة وبین الانحدار المتعدد من ناحیة أخرى .

7-      یستخدام مربع آیتا فی تفسیر أهمیة البحث وفی قیاس الفروق التی یظهرها التحلیل الإحصائی وقد أصبح استخدامه شائعا ً خاصة فی مجال العلوم الاجتماعیة نظرا ً للتشابه مع معامل التحدید R2 الأکثر فائدة و الناتج من تحلیل الانحدار.

مربع أومیجا 2ω

     یشیر الکیلانى والشریفین ( 2007 ) إلى مربع اومیجا (ω2) على أنه النسبة من التباین الکلی التی یمکن تفسیرها فی المتغیر التابع فی المجتمع الأصلی الذی اختیرت منه العینة ، ویعتبر معلمیاً وینتمى إلى الإحصاء الاستدلالی أی عکس مربع آیتا الذی ینتمى بدوره إلى الإحصاء الوصفی .

     ویشیر المنیزل (2000) إلى أن حساب قیمة مربع أومیجا تعتمد فیما إذا کان المتغیر المستقل الذی نتعامل معه عشوائی أو ثابت، وفی حالة المتغیر العشوائی ، یمکن تعریف مربع أومیجا على أنها نسبة تباین المعالجة إلى مجموع تباین المعالجة والخطأ ، وبما أننا لا نستطیع قیاس تباین المعالجة وتباین الخطأ بشکل مباشر ، فأننا نقدر ذلک من خلال العینات ، لذلک فأن قیمة مربع أومیجا المتوقعة هی بمثابة قیمة تقریبیة.

مؤشر Hedges’ g

     یعتبر g  بمثابة مقیاس استدلالی ، و یمکن حسابه من خلال الجذر التربیعی لمتوسط مربع الخطأ MSE الناتج عن تحلیل التباین ANOVA ( الذی یختبر الفروق بین المجموعتین المستقلتین ) . و تعود تسمیة هذا المؤشر إلى جلاس  Glass التی تعتبر رائدة التحلیل البعدی.   ویمکن حساب قیمة g من خلال قیمة اختبار ت t-test للفروق بین المجموعتین المستقلتین            ( فی حالة عدم تساوى عدد المفحوصین فی المجموعتین ).

مربع ابیسلون ²𝛆:

   أوجد هذا المؤشر کیلى (Kelly,1935) ، ثم عدله کوهین (Cohen,1965) ، ومما یجدر ذکره أن استخدامات مربع ابیسلون کمؤشر للدلالة العملیة غیر شائع الاستخدام فی البحوث النفسیة و التربویة ، و ذلک لکونه غیر مألوف لکثیر من الباحثین.

وتوجد مجموعة أخرى من مؤشرات حجم التأثیر کما أوردها کل من ( حجیمات ،1995 ، ابراهیم ،1998، محمود ، 2003، سکران ،2006 ، النجار 2005)، ومنها حجم التأثیر لإختبار  کا² ، حیث یستخدم لحساب حجم التأثیر (  W )  من خلال حالة اختبار کا²  لفحص جودة المطابقة، کما یمکن حساب مؤشر حجم التأثیر لاختبار کا2 من خلال معامل التوافق الذی یعد بدوره من أکثر المقاییس استخداما ً لقیاس الارتباط فی جداول التوافق، کما یمکن کذلک حساب مؤشر حجم التأثیر لاختبار کا2 باستخدام معامل فاى ϕ̷̍ ، ویمکن حساب مؤشر حجم التأثیر لاختبار کا2 باستخدام معامل کرامر.     

حجم التأثیر ²r لمعامل ارتباط بیرسون          

تستخدم فی الدراسات الارتباطیة فی بحث العلاقة یبن متغیرین أو أکثر ، ومن أشهر معاملات الارتباط المستخدمة معامل ارتباط بیرسون ( r ) حیث یعتبر مؤشراً لوجود علاقة خطیة بین المتغیرین و تأخذ قیم بین (+1 و -1 ) بما فیها ( -1 و +1 ) , أما مؤشر حجم التأثیر فیساوى مربع معامل ارتباط بیرسون ( ²R ) ( أى معامل التحدید ) و هو یمثل نسبة التباین فی أحد المتغیرین الذی یمکن عزوه إلى تباین المتغیر الآخر، ومنها حجم التأثیر f2   الخاص بتحلیل الانحدار المتعدد Multiple Regression حیث یتم دراسة العلاقة بین مجموعة من المتغیرات التی غالبا ً ما تکون متغیرات، ,ایضاً حجم التأثیر q  للفرق بین معاملی الارتباط ، حیث یتم اختبار الفرق بین معاملی الارتباط لمجتمعین من خلال معاملی الارتباط          لعینتین مسحوبتین من هذین المجتمعین ، وهو یقوم على افتراض التوزیع الطبیعی لکلا المجتمعین وتجانس التباین . وبما أن توزیع r غیر متساوی الوحدات فأن الفرق بین           r1 و r2 لا یمکن استخدامه کمؤشر لحجم التأثیر ، فنلجأ لتحویل قیم r إلى z Fisher                  ( أی تحویلها من مستوى رتبى إلى مستوى فئوی ).

وهناک أیضاً حجم التأثیر D2 لاختبار تحلیل التباین المتعدد MANOVA ، و فیه یتم فحص متوسطات المجموعات لجمیع المتغیرات ما اذا کانت  متساویة، حجم التأثیر من خلال معامل الارتباط الثنائی الأصیل.

ویمکن تقدیر حجم التأثیر المتوقع من خلال ثلاث طرق ( نصار ، 2002) :

1)       مراجعة الأدب المتخصص وذلک من خلال مراجعة الدراسات السابقة التی تمت حول موضوع البحث ومن خلال استعراض نتائج تلک الأبحاث یستطیع الباحث بناء توقع حول مقدار حجم التأثیر خاصة ً إذا أشارت تلک الدراسات مباشرة ً إلى قیمة حجم التأثیر التی ظهرت من خلال بیاناتها .

2)       تحدید مقدار الفارق الدال عملیا ً من وجهة نظر الباحث و ذلک بین متوسطی المجموعتین التجریبیة والضابطة فی حالة وجود عینتین أو الفارق الدال عملیا ً بین القیاسین القبلی والبعدی فی حالة اختبار "ت "  للعینات  المترابطة أو الفارق الدال عملیا ً بین متوسط العینة ومتوسط مجتمع معین فی حالة اختبار" ت " للعینة الواحدة أو مقدار الترابط الدال عملیا ً بین تباین المتغیر المستقل وتباین المتغیر التابع فی حالة تحلیل التباین . ومن العوامل التی تلعب دورا ً فی تحدید الباحث لمقدار الأثر المرغوب به هی دعم نظریة معینة أو إثبات فعالیة برنامج معین فی تحقیق أهداف محددة وکذلک کلفة هذا البرنامج حیث کلما ازدادت الکلفة المادیة للبرنامج المقترح من قبل الباحثین کلما زادت الحاجة إلى اثبات الأهمیة أو الفائدة العملیة لهذا البرنامج .

3)       استخدام المعاییر التی أشار إلیها کوهین ففی حالة اختبار " ت " أشار کوهین إلى أن حجم التأثیر یعتبر صغیرا ً عند (0,20(  ومتوسطا ً عند (0,50(  وکبیرا ً عند  (0,80 (  ومن خلال ذلک یستطیع الباحث أن یحدد حجم التأثیر الذی یسعى إلیه فی ضوء قوة النظریة التی یستند علیها البحث وقوة العلاقة بین متغیرات الدراسة .

الدراسات السابقة:

     تناولت دراسة سمیثون (Smithson, 2001) أحجام التأثیر من خلال مربع معامل الارتباط R2 والذی یستخدم فی تحلیل الانحدار المتعدد وبخاصة فی التوزیعات اللامرکزیة مثل (F) و (X2) وترى ضرورة وضع قیمة R فی الاعتبار عند استخدام التنبؤات من خلال معاملات الانحدار وانتهت إلى أن قیمة حجم التأثیر متوسطة بالإضافة إلى وجود علاقة قویة بین حجم التأثیر وفترات الثقة باستخدام التوزیعات اللامرکزیة.

وهدفت دراسة نصار (2002) إلى تقدیم مفهوم حجم الأثر کأسلوب إحصائی مکمل لفحص الفرضیات الإحصائیة وتضمنت  تحلیلاً رقمیاً لبرهنة أن حجم الأثر أقل تأثراً بحجم العینة من الأسالیب الإحصائیة التی تستخدم لفحص الفرضیات. بالإضافة إلى بعض المؤشرات الاحصائیة التی تستخدم للدلالة على قیمة حجم الأثر فی حالة استخدام بعض الأسالیب وبالتحدید اختبار (t) سواء فی العینات المترابطة أو المستقلة واختبار (F) فی حالة تحلیل التباین الأحادی ومعامل ارتباط بیرسون وأخیراً الأنحدار الخطی البسیط ، وقدمت الدراسة نموذجاً حول کیفیة وصف مقدار حجم الأثر فی الدراسات المنشورة فی المجلات العربیة المتخصصة وبالتحدید فی مجلة جامعة الملک سعود . وأظهرت نتائجها أنه یمکن وصف ما نسبته 60% من قیم حجم الأثر والمستخرجة للأسالیب الإحصائیة المنشورة خلال خمس سنوات على أنه حجم أثر صغیر أو متوسط.

     وتهدف دراسة روبین وروسنثال , 2003) Rubin & Rosenthal ) إلى اقتراح مُقدِر بسیط لحجم التأثیر Simple Size Effect Estimate ( یتم حسابه من خلال حجم العینة N , وقیمة p value ) وذلک بغرض استخدامه فی : أ) دراسات التحلیل البعدى حیث یقرر الباحث نفس أحجام العینة وقیم P  values فقط , ب)  فی الحالات التی لایتوافر فیها مؤشرلحجم التأثیر متفق علیه بشکل عام , ج) فی الحالات التی تکون فیها مؤشرات حجم التأثیر التی تم حسابها بشکل مباشر مضللة Misleading . ویُطلق على مؤشر حجم التأثیر المستخدم فی الدراسة  مصطلح  Rالمکافئة R equivalent  وذلک لأنها تتساوى إلى حد کبیر مع           الارتباط النقطی ذی الحدین بین مؤشر المعالجة Treatment Indicator والناتج ذی التوزیع الاعتدالی Normaly Distributed Outcome فی التجارب البحثیة التی بها اثنتین من المعالجات Two -treatment Experiments حیث یوجد N/2 من الوحدات فی کل مجموعة , إلى جانب قیمة p value . ویؤکد المؤلفان على أنه رغم قابلیة المکافئة            (  (  R  للحساب إلا أنها لیست فعالة فی کل الأحوال . لقد کان الهدف من تصمیم مؤشر                  R equivalent   لتلائم المواقف التالیة :-

1)    عندما یکون البدیل المتاح هو عدم وجود حجم تأثیر على الاطلاق ( فی حالة معرفة أحجام العینات و قیم   p values  فقط.

2)    استخدام اجراءات لا معلمیة لیس لها مؤشرات أحجام تأثیر متفق علیها .

3)    عندما تکون أحجام العینات صغیرة جدا ً أو تکون البیانات غیر اعتدالیة مما یجعل الحساب المباشر لأحجام التأثیر أکثر تضلیلا ً من قیمته الحقیقیة .   

وقد هدفت دراسة محمود (2003) إلى التعرف على  واقع الدلالة الإحصائیة ، والدلالة العملیة وقوة الاختبار للاختبارات الإحصائیة المستخدمة فی رسائل ماجستیر کلیة العلوم التربویة . وبالتحدید ، فقد حاولت الدراسة الإجابة على الأسئلة التالیة :

1)   ما مستوى الدلالة الإحصائیة المستخدم فی فحص الفرضیات الصفریة فی هذه الدراسات ؟

2)   ما نسبة الاختبارات الإحصائیة التی اقترنت دلالتها الإحصائیة بدلالة    عملیة ؟

3)   ما مستوى قوة الاختبارات الإحصائیة المستخدمة فی فحص الفرضیات الصفریة ؟

4)   ما نسبة الفرضیات التی اقترنت دلالتها الإحصائیة باختبارات ذات قوة عالیة؟ . وقد أظهرت النتائج میل معظم الباحثین لاستخدام مستوى الدلالة 0,05 , وقد بلغت نسبة الاختبارات الدالة إحصائیا ً( 45,2 % ) من مجموع الاختبارات ، تمتع منها ( 17,8 % ) بدلالة عملیة کبیرة و( 11,7 % ) منها بدلالة عملیة متوسطة و( 71,3 % ) بدلالة عملیة صغیرة . وقد أظهر اختبار مربع کاى عدم استقلالیة الدلالة العملیة عن الدلالة الإحصائیة.

وهدفت دراسة روبی (Robey, 2004) إلى :

(‌أ)       مراجعة حجم التأثیر فی العلوم الاجتماعیة.

(‌ب)   توضیح أهمیة حجم التأثیر فی بحوث علم النفس العیادی.

(‌ج)     وضع معیار أو محک یستند إلیه عند قبول أو رفض حجم التأثیر. وأظهرت النتائج وجود أحجام تأثیر بنسب متفاوتة فی بحوث علم النفس العیادی التی تستخدم تحلیل التباین الأحادی أو الثنائی أو التصمیمات التجریبیة ذات المجموعة التجریبیة  مقابل الضابطة.

وأجرى کل من اجینیس وبیتی and Beaty , 2005 ) Aguinis ) مراجعة للدراسات عبر 30 عأماً ( 1969-1998) فی الدوریات العلمیة التالیة :

•     Journal of Applied Psychology

•     Academy of Management Journal

•     Personal Psychology

حیث أنها من أکثر الدوریات العلمیة تأثیرا ً فی مجال علم النفس التطبیقی وعلوم الإدارة فضلا ً عن ذلک  تمتاز تلک الدوریات بوضع سیاسات تحریر صارمة تلزم الباحثین بإتباع طرق بحثیة و منهجیة قیاسیة . وهکذا نلاحظ أن أحجام التأثیر فی تلک الدوریات محایدة . وبمعنى آخر نتیجة لسیاسات التحریر و تقریر نتائج الأبحاث المستخدمة فی تلک الدوریات  من المتوقع أن تکون أحجام التأثیر المنشورة فیها أکبر من تلک المنشورة فی الدوریات الأخرى فی            مجال علم النفس التطبیقی والعلوم الإداریة من أجل قیاس أحجام تأثیر العوامل المعدلة Moderating Effects للمتغیرات الفئویة التی یتم قیاسها بواسطة معادلة الانحدار المتعدد . وقد کان متوسط حجم التأثیر, والذی یرمز إلیه بــ ²f  مساویا ً لــ( .002 ) فقط , و لکن مع ذلک أظهرت (72 % ) من اختبارات العامل المعدل  Moderators قوة إحصائیة مقدارها ( .80) أو أکثر مما أدى بدوره إلى التنبؤ بوجود حجم صغیر لهذا التأثیر . وتشیر النتائج إلى أن هناک حاجة إلى التخلص من القیم التی تعمل بدورها على وجود انحیاز منخفض فی حجم التأثیر الملحوظ , وبالتالی یمکن تعریف أحجام التأثیر ذات الصلة بالعلاقات بین المتغیرات بشکل أکثر دقة . وطالما کان للتأثیر دلالة قویة  ینصح المؤلفون الباحثون فی مجال العلوم السلوکیة وعلوم الإدارة بإجراء تحلیل القوة وتخطیط التصمیمات البحثیة المستقبلیة التی ترتکز على أحجام التأثیر الصغیرة و لکنها الأکثر واقعیة .

یطرح کل من ماک جراث و میر ,2006 )  mcgrath & Meyer )  الاستخدام المتنامی لأحجام التأثیر فی دراسات الحالة و التحلیلات البعدیة تساؤلات جدیدة بشأن الاستدلال الإحصائی . وقد یؤثر اختیار مؤشر حجم التأثیر على تفسیر نتائج الدراسات ویوضح الباحثان بالأدلة العملیة ذلک التأثیر من خلال الترکیز على اثنین من أکثر مقاییس حجم التأثیر استخداما : معامل الارتباط , وفرق المتوسطات المعیاریة ( مثل Cohen’s d , و Hedges’s g ) , والتی یتم استخدامها فی حالة وجود متغیر ثنائى Dichotomous و آخر کمی Quantitative . ورغم قابلیة استخدام تلک المؤشرات بنفس الأسلوب من الناحیة العملیة , فأن الفروق فی حساسیة تلک المؤشرات أو تباین المتغیر الثنائی قد تؤدى إلى تغییر النتائج بشأن حجم التأثیر وذلک فی ضوء الاحصاء المستخدم . ولأنه لا توجد احصاء جید ومناسب بشکل عام متفق علیه لدى جمیع الباحثین , فإنه یجب الاهتمام بمعدل الفترة الأساسیة عند صیاغة الاستدلالات الصحیحة و تبریر اختیار الاحصاء الأساسی لقیاس حجم التأثیر .      

     وهدفت دراسة ویلکوکس (Wilcox, 2006 ) إلى استخدام الطرق البیانیة لقیاس حجم التأثیر کبدائل لمدخل کوهین وتوصلت إلى أن حجم التأثیر یلعب دوراً أساسیاً فی البحث النفسی والتربوی، وباستخدام الطرق البیانیةGraphical Methods  کبدائل لمدخل کوهین لا توجد فروق کبیرة وبخاصة فی بعض الاختبارات اللامعلمیة مثل مان – ویتنی ، وهذه التمثیلات البیانیة تتغلب على عیوب مدخل کوهین فی تحدید حجم التأثیر. ویرى ویلکوکس أن الهدف الأساسی فی مجال الأبحاث التطبیقیة لیس مجرد ایجاد الفرق بین مجموعتین من المشارکین , ولکن الشیء الأکثر أهمیة هو فهم کیفیة و مدى الاختلاف بین هاتین المجموعتین . وقد صاغ Cohen  مدخلاً بحثیاً عاما ومنطقیاً لـ علاج تلک المسألة . وقد اعتمدت استراتیجیته فی القیاس على المنظور البیانى . وبشکل أکثر تحدیداً   عندما نفحص التوزیعین Distributions المرتبطة بـ تلک المجموعتین , افترض Cohen وجود تأثیر کبیر إذا کان الفرق بین هذین التوزیعین             ( ویشار إلیه من خلال التغیر Shift فی الموضع ) " یُرى بالعین المجردة " . وفی نهایة ألأمر توصل Cohen  إلى أنه بالنسبة لـ التوزیعات الطبیعیة التی بینها تباین مشترک , یکون الفرق d  صغیراً إذا کان مساویا لـ( ,2 ) وکبیراً إذا کان مساویاً لـ( ,8) وحالیاً هناک مسألة           بحثیة شائکة بشأن الفرق d الذی ربما یصبح صغیراً عندما یکون حجم التأثیر کبیراً                    ( فی ضوء المنظور البیانی لـ Cohen ) . وهنا یهدف ویلکوکسن إلى توضیح الطریقة البیانیة المستخدمة فی علاج تلک المشکلة , إلى جانب غیرها من الطرق البیانیة التی قد تستخدم فی إضافة المزید من الأفکار بشأن قیاس حجم التأثیر .

ومن خلال استعراض الباحث للدراسات السابقة وجد :-

  • أن معظم الدراسات وخاصة الأجنبیة  تناولت أهمیة حجم التأثیر وأثره فی دقة نتائج القرارات الإحصائیة وأوصت بضرورة عدم الاعتماد فقط على الدلالة الإحصائیة دون الدلالة العملیة .
  • اقتصرت الدراسات السابقة على عدد محدود من الاختبارات الإحصائیة حیث نجد أن الدراسات أوجدت حجم التأثیر المرتبط بالاختبارات الإحصائیة ( F , T , R , χ² ) فقط مثل دراسة ( نصار , 2002  و محمود , 2003  و النجار , 2005 , Smithson ,2001 ) أما الدراسة الحالیة فسوف تتناول حجم التأثیر للاختبارات الإحصائیة المعلمیة          ( اختبار  ت , وتحلیل التباین , والانحدار , ومعامل ارتباط بیرسون ) والاختبارات الإحصائیة اللامعلمیة ( کا² , إختبار مان – وتنی ) .
  • هنالک خلط فی بعض الدراسات العربیة فیما یتعلق بالعلاقة بین حجم التأثیر والدلالة الإحصائیة حیث نجد بأن تلک الدراسات قامت بحساب حجم التأثیر للاختبارات الإحصائیة الغیر دالة ، حیث یرى ( الضوی , 2006 ) أنه من الأخطاء الشائعة التی یجب أن یلتفت إلیها الباحثون حساب حجم التأثیر المناظر لقیم الاختبار الإحصائی بطریقة عفویة سواء أکانت قیم الاختبار الإحصائی دالة أم غیر دالة , والصواب فقط هو حساب أو تقدیر حجم التأثیر فقط فی حالة القبول بالفرض البدیل ورفض الفرض الصفری . والنقطة المهمة أن حجم التأثیر یکون فی صورته المثالیة عندما یستخدم الباحث الاختبار الإحصائی المناسب لتحلیل بیاناته أی عندما تفی بیاناته بالافتراضات الأساسیة التی یستند إلیها الاختبار بالإضافة إلى قبول الفرض البدیل ورفض الفرض الصفری .
  • عدم تناول الدراسات السابقة أثر المنهج المستخدم على حجم التأثیر وهذا ما سوف تسعى الدراسة الحالیة إلى إیجاده  .
  • قلة من الدراسات السابقة تناولت أثر حجم العینة على حجم التأثیر مثل دراسة              ( Bayarri and Mayoral 2002  ) والتی أظهرت وجود تأثیر لحجم العینة على دلالة أحجام التأثیر . بالإضافة إلى دراسة الصائغ والتی أظهرت بأن حجم العینة کان مناسباً عند حجم التأثیر الصغیر . بینما دراسة نصار أظهرت بأن حجم التأثیر أقل تأثراً بحجم العینة . وفی المقابل نجد بأن دراسة النجار 2005 أظهرت بأن زیادة حجم العینة قد یکون لة تأثیر سالب على حجم التأثیر .
  • أن معظم الدراسات أکدت على انخفاض قیمة حجم التأثیر فی البحوث التربویة          والنفسیة لبعض الاختبارات الإحصائیة وخاصة الدراسات العربیة , مثل ( نصار , 2002  ومحمود , 2003  والنجار , 2005 ) .

منهج الدراسة :

أعتمد الباحث فی هذه الدراسة على المنهج المسحی الوصفی والذی یتم من خلاله جمع معلومات وبیانات عن ظاهرة ما أو حادث ما وذلک بقصد التعرف على الظاهرة التی ندرسها وتحدید الوضع الحالی لها والتعرف على جوانب القوة والضعف فیها من اجل معرفة مدى صلاحیة هذا الوضع أو مدى الحاجة لإحداث تغیرات جزئیة أو اساسیة فیه.

عینة الدراسة:

تکونت عینة الدراسة من رسائل الماجستیر بکلیة التربیة بأقسامه المختلفة ( علم النفس – المناهج – الوسائل – الإدارة التربویة – التربیة البدنیة – التربیة - التربیة الخاصة ) والتی استخدمت المنهج الوصفی والتجریبی فی دراساتها ، حیث یبلغ العدد الإجمالی لرسائل الماجستیر بکلیة التربیة بعد استبعاد قسم الثقافة الإسلامیة لعدم استخدام الأسالیب الإحصائیة فی دراساته(933) رسالة خلال الفترة ما بین 1414- 1428 هـ ، ولکون المجتمع صغیر نسبیاً فلقد تم اختیار 20%  من إجمالی هذا العدد، وتم اختیار العینة بالطریقة العشوائیة الطبقیة.

الأسالیب الاحصائیة:

أستخدم الباحث فی دراسته التکرارات والنسب المئویة ومعادلات حجم التأثیر وفقاً للأسلوب الإحصائی المستخدم فی کل دراسة ( وجد الباحث بأن الأسالیب الإحصائیة المستخدمة فی عینة الدراسة محصورة فی الأسالیب التالیة : اختبار ( ت ) لعینتین مستقلتین أو مترابطتین - تحلیل التباین - الانحدار المتعدد - معامل ارتباط بیرسون - اختبار کا2 - اختبار مان – وتنی ) وقیمة کا2 , عن طریق برنامج حزمة البرامج الأحیائیة للعلوم الاجتماعیة (SPSS).

نتائج الدراسة وتفسیرها ومناقشتها:

هدفت الدراسة إلى التعرف على أهم الطرق الإحصائیة لحساب حجم التأثیر للاختبارات الإحصائیة المعلمیة واللامعلمیة المستخدمة فی رسائل الماجستیر بکلیة التربیة بجامعة الملک سعود للفترة مابین ( 1414 هـ - 1428 هـ )  والتعرف أیضاً على واقع استخدام  حجم التأثیر.

ولتحقیق الهدف من الدراسة قام الباحث بتفریغ البیانات فی النماذج المعدة لکل اختبار إحصائی (تحلیل التباین , مربع کای , معامل ارتباط بیرسون , الفروق بین المتوسطات , مان وتنی , والانحدار المتعدد ) ومن ثم تم استخدام التکرارات والنسب المئویة ومعادلات حجم التأثیر وقیم مربع کا2 وذلک للإجابة على تساؤلات الدراسة التالیة :-

1- ما الاختبارات الإحصائیة المعلمیة واللامعلمیة المستخدمة فی رسائل الماجستیر بکلیة التربیة بجامعة الملک سعود ؟ 

2- ما واقع استخدام حجم التأثیر فی الاختبارات الإحصائیة المعلمیة واللامعلمیة المستخدمة فی رسائل الماجستیر بکلیة التربیة بجامعة الملک سعود ؟

3- ما أحجام التأثیر للاختبارات الإحصائیة المعلمیة واللامعلمیه المستخدمة فی رسائل الماجستیر بکلیة التربیة بجامعة الملک سعود ؟

نتائج الدراسة:

نتائج التساؤل الأول:

ما الاختبارات الإحصائیة المعلمیة واللامعلمیة المستخدمة فی رسائل الماجستیر بکلیة التربیة بجامعة الملک سعود؟ 

وللإجابة على هذا السؤال استخدم الباحث التکرارات والنسب المئویة على النحو التالی:-

جدول رقم ( 1 )

التکرارات والنسب المئویة للاختبارات الإحصائیة المعلمیة واللامعلمیة

م

نوع الاختبار

التکرارات

النسبة المئویة

1

المعلمیة

559

48,93

2

اللامعلمیة

39

52,6

المجمــــــــــــــــــــــــــــوع

598

100%

یتضح من الجدول رقم ( 1 ) بأن الاختبارات المعلمیة أکثر استخداما من نظیرتها اللامعلمیة فی کلیة التربیة بجامعة الملک سعود حیث تکرر استخدام الاختبارات المعلمیة          ( 559 ) مرة بنسبة وقدرها 48,93 % بینما تکرر استخدام الاختبارات اللامعلمیة بواقع ( 39 ) مرة بنسبة مئویة تقدر بـ 52,6 % .

جدول رقم ( 2 )

التکرارات والنسب المئویة للاختبارات الإحصائیة

م

الاختبار الإحصائی المستخدم

التکرارات

النسب المئویة

1

اختبار ( ت )

256

42.81

2

تحلیل التباین

221

36.96

3

معامل ارتباط بیرسون

69

11.54

4

الانحدار المتعدد

13

2.17

5

مربع کای

21

3.51

6

مان وتنی

18

3.01

المجمــــــــــــــوع

598

100%

یتضح من الجدول رقم ( 2 )  بأنه تم استخدام ( 598 ) اختبارا إحصائیاً فی کلیة التربیة بجامعة الملک سعود , وقد کان أکثر الأسالیب الإحصائیة استخداما هو اختبار ( ت ) حیث أستخدم ( 256 ) مرة بنسبة 81,42% من مجموع الاختبارات الإحصائیة المستخدمة فی الکلیة . ویلی هذا الأسلوب الإحصائی اختبار تحلیل التباین ( ف ) حیث أستخدم ( 221 ) مرة بنسبة وقدرها 96,36 % من مجموع الاختبارات الإحصائیة المستخدمة فی الکلیة .

ثم یلی ذلک اختبار معامل الارتباط لبیرسون وقد أستخدم ( 69 ) مرة بنسبة 54,11% من مجموع الاختبارات الإحصائیة المستخدمة فی الکلیة .

ثم یلی ذلک اختبار کا2 حیث أستخدم ( 21 ) مرة بنسبة 51,3 % من مجموع الاختبارات الإحصائیة المستخدمة فی الکلیة .

ثم یلیه اختبار مان وتنی وقد أستخدم ( 18 ) مرة بنسبة 01,3 % من مجموع الاختبارات الإحصائیة المستخدمة فی الکلیة .

ثم یلیه اختبار الانحدار المتعدد وقد أستخدم ( 13 ) مرة بنسبة 17,2 % من مجموع الاختبارات الإحصائیة المستخدمة فی الکلیة .

وهذا یتفق مع ما توصلت إلیة دراسة کل من (العجلان , 1990 و الصیاد , 1988 ) حیث أظهرت نتائجهما بأن الاختبار الإحصائی ( ت ) یعد من أکثر الاختبارات الإحصائیة استخداما , بینما دراسة  (النجار,1991 )  أشارت إلى أن اختبار کا2 أکثر استخداما فی کلیة التربیة بجامعة أم القرى .

ویرى هارول Harwell بأن هنالک عدة أسباب  محتملة وراء ندرة استخدام الاختبارات اللامعلمیة فی مجال البحوث النفسیة و التربویة و الاجتماعیة   وهی  : ( الضوی , 2006 )

أ- تضمین برامج الحاسب الآلى المعروفة مثل Minitab و SPSS بعدد صغیر جدا ً من البدائل اللامعلمیة .

ب- استمرار الاعتقاد لدى کثیر من الباحثین التربویین أن الاختبارات اللامعلمیة أقل قوة وأقل قبولا ً مقارنة ً بنظیراتها المعلمیة .

ج - عدم وعى الباحثین فی المجالات التربویة والنفسیة والاجتماعیة بالبدائل اللامعلمیة المتاحة للإستخدام فی التصمیمات التجریبیة المعقدة، و کیفیة إنجاز تحلیل البیانات باستخدام البرامج المتوفرة، فالعدید منهم یعتقدون بشکل واضح أن البدائل مرتبطة بالبیانات المستقاة من تصمیمات تجریبیة بسیطة جدا ً.

بالإضافة إلى أن الکثیر من طلاب الدراسات العلیا لیس لدیهم معرفه شامله بالبدائل اللامعلمیة وذلک لأنهم لم یدرسوها بصوره مفصله کمتطلب فی  مقرر الإحصاء . 

نتائج التساؤل الثانی:

ما واقع استخدام حجم التأثیر فی الاختبارات الإحصائیة المعلمیة واللامعلمیة المستخدمة فی رسائل الماجستیر بکلیة التربیة بجامعة الملک سعود ؟

وللإجابة على هذا التساؤل أستخدم الباحث التکرارات والنسب المئویة على النحو التالی

جدول رقم ( 3 )

التکرارات والنسب المئویة لواقع استخدام حجم التأثیر بکل قسم من أقسام کلیة التربیة

م

القسم

التکرارات

النسب المئویة

1

علم النفس

0

0

2

قسم التربیة

0

0

3

وسائل وتکنولوجیا التعلیم

0

0

4

مناهج وطرق تدریس

0

0

5

الإدارة التربویة

0

0

6

التربیة البدنیة

2

3,1

7

التربیة الخاصة

0

0

المجمــــــــــوع

2

3,1

یتضح من الجدول رقم ( 3 )  بأنه تم استخدام حجم التأثیر فی رسالتین فقط من مجموع عینة الدراسة والبالغة 154 رسالة فی کلیة التربیة بجامعة الملک سعود أی بنسبة وقدرها  3,1 %  وهذه تعد نسبة ضئیلة جداً و هذا بسبب عدم معرفة الباحثین على مستوى الماجستیر بمدلول حجم التأثیر نتیجة عدم تضمین تدریس طرق حساب حجم التأثیر فی المقررات الدراسیة وخاصة لطلاب الدراسات العلیا .

ولاحظ الباحث أثناء جمع البیانات من عینة الدراسة بأن هنالک 3 رسائل من قسم المناهج وطرق التدریس ورسالة واحده من قسم الإدارة التربویة استخدمت حجم التأثیر مع العلم بأن نتائجها غیر داله إحصائیاً وهذا عکس ما أکد علیه المتخصصون بأن حجم التأثیر هو المکمل للدلالة الإحصائیة   ولیس بدیلاً عنه ( منصور , 1997 وMclean and Eronest , 1997   وLane , 1999   ) . ویرى ( الضوی , 2006 ) أنه من الأخطاء الشائعة التی یجب أن یلتفت إلیها الباحثون حساب حجم التأثیر المناظرة لقیم الاختبار الإحصائی بطریقة عفویة سواء أکانت قیم الاختبار الإحصائی دالة أم غیر دالة , والصواب فقط هو حساب أو تقدیر حجم التأثیر فقط فی حالة القبول بالفرض البدیل ورفض الفرض الصفری . والنقطة المهمة أن حجم التأثیر یکون فی صورته المثالیة عندما یستخدم الباحث الاختبار الإحصائی المناسب لتحلیل بیاناته أی عندما تفی بیاناته بالافتراضات الأساسیة التی یستند إلیها الاختبار بالإضافة إلى قبول الفرض البدیل ورفض الفرض الصفری.

ویرى شیفر ( Shaver, 1992 ) أن اختبارات الدلالة الإحصائیة لا تشیر إلى احتمالیة خطأ أو صحة الفرضیة الصفریة وإنما تعطی للباحث معلومات تتعلق باحتمال الحصول على نتیجة معینة بفرق دال إحصائیاً یحدده الفرض الصفری , وأن کثیراً من الباحثین یقدمون آراء حول رفض الفرضیة الصفریة بناء على نتیجة معینة ذات دلالة إحصائیة. ویتطلب ذلک ضرورة تشجیع الباحثین للتقلیل من الاعتماد على الدلالة الإحصائیة فی تحلیلاتهم وتفسیراتهم ولا ینبغی نشر الأبحاث التی تعتمد على الدلالة الإحصائیة فقط ولابد  من احتواء التحلیلات ونتائج الدراسات على أحجام التأثیر.

نتائج التساؤل الثالث:-

ما أحجام التأثیر للاختبارات الإحصائیة المعلمیة واللامعلمیة المستخدمة فی رسائل الماجستیر بکلیة التربیة بجامعة الملک سعود ؟

وللإجابة على هذا التساؤل استخدم الباحث معادلات حجم التأثیر المناسبة لکل اختبار إحصائی والموضحة سابقاً فی فصل إجراءات الدراسة  ووفقاً للمعطیات المتوفرة فی عینة الدراسة .

 أولاً :-  متوسط أحجام التأثیر لاختبار ( ت )

  أ )   لعینتین مستقلتین

جدول رقم ( 4 )

متوسط أحجام التأثیر لاختبار (ت) فی حال عینتین مستقلتین

 

حجم العینة

أقل قیمة

أعلى قیمة

المتوسط

الانحراف المعیاری

حجم التأثیر

233

-

97,

4411,

24553,

ب )  لعینتین مترابطتین

جدول رقم ( 5 )

متوسط أحجام التأثیر لاختبار (ت) فی حال عینتین مترابطتین

 

حجم العینة

أقل قیمة

أعلى قیمة

المتوسط

الانحراف المعیاری

حجم التأثیر

23

05,

85,

3408,

23895,

یتضح من الجدولین رقم ( 4 و 5 ) بأن متوسط حجم التأثیر للاختبار الإحصائی           ( ت ) لعینتین مستقلتین ولعینتین مترابطتین (4411,  ,  3408, ) على الترتیب وهذا حجم تأثیر متوسط  وفقاً لتصنیف کوهن لأحجام التأثیر>

وهذا یتفق مع دراسة نصار (2002) والتی أظهرت أن قیمة حجم الأثر لاختبار (t) سواء فی العینات المترابطة أو المستقلة واختبار ( ف ) فی حالة تحلیل التباین الأحادی ومعامل ارتباط بیرسون وأخیراً الانحدار الخطی البسیط إلى أنه حجم أثر صغیر أو متوسط.

بینما توصلت دراسة کل من (الصیاد , 1988 النجار ,1991  إبراهیم  1997)        إلى أن حجم التأثیر المصاحب للدلالة الإحصائیة ضعیف جداً بینما أشارت دراسة              ( الصائغ 1996 )  إلى أن حجم التأثیر للأحصائی ( ت )  کان کبیراً حیث بلغ 80, .

ثانیاً :-  متوسط أحجام التأثیر لاختبار ( الانحدار المتعدد )

جدول رقم ( 6 )

متوسط أحجام التأثیر لاختبار (الانحدار المتعدد)

 

حجم العینة

أقل قیمة

أعلى قیمة

المتوسط

الانحراف المعیاری

حجم التأثیر

13

02,

95,

3876,

32445,

یتضح من الجدول رقم ( 6 )  بأن متوسط حجم التأثیر لاختبار الانحدار المتعدد بلغت (3876, ) وهذا حجم تأثیر متوسط وفقاً لتصنیف کوهن لأحجام التأثیر، وهذا یتفق مع دراسة سمیثون (Smithson, 2001) حیث أظهرت نتائجها    أن قیمة حجم التأثیر متوسطة، بینما دراسة کل من اجینیس وبیتی and Beaty , 2005 ) Aguinis ) أظهرت بأن متوسط حجم التأثیر مساویا ً لــ( .002 ) فقط  وهذا بناءً على تصنیف کوهن لأحجام التأثیر یعتبر صغیر جداً .

ثالثاً  :-   متوسط أحجام التأثیر لاختبار ( تحلیل التباین ) 

 یتضح من الجدول رقم ( 7 )  بأن متوسط حجم التأثیر لاختبار تحلیل التباین بلغ (0854,) وهذا حجم تأثیر صغیر جداً وفقاً لتصنیف کوهن لأحجام التأثیر، وهذا یتفق مع دراسة کل من  النجار , 1991 و الصائغ  1996 ونصار 2002 وHaase and waechter and Solomon, 1982   والتی أظهرت أن قیمة حجم الأثر لاختبار (  ف ) کان صغیراً   .

جدول رقم (7 )

متوسط أحجام التأثیر لاختبار (تحلیل التباین)

 

حجم العینة

أقل قیمة

أعلى قیمة

المتوسط

الانحراف المعیاری

حجم التأثیر

221

-

60,

0854,

10910,

بینما أظهرت دراسة إبراهیم  (1997)  والتی هدفت إلى   التعرف على واقع الدلالة الإحصائیة والعملیة و قوة الاختبار الإحصائی فی رسائل الماجستیر  فی مجال علم النفس التربوی فی الجامعة الأردنیة ما بین عامی (1990-1995) وأشارت نتائجها إلى أن قیمة حجم التأثیر لاختبار (  ف ) کان متوسط ، ویعود سبب ضعف قیمة حجم التأثیر المستخرجة إلى   ضعف فی تصمیم هذه الدراسات. 

رابعاً  :-   متوسط أحجام التأثیر لاختبار ( معامل ارتباط بیرسون)

یتضح من الجدول رقم ( 8 )  بأن متوسط حجم التأثیر لاختبار معامل ارتباط بیرسون بلغ (2676, ) وهذا حجم تأثیر متوسط وفقاً لتصنیف کوهن لأحجام التأثیر.

جدول رقم ( 8 )

متوسط أحجام التأثیر لاختبار (معامل ارتباط بیرسون)

 

حجم العینة

أقل قیمة

أعلى قیمة

المتوسط

الإنحراف المعیاری

حجم التأثیر

69

01,

76,

2676,

2368,

وتتفق نتیجة الدراسة الحالیة مع ما توصلت إلیة دراسة نصار (2002) والتی أظهرت بأن قیمة حجم التأثیر لمعامل ارتباط بیرسون کان عند مستوى صغیر ومتوسط.

 بینما دراسة کل من إبراهیم ( 1997 )  ومحمود(  2003 ) أظهرت بأن قیمة حجم التأثیر لمعامل إرتباط بیرسون ضعیفة  وفقاً لتصنیف کوهن لأحجام التأثیر .

خامساً  :-  متوسط أحجام التأثیر لاختبار ( مان وتنی  )

یتضح من الجدول رقم ( 9 )  بأن متوسط حجم التأثیر لاختبار مان - وتنی بلغ (6691,) وهذا حجم تأثیر متوسط وفقاً لتصنیف کوهن لأحجام التأثیر.

جدول رقم ( 9 )

متوسط أحجام التأثیر لاختبار (مان - وتنی)

 

حجم العینة

أقل قیمة

أعلى قیمة

المتوسط

الانحراف المعیاری

حجم التأثیر

18

02,

1

6691,

3208,

سادساً :-   متوسط أحجام التأثیر لاختبار ( کای تربیع ) 

     یتضح من الجدول رقم ( 9 )  بأن متوسط حجم التأثیر لاختبار کای تربیع بلغ (2251,) وهذا حجم تأثیر متوسط وفقاً لتصنیف کوهن لأحجام التأثیر .

جدول رقم ( 9 )

متوسط أحجام التأثیر لاختبار (کاى تربیع )

 

حجم العینة

أقل قیمة

أعلى قیمة

المتوسط

الانحراف المعیاری

حجم التأثیر

21

12,

43,

2251,

0984,

وتتفق نتیجة الدراسة الحالیة مع ما توصلت إلیة دراسة إبراهیم ( 1997 )  والتی أظهرت بأن قیمة حجم التأثیر لاختبار کاى تربیع  کان عند مستوى  متوسط .

بینما أظهرت دراسة النجار( 1991 , 2005 )  أن حجم التأثیر لاختبار کاى تربیع المصاحب للدلالة الإحصائیة کان عند مستوى ضعیف جداً بنسبة 8,45 % من مجموع الاختبارات الإحصائیة المستخدمة لاختبار کاى تربیع .

وفی المقابل أظهرت دراسة محمود ( 2003 )  أن حجم التأثیر لاختبار کاى تربیع والمصاحب للدلالة الإحصائیة کان عند مستوى کبیر بنسبة 84,48 % .

وعموماً فإن متوسط أحجام التأثیر للاختبارات الإحصائیة المستخدمة فی کلیة التربیة بجامعة الملک سعود  والدالة إحصائیاً ذات أحجام تأثیر متوسطة .

وتتفق هذه الدراسة مع دراسة تشیس وتشیس (Chase & Chase, 1976) فی أن قیمة حجم التأثیر والمصاحبة للدلالة الإحصائیة کانت عند مستوى متوسط.


توصیات الدراسة

من خلال النتائج التی توصلت لها هذه الدراسة؛ هناک عدد من التوصیات التی یمکن إجازها فی النقاط التالیة:

  • ·      ضرورة تضمین تدریس البدائل اللامعلمیة فی المقررات الدراسیة وخاصة لطلاب الدراسات العلیا .
  • ·      حث الباحثین عل ضرورة حساب حجم التأثیر الخاصة بالاختبارات الإحصائیة لفروضهم العلمیة وعدم الاکتفاء فقط بالدلالة الإحصائیة , وتضمین ذلک فی ملخصات دراساتهم .
  • ·      ضرورة تضمین تدریس طرق حساب حجم التأثیر فی المقررات الدراسیة وخاصة لطلاب الدراسات العلیا .
  • ·      ضرورة عدم نشر الأبحاث التی تعتمد على الدلالة الإحصائیة فقط ولا بد من احتواء نتائج الدراسات على أحجام التأثیر.

المقترحات:

من خلال ماتم التوصل إلیه من خلال هذه الدراسة؛ فإن الباحث یوصی بما یلی:

  • القیام بدراسة مماثلة على الدوریات العلمیة للاختبارات الإحصائیة الشائعة .

إصدار دلیل لطلاب وطالبات الدراسات العلیا ( دلیل إحصائی ) یحتوی على الأسالیب الإحصائیة المعلمیة واللامعلمیة وطرق حساب أحجام التأثیر.المراجع


أولا: المراجع العربیة:

ابراهیم، ألطاف (1998) . واقع الدلالات الإحصائیة والعملیة وقوة الاختبارات الإحصائیة المستخدمة فی رسائل ماجستیر علم النفس التربوى فى الجامعة الأردنیة. رسالة ماجستیر , الأردن , الجامعة الأردنیة  .

أبو حطب ، فؤاد و صادق ، آمال (1991) . مناهج البحث وطرق التحلیل الإحصائی فی العلوم النفسیة والتربویة والاجتماعیة0 القاهرة ، الأنجلو المصریة.

أبو زید ، مدحت (2002) . الإحصاء فی العلوم السلوکیة الوصف الإحصائی (1) تبویب البیانات وتمثیلها بیانیا ونزعتها المرکزیة. الإسکندریة ، دار المعرفة الجامعیة.

أبو هاشم ، السید (2005) . مؤشرات التحلیل البعدی لبحوث فعالیة الذات فی ضوء   نظریة باندورا. مرکز بحوث کلیة التربیة بجامعة الملک سعود ، العدد 238. الریاض .

بابطین ، عادل (2002) . مشکلات الدلالة الإحصائیة فی البحث التربوی وحلول بدیلة ، رسالة ماجستیر ، جامعة أم القرى، مکة المکرمة  .

بری ، عدنان وهندی، محمود وراضی، الحسینی (1998) . اساسیات طرق التحلیل الإحصائیة , الریاض , جامعة الملک سعود .

تشاو ، لنکولن  (1990) . الإحصاء فى الإدارة. ترجمة عبد المرضى عزام ، الریاض  . دار المریخ للنشر .

توفیق ، عبد الجبار ( 1985) . التحلیل الإحصائی فی البحوث التربویة والنفسیة و الاجتماعیة – الطرق اللا معلمیة 0 الکویت ، مؤسسة الکویت للتقدم العلمی .

الجادری، عدنان (2003 ) . الإحصاء الوصفی فی العلوم التربویة ، عمان: دار المسیرة للنشر والتوزیع والطباعة .

حجیمات، تحسین ( 1995) . دراسة واقع الدلالة العملیة وقوة الأختبارات الإحصائیة المستخدمة فی رسائل الماجستیر فی مجال الإرشاد والتوجیة ، رسالة ماجستیر , الأردن , الجامعة الأردنیة  .

الدردیر , عبد المنعم (2006) . الإحصاء البارامترى و اللابارامترى فى اختبار فروض البحوث النفسیة و التربویة و الإجتماعیة  . القاهرة . عالم الکتب.

سلیم , صباح  و  أبو حویج , مها  (2004) . مقدمة فى الإحتمالات و الإحصاء  , عمان . دار قندیل للنشر .

سمیث , ج ملتون  (1985) .  الدلیل إلى الإحصاء فى التربیة و علم النفس . ترجمة ابراهیم بسیونى عمیرة   , القاهرة  , دار المعارف .

الشربینى , زکریا  (1995) . الإحصاء وتصمیم التجارب فی البحوث النفسیة والتربویة والإجتماعیة , القاهرة  , الأنجلو المصریة .

الصائغ ، ابتسام (1996) . الدلالة الإحصائیة والدلالة العملیة لاختبار  (ت) و(ف) دراسة تحلیلیة تقویمیة من خلال رسائل الماجستیر التی قدمت فی کلیة التربیة بجامعة أم القرى بمکة المکرمة ، رسالة ماجستیر ، مکة المکرمة، جامعة أم القرى.

الصیاد ، عبد العاطی  (1988) . الدلالة العملیة وحجم العینة المصاحبتین للدلالة الإحصائیة لاختبار (ت) فی البحث التربوی والنفسی العربی – بحوث مؤتمر البحث التربوی الواقع والمستقبل. المجلد الثانی ، القاهرة ، ص 199 -230 .

الضوی , محسوب  (2006) . الإحصاء الاستدلالى المتقدم فى التربیة و علم النفس , القاهرة  , الأنجلو المصریة .

العجلان , فتحیة محمد ( 1990 ) . دراسة تقویمیة للأسالیب الإحصائیة المستخدمة فی رسائل الماجستیر بکلیة التربیة بجامعة أم القرى . مکة المکرمة . جامعة أم القرى .

علام , صلاح الدین  (1993) .  الأسالیب الإحصائیة الاستدلالیة البارامتریة و اللابارامتریة فى تحلیل بیانات البحوث النفسیة و التربویة , القاهرة , دار الفکر العربى .

عودة , أحمد / القاضى , منصور  (2002) . الإحصاء الوصفى و الاستدلالى   , الکویت , مکتبة الفلاح للنشر و التوزیع .

ماضى , محمد  و عثمان , ماجد  (2005) . الإحصاء فى التربیة و علم النفس مع استخدام SPSS و Minitab ,الطبعة الثانیة , دبى , دار القلم للنشر و التوزیع .

محمود ، فریال (2003 ) . واقع الدلالة الاحصائیة والدلالة العملیة وقوة الاختبار للاختبارات الاحصائیة المستخدمة فی رسائل الماجستیر الصادرة عن کلیة العلوم التربویة فی جامعة مؤتة ، رسالة ماجستیر ، الأردن , جامعة مؤتة .

مراد ، صلاح (2000) . الأسالیب الإحصائیة فی العلوم النفسیة والتربویة والاجتماعیة ، القاهرة ، الانجلو المصریة .

منسی ، محمود (1989) . الإحصاء والقیاس فی التربیة وعلم النفس. الإسکندریة، دار المعرفة الجامعیة .

منصور، رشدی فام (1997م) . حجم التأثیر – الوجه المکمل للدلالة الإحصائیة، المجلة المصریة للدراسات النفسیة ، العدد (16) ، 57-75 .

المنیزل , عبدالله  (2000) .  الإحصاء الاستدلالى وتطبیقاته فى الحاسوب بإستخدام الرزم الإحصائیة  SPSS  , عمان , دار وائل للنشر .

النجار ، عبد الله (2005) . الدلالة الإحصائیة والدلالة العملیة لاختبار کا2 فی البحوث الإداریة المنشورة (دراسة تقویمیة). المجلة العربیة للعلوم الإداریة . (12 ) ، (2) ، 169-193 .

النجار، عبد الله (1991) . دراسة تقویمیة مقارنة للأسالیب الإحصائیة التی استخدمت فی تحلیل البیانات فی رسائل الماجستیر فی کل من کلیة التربیة جامعة أم القرى بمکة المکرمة وکلیة التربیة بجامعة الملک سعود بالریاض ، رسالة ماجستیر ، مکة المکرمة ,  کلیة التربیة جامعة أم القرى  .

نصار، یحیى (2002). حجم الأثر کأسلوب إحصائی مکمل لفحص الفرضیات الإحصائیة ، مرکز بحوث کلیة التربیة -  الریاض  ,جامعة الملک سعود، العدد 176. 

ثانیاً المراجع الأجنبیة:

Anderson, D , Burnham,K , and Thompson, W (2000). Null Hypothesis Testing:Problems ,Prevalance, and an Alternative. Journal of Wildlife Management, 64 , 912-923 .

Aguinis, H and Beaty , J. and Boik , R and Pierce , D (2005). Effect Size and Power in Assessing Moderating Effects of Categorial Variables Using Multiple Regression :A 30-Year Review. Journal of Applied Psychology, 91 , 1,94-107 .

Bayarri, M and Mayoral, A (2002). Bayesian Analysis and Testing for Comparison of Effect Sizes. Journal of Statistical Planning and Inference, 103 , 225-243 .

Bird, K (2002). Confidence Intervals for Effect Sizes in Analysis of Variance. Educational and Psychological Measurement, 62 , 2, 197-226 .

Chase, L. and chase, R (1976) A Statistical Power Analysis of Applied Psychological Research, Journal of Applied psychology, 61: 234-237 .

Elmore, P and Rotou, O (2001).A Primer on Basic Effect Size Concepts .Paper Produced at the Annual Meeting of the American Educational Research Association .

Hashgwhzyse. R , waechter, D. and Solomon, G. (1982). How Significant is a Significant Difference? Average Effect Size of Research in Counseling Psychology, Journal of Counseling Psychology, 29, 58-65 .

Huberty, C (2002). A History of Effect Size Indices. Educational and Psychological Measurement, 62 , 2, 227-240 .

Huston, H (1993). Meaning Fullness, Statistical Significance, Effect Size and Power Analysis: A General Discussion with Implications for MANOVA, Paper presented at the annual meeting of the mid – south Educational Research Association , 22 nd ,New Orleans, ERIC  Document Reprcuctive Service. No ED 364608 .

Lane,  G  (1999). Show  my the Magnitude! The Consequences of Overemphasis on  Null  Hypothesis Significance Testing. Paper presented at the annual meeting of the mid – south educational research association (al, November 16-19, 1999). (Eric document Reproductive service no. ED 436557).

Maxwell , S and Delaney , H ( 2004 ) . Designing experiments and analyzing data : A model comparisonperspective ( 2 nd ed ) . Mahwah , NJ : Lawrence Erlbaum .

McGrath, R  and Meyer , G  (2006). When Effect Sizes Disagree  : The Case of r and d. Psychological Methods, 11 , 4,386-401.

Mclean, J and Eronest, J (1997). Has Testing for Statistical Significance outlived its usefulness? Paper presented at the annual meeting of the mid-south. Educational  Research  association (26, mephis, TN November. 12-14, 1997) (eric reproductive service NO. Ed 415265).

Olejnik,  S and  Algina,  J  (2000). Measures of Effect Size for Comparative Studies: Applications, Interpretations, and Limitations. Contemporary Educational Psychology,  25, 241-286 .

Parker, R and Hagan-Burke, S (2007). Useful  Effect Size Interpretations for Single Case Research. Behavior Therapy, 83 , 95-105.

Roberts, M and Henson, R (2002). Correction  for Bias in Estimating  Effect Sizes. Educational and Psychological Measurement , 62 ,2, 241-253.

Robey,  R (2004). Reporting Point and Interval Estimates of Effect-Size for Planned Contrasts : Fixed Within Effect Analyses of Variance. Journal of Fluency Disorders, 29 , 307-341.

Rosnow, R and Rosenthal , R and Rubin ,D (2000). Contrasts  and Correlations in Effect Size Estimations. Psychological Science, 11 , 446-453.

Shaver, J  (1992). What Statistical Significance Testing Is , and what it is not? Journal of experimental Education, 61, 4 , 293- 316.

Smithson, M (2001). Correct Confidence Intervals for Various Regression Effect Sizes and Parameteters : the Importance of NonCentral Distributions in Computing Intervals. Educational and Psychological  Measurement  , 61 ,4, 605-632.

Snyder, p. and Lawson , S (1993). Evaluating Results using Corrected and Uncorrected Effect Size Estimates. Journal of Experimental Education, 61, 334-349.

Thompson, B  (2002). Statistical ,practical, and clinical :how many kinds of significance do Counselors need to consider? Journal of Counseling and Development , 80,64- 71.

Welge , P (1990). Looking beyond Statistical Significance: Result Importance and Result Generalizability. Paper presented at the Annual Meeting of the American Psychological Society NO. Ed 320-965 .

Wilcox, R (2006). Graphical  Methods for  assessing Effect  Size : some Alternatives to Cohen's d. Journal of Experimental Education, 74 (4) , 353-367.

Wright , D (2003 ) . Making Friends with your data : Improving how statistics are conducted  and Reprovted . British Journal of Educational Psychology . 73, 123- 136 .

 

 

 

 

 

أولا: المراجع العربیة:
ابراهیم، ألطاف (1998) . واقع الدلالات الإحصائیة والعملیة وقوة الاختبارات الإحصائیة المستخدمة فی رسائل ماجستیر علم النفس التربوى فى الجامعة الأردنیة. رسالة ماجستیر , الأردن , الجامعة الأردنیة  .
أبو حطب ، فؤاد و صادق ، آمال (1991) . مناهج البحث وطرق التحلیل الإحصائی فی العلوم النفسیة والتربویة والاجتماعیة0 القاهرة ، الأنجلو المصریة.
أبو زید ، مدحت (2002) . الإحصاء فی العلوم السلوکیة الوصف الإحصائی (1) تبویب البیانات وتمثیلها بیانیا ونزعتها المرکزیة. الإسکندریة ، دار المعرفة الجامعیة.
أبو هاشم ، السید (2005) . مؤشرات التحلیل البعدی لبحوث فعالیة الذات فی ضوء   نظریة باندورا. مرکز بحوث کلیة التربیة بجامعة الملک سعود ، العدد 238. الریاض .
بابطین ، عادل (2002) . مشکلات الدلالة الإحصائیة فی البحث التربوی وحلول بدیلة ، رسالة ماجستیر ، جامعة أم القرى، مکة المکرمة  .
بری ، عدنان وهندی، محمود وراضی، الحسینی (1998) . اساسیات طرق التحلیل الإحصائیة , الریاض , جامعة الملک سعود .
تشاو ، لنکولن  (1990) . الإحصاء فى الإدارة. ترجمة عبد المرضى عزام ، الریاض  . دار المریخ للنشر .
توفیق ، عبد الجبار ( 1985) . التحلیل الإحصائی فی البحوث التربویة والنفسیة و الاجتماعیة – الطرق اللا معلمیة 0 الکویت ، مؤسسة الکویت للتقدم العلمی .
الجادری، عدنان (2003 ) . الإحصاء الوصفی فی العلوم التربویة ، عمان: دار المسیرة للنشر والتوزیع والطباعة .
حجیمات، تحسین ( 1995) . دراسة واقع الدلالة العملیة وقوة الأختبارات الإحصائیة المستخدمة فی رسائل الماجستیر فی مجال الإرشاد والتوجیة ، رسالة ماجستیر , الأردن , الجامعة الأردنیة  .
الدردیر , عبد المنعم (2006) . الإحصاء البارامترى و اللابارامترى فى اختبار فروض البحوث النفسیة و التربویة و الإجتماعیة  . القاهرة . عالم الکتب.
سلیم , صباح  و  أبو حویج , مها  (2004) . مقدمة فى الإحتمالات و الإحصاء  , عمان . دار قندیل للنشر .
سمیث , ج ملتون  (1985) .  الدلیل إلى الإحصاء فى التربیة و علم النفس . ترجمة ابراهیم بسیونى عمیرة   , القاهرة  , دار المعارف .
الشربینى , زکریا  (1995) . الإحصاء وتصمیم التجارب فی البحوث النفسیة والتربویة والإجتماعیة , القاهرة  , الأنجلو المصریة .
الصائغ ، ابتسام (1996) . الدلالة الإحصائیة والدلالة العملیة لاختبار  (ت) و(ف) دراسة تحلیلیة تقویمیة من خلال رسائل الماجستیر التی قدمت فی کلیة التربیة بجامعة أم القرى بمکة المکرمة ، رسالة ماجستیر ، مکة المکرمة، جامعة أم القرى.
الصیاد ، عبد العاطی  (1988) . الدلالة العملیة وحجم العینة المصاحبتین للدلالة الإحصائیة لاختبار (ت) فی البحث التربوی والنفسی العربی – بحوث مؤتمر البحث التربوی الواقع والمستقبل. المجلد الثانی ، القاهرة ، ص 199 -230 .
الضوی , محسوب  (2006) . الإحصاء الاستدلالى المتقدم فى التربیة و علم النفس , القاهرة  , الأنجلو المصریة .
العجلان , فتحیة محمد ( 1990 ) . دراسة تقویمیة للأسالیب الإحصائیة المستخدمة فی رسائل الماجستیر بکلیة التربیة بجامعة أم القرى . مکة المکرمة . جامعة أم القرى .
علام , صلاح الدین  (1993) .  الأسالیب الإحصائیة الاستدلالیة البارامتریة و اللابارامتریة فى تحلیل بیانات البحوث النفسیة و التربویة , القاهرة , دار الفکر العربى .
عودة , أحمد / القاضى , منصور  (2002) . الإحصاء الوصفى و الاستدلالى   , الکویت , مکتبة الفلاح للنشر و التوزیع .
ماضى , محمد  و عثمان , ماجد  (2005) . الإحصاء فى التربیة و علم النفس مع استخدام SPSS و Minitab ,الطبعة الثانیة , دبى , دار القلم للنشر و التوزیع .
محمود ، فریال (2003 ) . واقع الدلالة الاحصائیة والدلالة العملیة وقوة الاختبار للاختبارات الاحصائیة المستخدمة فی رسائل الماجستیر الصادرة عن کلیة العلوم التربویة فی جامعة مؤتة ، رسالة ماجستیر ، الأردن , جامعة مؤتة .
مراد ، صلاح (2000) . الأسالیب الإحصائیة فی العلوم النفسیة والتربویة والاجتماعیة ، القاهرة ، الانجلو المصریة .
منسی ، محمود (1989) . الإحصاء والقیاس فی التربیة وعلم النفس. الإسکندریة، دار المعرفة الجامعیة .
منصور، رشدی فام (1997م) . حجم التأثیر – الوجه المکمل للدلالة الإحصائیة، المجلة المصریة للدراسات النفسیة ، العدد (16) ، 57-75 .
المنیزل , عبدالله  (2000) .  الإحصاء الاستدلالى وتطبیقاته فى الحاسوب بإستخدام الرزم الإحصائیة  SPSS  , عمان , دار وائل للنشر .
النجار ، عبد الله (2005) . الدلالة الإحصائیة والدلالة العملیة لاختبار کا2 فی البحوث الإداریة المنشورة (دراسة تقویمیة). المجلة العربیة للعلوم الإداریة . (12 ) ، (2) ، 169-193 .
النجار، عبد الله (1991) . دراسة تقویمیة مقارنة للأسالیب الإحصائیة التی استخدمت فی تحلیل البیانات فی رسائل الماجستیر فی کل من کلیة التربیة جامعة أم القرى بمکة المکرمة وکلیة التربیة بجامعة الملک سعود بالریاض ، رسالة ماجستیر ، مکة المکرمة ,  کلیة التربیة جامعة أم القرى  .
نصار، یحیى (2002). حجم الأثر کأسلوب إحصائی مکمل لفحص الفرضیات الإحصائیة ، مرکز بحوث کلیة التربیة -  الریاض  ,جامعة الملک سعود، العدد 176. 
ثانیاً المراجع الأجنبیة:
Anderson, D , Burnham,K , and Thompson, W (2000). Null Hypothesis Testing:Problems ,Prevalance, and an Alternative. Journal of Wildlife Management, 64 , 912-923 .
Aguinis, H and Beaty , J. and Boik , R and Pierce , D (2005). Effect Size and Power in Assessing Moderating Effects of Categorial Variables Using Multiple Regression :A 30-Year Review. Journal of Applied Psychology, 91 , 1,94-107 .
Bayarri, M and Mayoral, A (2002). Bayesian Analysis and Testing for Comparison of Effect Sizes. Journal of Statistical Planning and Inference, 103 , 225-243 .
Bird, K (2002). Confidence Intervals for Effect Sizes in Analysis of Variance. Educational and Psychological Measurement, 62 , 2, 197-226 .
Chase, L. and chase, R (1976) A Statistical Power Analysis of Applied Psychological Research, Journal of Applied psychology, 61: 234-237 .
Elmore, P and Rotou, O (2001).A Primer on Basic Effect Size Concepts .Paper Produced at the Annual Meeting of the American Educational Research Association .
Hashgwhzyse. R , waechter, D. and Solomon, G. (1982). How Significant is a Significant Difference? Average Effect Size of Research in Counseling Psychology, Journal of Counseling Psychology, 29, 58-65 .
Huberty, C (2002). A History of Effect Size Indices. Educational and Psychological Measurement, 62 , 2, 227-240 .
Huston, H (1993). Meaning Fullness, Statistical Significance, Effect Size and Power Analysis: A General Discussion with Implications for MANOVA, Paper presented at the annual meeting of the mid – south Educational Research Association , 22 nd ,New Orleans, ERIC  Document Reprcuctive Service. No ED 364608 .
Lane,  G  (1999). Show  my the Magnitude! The Consequences of Overemphasis on  Null  Hypothesis Significance Testing. Paper presented at the annual meeting of the mid – south educational research association (al, November 16-19, 1999). (Eric document Reproductive service no. ED 436557).
Maxwell , S and Delaney , H ( 2004 ) . Designing experiments and analyzing data : A model comparisonperspective ( 2 nd ed ) . Mahwah , NJ : Lawrence Erlbaum .
McGrath, R  and Meyer , G  (2006). When Effect Sizes Disagree  : The Case of r and d. Psychological Methods, 11 , 4,386-401.
Mclean, J and Eronest, J (1997). Has Testing for Statistical Significance outlived its usefulness? Paper presented at the annual meeting of the mid-south. Educational  Research  association (26, mephis, TN November. 12-14, 1997) (eric reproductive service NO. Ed 415265).
Olejnik,  S and  Algina,  J  (2000). Measures of Effect Size for Comparative Studies: Applications, Interpretations, and Limitations. Contemporary Educational Psychology,  25, 241-286 .
Parker, R and Hagan-Burke, S (2007). Useful  Effect Size Interpretations for Single Case Research. Behavior Therapy, 83 , 95-105.
Roberts, M and Henson, R (2002). Correction  for Bias in Estimating  Effect Sizes. Educational and Psychological Measurement , 62 ,2, 241-253.
Robey,  R (2004). Reporting Point and Interval Estimates of Effect-Size for Planned Contrasts : Fixed Within Effect Analyses of Variance. Journal of Fluency Disorders, 29 , 307-341.
Rosnow, R and Rosenthal , R and Rubin ,D (2000). Contrasts  and Correlations in Effect Size Estimations. Psychological Science, 11 , 446-453.
Shaver, J  (1992). What Statistical Significance Testing Is , and what it is not? Journal of experimental Education, 61, 4 , 293- 316.
Smithson, M (2001). Correct Confidence Intervals for Various Regression Effect Sizes and Parameteters : the Importance of NonCentral Distributions in Computing Intervals. Educational and Psychological  Measurement  , 61 ,4, 605-632.
Snyder, p. and Lawson , S (1993). Evaluating Results using Corrected and Uncorrected Effect Size Estimates. Journal of Experimental Education, 61, 334-349.
Thompson, B  (2002). Statistical ,practical, and clinical :how many kinds of significance do Counselors need to consider? Journal of Counseling and Development , 80,64- 71.
Welge , P (1990). Looking beyond Statistical Significance: Result Importance and Result Generalizability. Paper presented at the Annual Meeting of the American Psychological Society NO. Ed 320-965 .
Wilcox, R (2006). Graphical  Methods for  assessing Effect  Size : some Alternatives to Cohen's d. Journal of Experimental Education, 74 (4) , 353-367.
Wright , D (2003 ) . Making Friends with your data : Improving how statistics are conducted  and Reprovted . British Journal of Educational Psychology . 73, 123- 136 .