استخدام القيم الاحتمالية Plausible value.
يعد قياس الأداء في المجالات المعرفية أحد الاهتمامات الرئيسية للتقييمات الدولية واسعة النطاق، مثل PISA أو TIMSS أو PIRLS. غالبًا ما تتضمن أداة التقييم أسئلة أو عناصر متعددة، ويتم إجراؤها في فترة زمنية محدودة بهدف توفير معلومات قابلة للمقارنة حول قدرة الطلاب ومعرفتهم في مجالات مختلفة، مثل القراءة أو الرياضيات أو العلوم. لتحقيق هذا العرض تصميم أدوات قياس معقدة تتضمن النظر في المجالات الفرعية المختلفة داخل كل مجال موضوع. ينتج عن هذا عدد كبير من الأسئلة أو العناصر التي يجب تقديمها لتغطي مدى واسع من المجال المعرفي المستهدف. تقسم جميع العناصر الاختبارية إلى كتل أو مجموعات متعددة (كتيبات). وذلك نظرًا لصعوبة تقديم جميع هذه الأسئلة على كل تلميذ، ولمحدودية وقت إجراء الاختبار كحد أقصى ساعتين (يعتمد هذا القيد على وقت الاختبار على اعتبارات تتعلق بتقليل عبء الطالب، وتقليل الانقطاعات في جدول المدرسة والقيود المالية و / أو الزمنية الأخرى). بعد ذلك، يتم إعطاء كل طالب كتب (كتلة) أو أكثر من هذه الكيبات (الكتل)، وبالتالي يستجيب الطالب إلى جزء بسيط مما يشكل مجموع عناصر (أسئلة) التقييم، ويجيب مجموعات الطلاب على جميع الأسئلة.
وكون الطلاب يجيبون فقط على عدد محدود من الأسئلة من مجموع عناصر الاختبار، يقاس الأداء الفردي مع وجود قدر كبير من خطأ القياس. وعليه؛ فإن الطرق التقليدية لتقدير الأداء الفردي قد تؤدي إلى تقديرات تباين متحيزة أو غير متسقة. كبديل لهذه المشكلة، تستخدم أساليب القيمة الاحتمالية (المعقولة) كأسلوب قابل للتطبيق لتوليد تقديرات للأداء من الجزء المحدود من العناصر المعرفية التي يتم إدارتها ومعلومات خلفية الطالب. ولأن أداء الطالب لا تتم ملاحظتها بشكل مباشر، فهي متغير كامن (أو قدرة كامنة) يمكن التعامل معها على أنها قيمة مفقودة؛ وبالتالي، من الضروري استخدام طرق حساب متعددة، لتقدير توزيع الكفاءة لكل طالب في كل مجال مستهدف.
يمكن تعريف القيم الاحتمالية على أنها عدة قيم عشوائية مستمدة من توزيع تقديرات الكفاءة، تستخدم من قبل الباحثين التطبيقيين لأغراض مختلفة، مثل تقدير النطاق الاحتمالي، وموقع الكفاءة لمجموعات من الطلاب أو استكشاف العلاقة بين الكفاءة والمتغيرات الاجتماعية والتعليمية المختلفة في التحليل الثانوي. ومع ذلك، تجدر الإشارة إلى أن القيم الاحتمالية ليست درجات فردية بالمعنى التقليدي، وبالتالي لا ينبغي تحليلها كمؤشرات متعددة لنفس الدرجة أو كمتغيرات كامنة.
لكل طالب متغير قدرة كامنة غير قابل للرصد ويتم تعيين قيم متعددة للمتغير (Laukaityte & Wiberg, 2017) تحدد منظمة التعاون الاقتصادي والتنمية القيم الاحتمالية كأرقام مخصصة عشوائيًا للأفراد من توزيع الدرجات. لا ينبغي اعتبار القيم الاحتمالية بما في ذلك مكونات تباين الخطأ العشوائي كدرجات اختبار، بل يجب استخدامها لتحديد أداء المجتمع (OECD, 2017). يتم تعيين قيم متعددة لكل فرد لتقليل خطأ القياس (Laukaityte & Wiberg, 2017) إذا كان خطأ القياس صغيرًا، فستكون القيم المتعددة المخصصة للفرد قريبة من بعضها البعض. على العكس من ذلك، إذا كان خطأ القياس كبيرًا، فإن القيم المتعددة المخصصة للفرد ستكون بعيدة عن بعضها البعض (Wu, 2005). تصبح الاستنتاجات من الدراسات واسعة النطاق أكثر صحة بفضل القيم الاحتمالية المخصصة (Laukaityte & Wiberg, 2017). تعلن دراسة (TIMSS) عن خمس قيم احتمالية لكل طالب في الرياضيات والعلوم، وتعلن دراسة (PIRLS) عن خمسة أخرى لكل طالب في القراءة. في السنوات الأخيرة استخدمت دراسة (PISA) عشر قيم احتمالية لـ PISA 2015 و PISA 2018 لكل مجال (الرياضيات والقراءة والعلوم)، في حين استخدمت في الدورات السابقة خمس قيم احتمالية.
Laukaityte, I., & Wiberg, M. (2017). Using plausible values in secondary analysis in large-scale assessments. Communications in Statistics-Theory and Methods, 46(22), 11341-11357.
Wu, M. (2005). The role of plausible values in large-scale surveys. Studies in Educational Evaluation, 31(2-3), 114-128.
The Organisation for Economic Co-operation and Development (OECD). (2017). PISA 2015 Technical Report. Paris: OECD Publishing. Retrieved from https://www.oecd.org/pisa/sitedocument/PISA-2015-technical-report-final.pdf