انواع آزمون براساس ويژگيهاي مورد اندازهگيري
آزمونهاي مختلف را ميتوان با توجه به ويژگيهاي گوناگوني كه اندازه ميگيرند، ابتدا به دو دستهي كلي آزمونهاي توانايي و آزمونهاي عاطفي تقسيم كرد و بعد، هريك از اين دو دسته را نيز به اجزاي كوچكتري مطابق نمودار دستهبندي كرد:
آزمونهاي توانايي: آزمونهاي توانايي، آموختهها، مهارتها و استعدادهاي افراد را ميسنجند. دستهاي از اين آزمونها، تواناييهاي شناختي افراد را و تعدادي ديگر تواناييهاي رواني- حركتي را اندازه ميگيرند.
آزمونهاي توانايي به دو دستهي آزمونهاي استعداد و آزمونهاي پيشرفت تحصيلي تقسيم ميشوند. آزمونهاي استعداد توانايي يا آمادگي فرد را براي انجام دادن كارهايي كه در پيش دارد و همچنين ظرفيت او را براي يادگيريهاي مختلف ميسنجند؛ اما آزمونهاي پيشرفت تحصيلي، دانش و مهارتهايي را كه فرد تا لحظهي اجراي آزمون كسب كرده است، اندازه ميگيرند. به سخن ديگر، آزمونهاي استعداد ناظر به آيندهاند و براي پيشبيني موفقيتهاي آتي فرد بهكار ميروند، درحالي كه آزمونهاي پيشرفت تحصيلي ناظر به گذشتهاند و براي تعيين آموختههاي قبلي فرد مورد استفاده قرار ميگيرند. آزمونهاي مختلف هوش معرف آزمونهاي استعداد هستند و آزمونها و امتحانهايي كه براي موضوعهاي گوناگون درسي تهيه ميشوند، آزمونهاي پيشرفت تحصيلي به حساب ميآيند.
آزمونهاي عاطفي: آزمونهاي عاطفي ويژگيهاي عاطفي و شخصيتي افراد را ميسنجند. آزمونهاي توانايي حداكثر عملكرد آزمون شونده را اندازه ميگيرند؛ بدين معني كه نشان ميدهند آزمون شونده در بهترين شرايط قادر به انجام چه كاري است، در حالي كه آزمونهاي عاطفي وضع موجود آزمون شونده را در موقعيتهاي طبيعي زندگي ميسنجند. يكي ديگر از وجوه اختلاف آزمونهاي عاطفي با آزمونهاي توانايي آن است كه آزمونهاي توانايي بهطور عمده براي مقاصد پيشبيني موفقيتهاي تحصيلي و شغلي مورد استفاده قرار ميگيرند، اما آزمونهاي عاطفي بيشتر به امور مشاوره در حل مسائل رواني، تربيتي و حرفهاي كمك ميكنند.
انواع آزمون با توجه به روش تهیه
از اين منظر، آزمونها به دو دستهی عمدهی «آزمونهای استاندارد شده» و «آزمونهای معلمساخته» تقسیم میشوند:
آزمونهاي استاندارد شده: آزمونهای استاندارد شده، آزمونهایی هستند که با استفاده از نمونههای بزرگِ آزمونشوندگان و غالباً به وسیلهی مؤسسههاي آزمونسازیِ دولتی یا خصوصی و یا مراکز آموزشی و علمی، برای اندازهگیری پیشرفت تحصیلی با مقاصد ارزشیابی از دورههای تحصیلی، تهیه و توزیع میشوند. در این نوع آزمونها، ملاکِ نسبی اندازهگیری مورد استفاده قرار میگیرد.
آزمونهاي معلمساخته: آزمونهای معلمساخته آزمونهایی هستند که معلمان برای سنجش پیشرفت تحصیلی دانشآموزان خود تهیه میکنند و در طول دورهی آموزش و یا در پایان دوره به اجرا درمیآورند. در این آزمونها، ملاکِ مطلق اندازهگیری مورد استفاده قرار میگیرد.
تفاوت آزمونهاي استاندارد شده و معلم ساخته
نخست اينكه: تهيهي آزمونهاي استاندارد شده در مقايسه با آزمونهاي معلم ساخته به زمان و تخصص بيشتري نياز دارد. از آنجا كه اين آزمونها براي بيش از يك بار استفاده تهيه ميشوند، مؤسسات آزمونساز، براي تهيهي آنها زمان و هزينهي زيادي بهكار ميگيرند. در تهيهي اين آزمونها برنامههاي درسي مورد بررسي دقيق واقع ميشوند، محتواي درسها و مهارتهاي مورد اندازهگيري نمونهگيري ميشوند، سؤالها به وسيلهي متخصصان نوشته و ويرايش ميشوند، صورت مقدماتي آزمون بهطور آزمايشي اجرا ميشود، سؤالها تجزيه و تحليل ميشوند و مورد تجديدنظر قرار ميگيرند و پس از هنجاريابي، صورت نهايي آزمون تهيه و جهت استفادهي گسترده عرضه ميشود. اما براي تهيهي آزمونهاي معلمساخته نيازي به گذر از اين مراحل مفصل نيست، زيرا اين آزمونها براي تعيين مقدار يادگيري دانشآموزان در درسهاي بخصوص تهيه و اجرا ميشود و پساز هر بار اجرا به سهولت قابل تجديدنظر و اصلاح هستند.
دوم اينكه: از آنجا كه آزمونهاي استاندارد شده براي استفاده در مناطق مختلف و مقايسهي دانشآموزان مدارس مناطق گوناگون با يكديگر تهيه ميشوند، هدفهاي مختلف آموزشي مناطق مختلف را بايد در اين آزمونها منظور كرد. اما آزمونهاي معلمساخته با توجه به محتوا و هدفهاي ويژهي درسهاي بخصوص تهيه ميشوند.
سوم اينكه: اصطلاح «آزمون استاندارد شده يا ميزان شده» به وجود دادههاي هنجاري اشاره ميكند، و ناشران اين نوع آزمونها براي معنيدار كردن نمرات آزمون خود هنجارهاي لازم را تدارك ميبينند. اما آزمونهاي معلم ساخته نيازي به هنجار و هنجاريابي ندارند. مقايسهي بين گروههاي مختلف دانشآموزان كه به وسيلهي آزمونهاي استاندارد شده سنجش ميشوند، وجود هنجارها را در اين نوع آزمونها ضروري ميسازد. بنابراين، هدف اصلي آزمونهاي استاندارد شده مقايسه است، مقايسهي يك فرد يا يك گروه با فرد يا گروه ديگر، يا مقايسهي جنبههاي مختلف عملكرد يك فرد يا يك گروه با خودش.
روایی آزمون
روايي0 اصطلاحي است كه به هدفي كه آزمون براي تحقق بخشيدن به آن درست شده است، اشاره ميكند. بنابر آنچه گفته شد، آزموني داراي روايي است كه براي اندازهگيري آنچه مورد نظر است، كافي و مناسب باشد. براي مثال، يك آزمون پيشرفت تحصيلي رياضي كلاس پنجم دبستان، درصورتي يك آزمون روا است كه محتوا و هدفهاي آن درس را بهخوبي اندازهگيري كند و بهجز يادگيري دانشآموزان از آن درس، چيز ديگري را شامل نباشد.
آزمونهاي مورد استفاده در آموزش و پرورش و روانشناسي داراي سه هدف عمده هستند كه به سه پرسش زير پاسخ ميدهند:
- آيا سؤالهاي آزمون از محتواي درس يا موضوع مورد نظر يك نمونهي خوب ارايه ميدهد؟
- آيا نمرات آزمون عملكرد فعلي يا آتي دانشآموزان را پيشبيني ميكند؟
- آيا نمرات آزمون به مفاهيم نظري يا سازههايي كه آزمون براي سنجش آنها درست شده، مربوط است؟
سه مورد فوق به ترتيب سه نوع روايي محتوايي، ملاكي و سازه را نشان ميدهد.
عوامل مؤثر بر روايي آزمون
عوامل دروني: نخستين عاملي كه ميتواند بر روايي آزمون تأثير بگذارد دستورالعمل يا راهنماي آزمون است. راهنماهايي كه دقيقاً به آزمونشوندگان نميگويند چگونه به سؤالها پاسخ دهند و چگونه پاسخ خود را ثبت نمايند، سطح روايي آزمون را كاهش ميدهند. عامل ديگري كه بر روايي آزمون تأثير بسزايي دارد كيفيت سؤالهاي آزمون است. سؤالهايي كه طبق قواعد درست سؤالنويسي تهيه شده باشند به روايي آزمون ميافزايند و برعكس سؤالهايي كه از هر لحاظ مشكل داشته باشند به روايي آزمون لطمه ميزنند. علاوه بر اين هر كدام از سؤالهاي آزمون كه از هدف اصلي آزمون جدا ميافتد و چيزي جدا از آن را شامل ميشود نيز به سهم خود از روايي كل آزمون ميكاهد. همچنين واژگان و جملهبندي پيچيده كه از حد درك آزمون شوندگان فراتر باشد به روايي آزمون لطمه ميزند. عامل دروني ديگري كه بر روايي آزمون تأثير دارد ترتيب قرار گرفتن سؤالهاي آزمون به دنبال يكديگر است. قرار دادن سؤالهاي بسيار دشوار در آغاز آزمون ممكن است سبب شود كه پاسخ دهندگان به آزمون نتوانند وقت خود را براي بخشهاي مختلف آزمون به درستي تقسيم كنند. همچنين اگر سؤالهاي مختلف آزمون از لحاظ درجهي دشواري متنوع نباشند، روايي آزمون صدمه ميبيند. آزمونهايي كه داراي مجموعه سؤالهاي بسيار دشوار يا بسيار سادهاند از سطح روايي خوبي برخوردار نيستند. از عوامل ديگر مؤثر بر روايي، طول يك آزمون يا تعداد سؤالهاي آن است. يكي ديگر از راههاي بالا بردن سطح روايي آزمون افزايش تعداد سؤالهاي آن است. علاوه بر اين، در آزمونهايي كه با روايي محتوايي معرفي ميشوند، هر چه تعداد سؤالها بيشتر باشد نمونهي بهتري از محتواي مورد اندازهگيري را شامل خواهند بود و به همان نسبت به روايي آزمون افزوده ميشود.
عوامل بيروني: علاوه بر عوامل دروني، چندين عامل بيروني نيز وجود دارند كه بر روايي آزمونها تأثير ميگذارند و براي افزايش دادن سطح روايي يك آزمون ميتوان آنها را كنترل كرد. يكي از اين عوامل بيروني اجراي نامناسب آزمون است. كمبود زمان، فضاي نامناسب، مكان نامناسب و مانند اينها از عوامل اجرايي هستند كه بر عملكرد آزمونشوندگان و در نتيجه بر روايي آزمون تأثير نامطلوبي به جاي ميگذارند. علاوه بر اجراي نامناسب آزمون، اشكالات موجود در تصحيح پاسخهاي آزمونشوندگان و نمرهگذاري آنها به ويژه در آزمونهاي تشريحي ميتواند نتايج حاصل را مخدوش سازد و لذا از روايي آزمون بكاهد. عامل ديگر مؤثر بر روايي آزمون تركيب آزمونشوندگان از لحاظ توانايي مورد اندازهگيري است. هر چه گروه آزمونشوندگان از لحاظ توانايي مورد اندازهگيري نامتجانستر باشند روايي آزمون بيشتر خواهد بود. به همين دليل آزمونهايي كه وقتي با گروههاي نامتجانس به كار ميروند داراي روايي قابل ملاحظهاي هستند اگر با گروههاي داراي تجانس بيشتر به كار گرفته شوند سطح روايي كمتري از خود نشان خواهند داد. علاوه بر عوامل فوق، ويژگيهاي رواني آزمون شوندگان نيز ميتوانند بر روايي نمرات حاصل از يك آزمون تأثير داشته باشند. براي نمونه، بالا و پايين بودن سطح انگيزش آزمونشوندگان يا علاقهمند بودن و بيعلاقه بودن آنان نسبت به پاسخ دادن به سؤالهاي آزمون و نيز كمي يا زيادي سطح اضطراب آنان بر نمرات حاصل و لذا بر ميزان روايي تأثير ميگذارد. علاقهمندي آزمون شوندگان به شركت در آزمون و پايين بودن سطح اضطراب، بر دقت آنان و روايي نتايج آزمون تأثير مثبت به جاي ميگذارد، اما بيعلاقگي يا نفرت آزمونشوندگان يا اضطراب زياد آنان در جلسهي آزمون هم بر دقت عمل و هم بر روايي نتايج حاصل تأثير منفي دارد.
دستهبندی ارزشيابيهای پيشرفت تحصيلي
ارزشيابي به تمام روشهايي اشاره دارد كه در مدارس براي اندازهگيري رسمي عملكرد دانشآموزان مورد استفاده قرار ميگيرند. از جملهي اين روشها، امتحانات مستمر و امتحانات پاياني، ارزيابيهاي كتبي و نمرات هستند. معمولاً ارزشيابي دانشآموز بر پيشرفت تحصيلي تمركز دارد، ولي خيلي از مدارس، رفتارها و روشها را نيز ارزيابي ميكنند و ضمناً تعدادي از مدارس ابتدايي توصيفاتي را از رفتار دانشآموز در اختيار ميگذارند، مانند «از دستورات پيروي ميكند»، «با دقت گوش ميدهد»، « با ديگران كار ميكند» و «از زمان عاقلانه استفاده ميكند». در دورههاي راهنمايي، متوسطه و پيشدانشگاهي، رواج گزارشهاي رفتار به ترتيب كاهش مييابد ولي خيلي از دبيرستانها، دانشآموزان را طبق ملاكهايي چون «توانايياش بهبود مييابد»، «آمادگي دارد» و «وظيفهشناس است»، ارزشيابي ميكنند. ارزشيابي دانشآموزان شش هدف اصلي دارد:
دستهبندي ارزشيابيهاي پيشرفت تحصيلي با توجه به موضوع
ارزشيابي از دانشآموزان: ارزشيابي از دانشآموزان عمدتاً به معني ارزشيابي از پيشرفت تحصيلي يا ارزشيابي از ميزان يادگيري آنان است. استفاده از نتايج ارزشيابي دانشآموزي بهويژه نتايج ارزشيابي پيشرفت تحصيلي، نهتنها براي قضاوت دربارهي عملكرد يادگيرندگان، بلكه براي داوري دربارهي اثربخشي كيفيت آموزش، روشها و مواد آموزشي نيز مفيد است. ارزشيابي پيشرفت تحصيلي كه مهمترين نوع ارزشيابي آموزشي است، تعيين مينمايد كه دانشآموزان تا چه ميزاني به هدفهاي آموزشي از پيش تعيين شده رسيدهاند.
ارزشيابي از برنامههاي درسي و مواد آموزشي: ارزشيابي آموزشي، گاهي به منظور تعيين اثربخشي برنامهي درسي يا مواد آموزشي انجام ميشود و شامل ارزشيابي از عواملي چون روشهاي آموزشي، كتابهاي درسي، ابزارهاي ديداري- شنيداري و تداركات فيزيكي و سازماني است. در ارزشيابي از برنامههاي درسي و مواد آموزشي نيز عمدهترين ملاك، پيشرفت تحصيلي يا ميزان يادگيري دانشآموزان است.
ارزشيابي از پروژهها و برنامههاي آموزشي: علاوه بر برنامههاي درسي و مواد آموزشي، برنامهها و پروژههاي آموزشي ويژه نيز مورد ارزشيابي واقع ميشوند. منظور از پروژهها و برنامههاي آموزشي ويژه، كوششهايي است كه بهعنوان بخشي از برنامههاي معمول مدرسهها بهحساب نميآيند. اين برنامهها نوعاً ماهيت نوآورانه دارند و طول مدت حضورشان به موفقيتشان وابسته است.
ارزشيابي از مدرسه: منظور از ارزشيابي از مدرسه اين است كه تعيين شود هدفهاي پيشبيني شده براي مدرسه به چه ميزاني تحقق يافتهاند و نقاط قوت و ضعف كداماند. يكي از جنبههاي مهم ارزشيابي از مدرسه، برنامهي آزمون مدرسه است. هرچه اين برنامه جامعتر و كاملتر باشد، اطلاعات به دست آمده نيز به همان نسبت، قابل اعتمادتر و باارزشتر خواهد بود. مانند ساير ارزشيابيهاي آموزشي، در ارزشيابي از مدرسه نيز پيشرفت تحصيلي دانشآموزان مهمترين بخش برنامهي آزمون و منبع كسب اطلاعات است.
ارزشيابي از كاركنان مدرسه: مقصود از ارزشيابي از كاركنان مدرسه، ارزشيابي از همهي كساني است كه بهطور مستقيم يا غيرمستقيم مسئول بازده آموزشي مدرسه هستند. شايد پيچيدهترين نوع ارزشيابي، ارزشيابي از كار معلمان باشد. علت پيچيدگي اين روش ارزشيابي، كماعتباري و بيدقتي وسايل و روشهاي اندازهگيري و سنجش مورد استفاده در اين نوع ارزشيابي است؛ زيرا هيچيك از منابع اطلاعاتي، اطلاعات دقيق و بيغرضانهاي را كه براي يك ارزشيابي سالم، ضروري است، به دست نميدهد. بنابراين، متخصصان ارزشيابي معلم پيشنهاد ميكنند براي اينكه ارزشيابي سالمتري از معلمان بهعمل آيد، بايد از همهي منابع اطلاعاتي موجود دادههاي لازم را به دست آورد و قضاوت نهايي را بر اساس تركيبي از آنها انجام داد.
دستهبندي ارزشيابيهاي پيشرفت تحصيلي با توجه به ملاك مورد استفاده:
ارزشيابي وابسته به ملاك: در اين ارزشيابي كه ارزشيابي ملاكي ناميده ميشود، معيار يا ملاك ارزشيابي از پيش تعيين ميشود و عملكرد يادگيرنده با توجه به آن ملاك مورد قضاوت قرار ميگيرد. اين نوع ارزشيابي تعيين ميكند كه آيا دانشآموزان مطالب و هدفهايي را كه قرار بوده است بياموزند، آموختهاند يا نه.
ارزشيابي وابسته به هنجار: اين نوع ارزشيابي به جاي يك ملاك مطلق از پيش تعيين شده بر نوعي ملاك نسبي وابسته است. در اين نوع ارزشيابي ميتوان تعيين كرد كه پيشرفت يك دانشآموز نسبت به دانشآموزان ديگر چه وضعي دارد.
دستهبندي ارزشيابيهاي پيشرفت تحصيلي با توجه به زمان و هدف استفاده
ارزشيابي آغازين يا سنجش آغازين: نخستين ارزشيابي كه پيش از انجام فعاليتهاي آموزشي به اجرا درميآيد، ارزشيابي آغازين يا سنجش آغازين ناميده ميشود. اين نوع ارزشيابي به دو منظور مورد استفاده قرار ميگيرد:
1- آيا دانشآموزان بر دانشها و مهارتهاي پيشنياز درسِ تازه از قبل مسلطاند؟
2- دانشآموزان چه مقدار از هدفها و محتواي درس تازه را قبلاً ياد گرفتهاند؟
در مورد سؤال اول، سنجش آغازين به منظور اندازهگيري مهارتها و دانشهاي پيشنياز يادگيريِ درس تازه بهكار ميرود. در مورد سؤال دوم، بهجاي آزمون آمادگی، از آزمون جايابي يا آزمون پايهگزيني81 استفاده ميشود. هدف از آزمون جايابي يا پايهگزيني كه به آن پيشآزمون نيز گفته ميشود، تعيين ميزان اطلاعات يادگيرندگان از مطالبي است كه قرار است به آنان آموزش داده شود.
ارزشيابي تكويني: آنچه عمدتاً بهمنظور كمك به اصلاح موضوع مورد ارزشيابي، يعني برنامه يا روش آموزشي مورد استفاده قرار ميگيرد، ارزشيابي تكويني نام دارد. هدف از اجراي اين ارزشيابي، آگاه ساختن توليد كنندگان برنامه از نواقص برنامهي خود و كمك به اصلاح آنها است. هدف از كاربرد ارزشيابي تكويني در رابطه با پيشرفت تحصيلي دانشآموزان، آگاهي يافتن از ميزان و نحوهي يادگيري آنان براي تعيين نقاط قوت و ضعف يادگيري و نيز، تشخيص مشكلات روش آموزش معلم در رابطه با هدفهاي آموزشي است.
ارزشيابي تشخيصي: نوع ديگر ارزشيابي كه آن نيز در جريان آموزش انجام ميگيرد، ارزشيابي تشخيصي نام دارد. علت اين نامگذاري آن است كه اين ارزشيابي با هدف تشخيص مشكلات يادگيري دانشآموزان بهكار ميرود. اين آزمونها معمولاً به صورت انفرادي اجرا ميشوند و در قياس با آزمونهاي پيشرفت تحصيلي، سؤالهاي بيشتري را در بر ميگيرند. این ارزشیابی زمانی مورد استفاده قرار میگیرد که معلم با مشکلات مبرم و مکرری در یک یا چند دانشآموز روبهرو میشود، که با روشهای اصلاحیِ معمولِ ارزشیابی تکوینی قابل رفع نیست.
ارزشيابي تراكمي: در ارزشيابي تراكمي تمام آموختههاي دانشآموزان در طول يك دورهي آموزشي سنجش ميشوند و هدف آن، نمره دادن به دانشآموزان و قضاوت دربارهي اثربخشي كار معلم و برنامهي درسي يا مقايسهي برنامههاي مختلف درسي با يكديگر است. هدف ارزشيابي تراكمي هم نمره دادن و اتخاذ تصميمهاي مختلف و هم تعيين اثربخشي طرح آموزشي و هدفهاي معلم و ميزان موفقيت او در پياده كردن مراحل مختلف طرح آموزشي است.
دستهبندي ارزشيابيهاي پيشرفت تحصيلي با توجه به ارزشيابان
دو نوع ارزشيابي آموزشي ديگر كه با ارزشيابي تكويني و تراكمي رابطهي نزديكي دارند، ارزشيابي دروني12 و ارزشيابي بيروني22 است. منظور از ارزشيابي دروني، اين است كه ارزشيابي توسط كاركنان و دستاندركاران تهيه و اجراي برنامه، يعني افراد درون برنامه انجام ميشود و منظور از ارزشيابي بيروني، ارزشيابي توسط افراد يا گروههايي خارج از برنامه صورت گيرد. مك بيت و مك گلين (2002) هر دو نوع ارزشيابي دروني و بيروني را ضروري ميدانند و ارتباط بين آنها را مطابق شكل زير نشان دادهاند. دقت كنيد كه در اين شكل مدرسه در مركز قرار داده شده، براي اينكه تأكيد شود كه خودِ مدرسه نيروي محرك اصلي براي ارزشيابي است.
بنابراين، مدرسه بايد به اين پرسشها پاسخ دهد: ما تا چه اندازه خوب هستيم؟ از كجا ميدانيم؟ لايهي آخر نشاندهندهي ارزشيابي در سطح بينالمللي است. سؤالي كه در اينجا مطرح است، اين است كه «در مقايسه با ساير كشورها وضع ما چگونه است؟» مانند آزمونهاي تيمز و پرلز.
سنجش يادگيري دانشآموزان
مهمترين وسيلهي سنجش پيشرفت تحصيلي دانشآموزان، آزمون است؛ البته بايد در نظر داشت كه آزمونهاي پيشرفت تحصيلي متداول كه به آزمونهاي كتبي يا آزمونهاي مداد و كاغذي معروفاند، بهطور عمده با حوزهي شناختي سر و كار دارند. هدفهاي آموزشي و بازدههاي يادگيري متعلق به حوزههاي غيرشناختي، ازجمله نگرشها، علاقهها و ارج نهادنها (هدفهاي حوزهي عاطفي) و مهارتهاي مختلف مانند انجام آزمايش در آزمايشگاه، كار در كارگاه، فعاليتهاي ورزشي، و ايجاد ارتباط كلامي و غيركلامي (هدفهاي حوزهي رواني – حركتي) به كمك وسايل ديگر سنجش ازجمله: مشاهده، مقياس درجهبندي، فهرست وارسي، واقعهنگاري، ثبت حضور و غياب، گزارشهاي كار عملي، و مانند اينها سنجش ميشوند.
جدول مشخصات آزمون
مهمترين گام در تهيهي آزمونهاي پيشرفت تحصيلي، تهيهي جدول مشخصات براي موضوعي است كه قرار است آزمون آن تهيه شود. جدول مشخصات يك جدول دوبعدي است با تعدادي رديف و ستون، متناسب با محتوا و هدفهاي آموزشي درس. در رديف بالاي جدول كه بُعدِ محتوا نام دارد، اجزاي مطالب درسي نوشته ميشوند و در ستون كنار آن كه بُعدِ هدف ناميده ميشود، فهرست هدفهاي آموزشي قرار ميگيرد.
يك آزمون خوب پيشرفت تحصيلي آزموني است كه به بهترين شكل منعكس كنندهي تمامي هدفهاي آموزشي و همهي محتواي برنامهي درسي باشد. از لحاظ نظري، بهترين آزمون براي يك درس يا يك موضوع آزموني است كه تمام مطالب و كليهي هدفهاي آموزشي آن درس را شامل شود. اما اگر درس يا موضوع، مفصل باشد، تهيهي چنين آزموني غيرعملي است. بنابراين، بهجاي گنجانيدن همهي سؤالهاي ممكن تهيه كنندهي آزمون به انتخاب تعدادي سؤال نمونه كه معرف هدفها و محتواي درس باشد، اقدام ميكند. درصورتي چنين آزموني يك آزمون خوب يا به اصطلاح يك آزمون داراي روايي خواهد بود كه سؤالهاي آن حاوي نمونهي درستي از هدفها و محتواي درس باشد.
بعد از تكميل بُعد محتوا و بُعد هدف جدول مشخصات، آزمونساز بايد تعيين كند كه سؤالهاي آزمون خود را به چه صورتي در ميان هدفها و عنوانهاي درس توزيع نمايد؛ يعني تعداد سؤالهايي را كه به هر يك از موضوعهاي درسي و هدفهاي آموزشي اختصاص خواهند داشت، تعيين نمايد و اين تعداد را يا به صورت تعداد واقعي سؤالها يا به صورت درصد، در خانههاي جدول مشخصات وارد كند. براي تعيين درصد سؤالهايي كه به بخشهاي مختلف محتوا و هدفها تعلق ميگيرند، جواب سؤالهاي زير را بايد تعيين كرد:
- كدام بخش از محتوا و كدام دسته از هدفها داراي حجم بيشتري است و وقت بيشتري صرف آموزش آنها شده است؟
- كدام هدفها از لحاظ نگهداري در حافظه و كاربرد در آينده، ارزش بيشتري دارند؟
- كدام قسمت يا قسمتهاي درس يا موضوع درسي از اهميت بيشتري برخوردارند؟
انواع آزمونهاي پيشرفت تحصيلي کتبی
آزمونهاي پيشرفت تحصيلي كتبي را ميتوان ابتدا به دو دستهي بستهپاسخ و بازپاسخ تقسيم كرد و سپس اين دو دستهي كلي را نيز تقسيم نمود. آزمونهاي بستهپاسخ آزمونهايي هستند كه هم سؤالها و هم جواب سؤالها را در اختيار آزمونشوندگان قرار ميدهند و آزمونشوندگان دربارهي جوابهاي داده شده اعمالي انجام ميدهند يا تصميمهايي اتخاذ ميكنند.
در تصحيح برگههاي آزمونهاي بستهپاسخ نظر شخصي مصحح هيچگونه دخالتي ندارد و از اين رو به اين آزمونها آزمونهاي عيني ميگويند.
آزمونهاي بازپاسخ آزمونهايي هستند كه دانشآموز، خودش پاسخ خواسته شده را ميسازد يا توليد ميكند. آزمونهاي تشريحي، آزمونهاي كوتهپاسخ، امتحانات شفاهي انفرادي، توليد آثار هنري (شعر، موسيقي، نقاشي)، انجام پروژههاي تحقيقي از اين جملهاند. اين نوع آزمونها را نيز ميتوان به دو دستهي آزمونهاي گسترده پاسخ و آزمونهاي محدودپاسخ تقسيم كرد. شكل زير انواع آزمونهاي پيشرفت تحصيلي كتبي را نشان ميدهد:
آزمونهاي تشريحي
آزمونهاي تشريحي را با توجه به آزادي عمل دانشآموزان در پاسخ دادن به سؤالهاي آزمون، به دو دستهي گستردهپاسخ (مانند آزمون درس انشا) و محدودپاسخ (مانند آزمون درس رياضي) تقسيم ميكنند كه محاسن اين آزمونها به اين شرح است:
- تهيهي آزمونهاي تشريحي از تهيهي آزمونهاي بستهپاسخ آسانتر است.
- اين نوع آزمون بهترين وسيلهي سنجش توانايي دانشآموزان در پروراندن جواب سؤالها و بيان آنها است.
- اين آزمونها توانايي پاسخ دادن به سؤالها را ميسنجند نه توانايي انتخاب پاسخها را.
- آنها موقعيتهاي واقعيتري را از آزمونهاي بستهپاسخ به دانشآموزان عرضه ميكنند.
- آنها بر روش مطالعهي دانشآموزان تأثير مثبت بهجاي ميگذارند. اگر دانشآموزان از پيش بدانند كه با استفاده از آزمونهاي تشريحي، يادگيري آنان سنجش خواهد شد، با احتمال بيشتري به دنبال روابط در ميان مطالب به جستجو خواهند پرداخت و اطلاعات را به راههاي معنيدار سازمان خواهند داد.
معايب آزمونهاي تشريحي به شرح زير است:
- اين آزمونها با توجه به محدود بودن تعداد سؤالات آزمون، نمونهي كوچكي از محتواي درس و هدفهاي آموزشي را اندازه ميگيرند.
- تصحيح برگههاي امتحاني اينگونه آزمونها نميتواند با دقت و در شرايط يكسان انجام گيرد.
- تصحيح برگههاي امتحاني اين آزمونها بسيار وقتگير است.
آزمونهاي كوته پاسخ
آزمونهاي كوته پاسخ براي اندازهگيري هدفهاي شناختي سطوح پايين، بهويژه دانش يا معلومات، مفيد هستند. البته در پارهاي از اوقات از اين نوع سؤالها براي اندازهگيري هدفهاي سطح بالاتر نيز ميتوان استفاده كرد. يكي از محاسن آزمونهاي كوتهپاسخ، سهولت تهيهي سؤالها و تصحيح پاسخهاي آنها است. علاوه بر اين، در مقايسه با آزمونهاي بستهپاسخ، نظير آزمونهاي صحيح ـ غلط يا چندگزينهاي داراي مزاياي ديگري به شرح زير هستند:
- اجراي آنها آسان است.
- امكان تقلب را كاهش ميدهند.
- نسبت به آزمونهاي چندگزينهاي، صحيح- غلط و جور كردني اطلاعات تشخيصي بيشتري را در اختيار معلمان ميگذارند.
- امتياز ديگر آزمونهاي كوتهپاسخ اين است كه در آنها حدس كوركورانه كه از معايب عمدهي آزمونهاي بستهپاسخ است، وجود ندارد.
از معايب اين آزمونها كاربرد محدود آنها است. از آنجا كه پاسخ سؤالهاي اين نوع آزمونها بسيار مختصر است، نميتوان از آنها براي سنجش هدفهاي سطح بالاي يادگيري استفاده كرد و كاربرد آنها به اندازهگيري هدفهاي سطح دانش و حداكثر فهميدن و كاربستن (آن هم در موارد بسيار نادر) محدود ميشود. مشكل ديگر اين است كه كاربرد زياد اين آزمونها سبب تشويق دانشآموزان به حفظ كردن اطلاعات جزئي و بياهميت خواهد شد، زيرا در اين نوع آزمونها بيشتر اينگونه اطلاعات سنجيده ميشود.
آزمونهاي صحيح ـ غلط
در آزمونهاي صحيح- غلط تعدادي سؤال يا جمله در اختيار دانشآموزان گذاشته ميشود و او صحيح و غلط بودن آنها را تعيين ميكند. سؤالهاي صحيح- غلط سادهترين صورت سؤالهاي بستهپاسخ هستند و بهطور كلي ميتوان محاسن اين آزمونها را به شرح زير فهرست كرد:
- بيان موضوعهاي درسي در قالب عبارتهاي ساده.
- سادگي تهيه.
- عيني بودن تصحيح جوابها.
- قابليت پاسخگويي آزمونشونده به تعداد زيادي سؤال در هر جلسهي امتحان.
آزمونهاي صحيح ـ غلط را از جهاتي مورد انتقاد قرار دادهاند و ايرادهايي به آنها وارد كردهاند. ايرادهاي وارده به اين آزمونها را ميتوان به شرح زير برشمرد:
- اين آزمونها اغلب براي سنجش اطلاعات جزئي و كماهميت بهكار ميروند.
- حدس زدن كوركورانه در آنها خيلي زياد دخالت دارد.
- كاربرد زياد آنها سبب تأكيد بيمورد بر حفظ طوطيوار اطلاعات كماهميت ميشود.
- آنها بيشتر براي سنجش هدفهاي سطح پايين مفيداند و تواناييهاي پيچيدهي سطح بالا را اندازه نميگيرند.
آزمونهاي جوركردني
آزمونهاي جور كردني از تعدادي سؤال تشكيل ميشوند كه هريك از آنها شامل دو ستون است. يك ستون، معرف پرسشها و ستون ديگر نشاندهندهي پاسخها است. وظيفهي دانشآموز آن است كه پاسخها را با پرسشهاي مربوط جور كند. فايدهها و كاربردهاي سؤالهاي جور كردني را به نحو زير ميتوان خلاصه كرد:
- از آنجا كه پاسخ دادن به اين سؤالها زمان زيادي لازم ندارد، تعداد زيادي از آنها را ميتوان در يك زمان معين مورد استفاده قرار داد.
- تصحيح سؤالهاي جوركردني به سرعت و سهولت امكانپذير است و نيازي به مصحح متخصص ندارد.
آنجا كه بازده يادگيري بر توانايي تشخيص روابط بين امور تأكيد دارد و ميتوان تعدادي پرسش و پاسخ متجانس يافت، سؤالهاي جوركردني مهمترين نوع سؤالها هستند. معايب اين آزمونها را به صورت زير ميتوان خلاصه كرد:
- از آنجا كه در يادگيري تداعي بين امور، حفظ طوطيوار دخالت زيادي دارد و معلمان غالباً در تهيهي اين نوع سؤالها بر روابط حفظي بين امور تأكيد ميكنند، اين آزمونها اگر به دقت تهيه نشود، ممكن است دانشآموزان را به يادگيري مطالب سطحي و غيرعمقي سوق دهد.
- گاهي اوقات پيدا كردن مجموعهاي از پرسشها كه به اندازهي كافي شبيه به هم باشد تا بتوان براي آنها پاسخهاي همگوني پيدا كرد، كار دشواري است.
آزمونهاي چندگزينهاي
آزمون چند گزينهاي شامل تعدادي سؤال است كه هريك از آنها از يك قسمت اصلي و تعدادي گزينه (پاسخ) تشكيل ميشود و دانشآموز از ميان گزينههاي پيشنهادي، گزينهي صحيح را انتخاب ميكند.
آزمونهاي چندگزينهاي تمام محاسن آزمونهاي صحيح ـ غلط و جوركردني را دارد. علاوه بر آن، اين آزمونها قادر به اندازهگيري غالب بازدههاي يادگيري از دانش گرفته تا فهميدن، قضاوت كردن، حل مسأله، ارايهي پيشنهادهاي عملي و پيشبيني امور هستند. تقريباً هرگونه درك و فهم يا توانايي را كه بتوان با آزمونهاي ديگر- كوتهپاسخ، كامل كردني، صحيح غلط، جوركردني يا تشريحي- اندازه گرفت، ميتوان با آزمونهاي چندگزينهاي سنجش كرد.
بهطور كلي محاسن آزمونهاي چندگزينهاي را ميتوان به شرح زير بيان كرد:
- اين آزمونها از ساير آزمونهاي بستهپاسخ، انعطافپذيرترند. آنها علاوه بر دانش، توانايي استدلال، قضاوت و بسياري بازدههاي مهم ديگر يادگيري را ميسنجند.
- با استفاده از سؤالهاي چندگزينهاي ميتوان در يك زمان محدود تعداد زيادي از هدفهاي آموزشي و بخش مهمي از محتواي درس را اندازهگيري كرد.
- آزمونهاي چندگزينهاي نسبت به آزمونهاي صحيح- غلط كمتر امكان حدس زدن كوركورانه را به آزمونشوندگان ميدهند.
- پاسخهاي اين سؤالها به سادگي و با عينيت كامل قابل تصحيح هستند.
- دانشآموزان و معلمان اين نوع آزمونها را به ساير آزمونهاي بستهپاسخ ترجيح ميدهند.
- اگر گزينههاي انحرافي اين آزمونها با توجه به اشتباهات و كجفهميهاي متداول دانشآموزان تهيه شوند، منبع بسيار مناسبي براي تشخيص مشكلات دانشآموزان خواهند بود.
آزمونهاي چندگزينهاي از چند نظر مورد انتقاد قرار گرفتهاند. ما در اينجا اين انتقادها را بهعنوان معايب آزمونهاي چندگزينهاي ذكر ميكنيم.
- ساختن اين آزمونها بسيار دشوار است. معلمان غالباً نميتوانند تعدادي گزينهي انحرافي خوب براي سؤالهاي چندگزينهاي انتخاب كنند.
- معلمان اغلب سؤالهاي چندگزينهاي را در حد سنجش اطلاعات جزيي و كماهميت مينويسند. البته اين ايرادي است كه به همهي آزمونهاي بستهپاسخ از جمله آزمونهاي چندگزينهاي وارد است.
- در مقايسه با آزمونهاي صحيح- غلط، خواندن اين آزمونها و پيدا كردن گزينهي درست مستلزم صرف وقت زيادتري است.
- زماني كه به پاسخهاي غلط نمرهي منفي داده ميشود، دانشآموزاني كه خطر ميكنند، از ساير دانشآموزان نمرههاي بهتري ميگيرند. همچنين دانشآموزاني كه در پاسخ دادن به اينگونه سؤالها باتجربه هستند، از ديگر دانشآموزان نمرههاي بهتري كسب ميكنند.
- دانشآموزان قوي بيشاز دانشآموزان معمولي قادر به پيدا كردن اشكالات، پيچيدگيها و نظرگاههاي واگرا (غيرمعمولي) در سؤالها هستند. اما از آنجا كه تنها يك پاسخ صحيح در سؤال وجود دارد، بابت اين تيزبينيهاي خود نهتنها تشويق نميشوند، بلكه با دادن جوابي كه مورد نظر طراح سؤال نيست، ممكن است تنبيه هم بشوند.
نمرهگذاري و تحليل آزمون
نمرات معيار: نمرات معيار، عملكرد هر دانشآموز را در يك آزمون، بنا بر اختلاف عملكرد او از ميانگين گروه، برحسب واحد انحراف معيار نشان ميدهد. آن دسته از نمرات معيار كه داراي توزيعي با ميانگين صفر و انحراف معيار واحد هستند، به نمرات Z شهرت دارند.
نمرهي T (نمرهي تراز): نمرهي T با ضرب نمرات Z در عدد ثابت a و جمع كردن نمرات حاصل با عدد ثابت b بهدست ميآيد. بنابراين، آن دسته از نمرات معيار كه داراي توزيعي با ميانگين b و انحراف معيار a است، توزيع نمرات T نام دارد.
T = aZ + b
در محاسبهي نمرهي تراز آزمونهاي مرآت، ميانگين 5000 و انحراف معيار 2250 درنظر گرفته ميشود. درنتيجه:
T = 2250Z + 5000
نمودار نرمال: پراكندگي نمرات معيار به صورت نرمال است. منحني نرمال از لحاظ شكل، شبيه به منحني زير است. در اين منحني، مقايسهي درصدها و نمرات معيار، در توزيعِ نرمال مشاهده ميشود.
خصوصيات نمودار نرمال
- دو قسمت منحني نرمال نسبت به خط وسط آن قرينه هستند.
- در توزيعي كه اين منحني مُعرف آن است، اكثر نمرهها در وسط توزيع انباشته شدهاند.
- هرچه از وسط منحني به دوطرف آن پيش برويم، از ارتفاع منحني (حجم نمرات) كاسته ميشود و در انتهاي منحني دنبالههاي طويلي بهوجود ميآيند.
- دو امتداد منحني در بينهايت محور افقي را قطع ميكنند، زيرا تعداد مواردي كه لازم است تا يك منحني نرمال واقعي درست شود، از لحاظ نظري بينهايت است.
- در منحني نرمال، ميانگين، ميانه و نما بر روي هم قرار دارند.
- در روي اين منحني دو نقطه وجود دارد كه در آنها جهت منحني تغيير ميكند. اين دو نقطه در فواصل 1 انحراف معيار از ميانگين قرار دارند.
- در منحني نرمال، بين انحراف معيارها و نسبت افراد يك رابطهي دقيق رياضي وجود دارد و در هر واحد انحراف معيار هميشه يك نسبت ثابت از افراد موجود است. اگر تمام سطح منحني نرمال را برابر يك واحد فرض كنيم، 26/68% = 13/34×2 از كل سطح منحني بين 1+ و 1- انحراف معيار واقع است. ضمناً در حدود 44/95% مساحت زير منحني بين 2+ و 2- انحراف معيار قرار دارد و در حدود 74/99% اين مساحت نيز در فاصلهي 3+ و 3- انحراف معيار واقع است. بنابراين، تقريباً تمام سطح زير منحني نرمال در اين فاصلهي انحراف معيار قرار دارد. بههمين سبب است كه محققان و آمارگران، سطح منحني نرمال را عملاً بين 3+ و 3- انحراف معيار فرض ميكنند.
تحليل سؤالهاي آزمون
هدف از تحليل سؤالهاي آزمون، وارسي تك تك سؤالها و تعيين ميزان دقت و نارساييهاي آنهاست. در تحليل سؤالهاي آزمون، نقاط قوت و ضعف يك آزمون و كيفيت همهي سؤالهاي آن تعيين ميشود.
براي تهيهي يك آزمون خوب، علاوه بر رعايت پيشنهادهايي كه پيشتر ارايه شد، تحليل پاسخهاي آزمون شوندگان و بررسي تجربي آنها ضروري است. تحليل پاسخهاي آزمون شوندگان، اطلاعات تشخيصي لازم را براي بررسي كيفيت يادگيري دانشآموزان و مشكلات آموزشي معلمان فراهم ميآورد.
براي تحليل سؤالهاي يك آزمون، لازم است ضرايب دشواري و تمييز هر سؤال را تعيين كرد و به تحليل گزينههاي انحرافي سؤالها پرداخت.
ضريب دشواري: درصد كل آزمونشوندگاني كه به يك سؤال جواب درست ميدهند، ضريب دشواري آن سؤال است.
بهطور كلي، ضريبهاي دشواري بين 3/0 تا 7/0 حداكثر اطلاع را دربارهي تفاوت بين آزمونشوندگان بهدست ميدهند.
ضريب تمييز: برخلاف ضريب دشواري كه ميزان آسان يا دشوار بودن يك سؤال را نشان ميدهد، ضريب تمييز، كه با d نشان داده ميشود، قدرت سؤال را در تمايزگذاري يا تشخيص بين گروه قوي و گروه ضعيف آزمونشوندگان را مشخص ميكند.
هرقدر ضريب تمييز بزرگتر باشد، قوهي تمييز آن سؤال بيشتر و هر قدر اين ضريب كوچكتر باشد، قوهي تمييز آن كمتر است. مثلاً اگر قوهي تمييز سؤالي 90/0 باشد، آن سؤال آزمونشوندگان قوي و ضعيف را خيلي خوب از هم جدا خواهد كرد، اما اگر ضريب تمييز سؤالي 10/0 باشد، آن سؤال از عهدهي جداسازي دانشآموزان ضعيف و قوي بهخوبي برنخواهد آمد. ضريب تمييز صفر حاكي از اين است كه آن سؤال بههيچ وجه نتوانسته بين گروه قوي و ضعيف تمايز قائل شود.