تعاریف و مفاهیم
سنجش، ارزشیابی و آزمون

انواع آزمون براساس ويژگي‌هاي مورد اندازه‌گيري

آزمون‌هاي مختلف را مي‌توان با توجه به ويژگي‌هاي گوناگوني كه اندازه مي‌گيرند، ابتدا به دو دسته‌ي كلي آزمون‌هاي توانايي و آزمون‌هاي عاطفي تقسيم كرد و بعد، هريك از اين دو دسته را نيز به اجزاي كوچك‌تري مطابق نمودار دسته‌بندي كرد:

آزمون‌هاي توانايي: آزمون‌هاي توانايي، آموخته‌ها، مهارت‌ها و استعدادهاي افراد را مي‌سنجند. دسته‌اي از اين آزمون‌ها، توانايي‌هاي شناختي افراد را و تعدادي ديگر توانايي‌هاي رواني- حركتي را اندازه مي‌گيرند.

آزمون‌هاي توانايي به دو دسته‌ي آزمون‌هاي استعداد و آزمون‌هاي پيشرفت تحصيلي تقسيم مي‌شوند. آزمون‌هاي استعداد توانايي يا آمادگي فرد را براي انجام دادن كارهايي كه در پيش دارد و همچنين ظرفيت او را براي يادگيري‌هاي مختلف مي‌سنجند؛ اما آزمون‌هاي پيشرفت تحصيلي، دانش و مهارت‌هايي را كه فرد تا لحظه‌ي اجراي آزمون كسب كرده است، اندازه مي‌گيرند. به سخن ديگر، آزمون‌هاي استعداد ناظر به آينده‌اند و براي پيش‌بيني موفقيت‌هاي آتي فرد به‌كار مي‌روند، درحالي كه آزمون‌هاي پيشرفت تحصيلي ناظر به گذشته‌اند و براي تعيين آموخته‌هاي قبلي فرد مورد استفاده قرار مي‌گيرند. آزمون‌هاي مختلف هوش معرف آزمون‌هاي استعداد هستند و آزمون‌ها و امتحان‌هايي كه براي موضوع‌هاي گوناگون درسي تهيه مي‌شوند، آزمون‌هاي پيشرفت تحصيلي به حساب مي‌آيند.

آزمون‌هاي عاطفي: آزمون‌هاي عاطفي ويژگي‌هاي عاطفي و شخصيتي افراد را مي‌سنجند. آزمون‌هاي توانايي حداكثر عملكرد آزمون شونده را اندازه مي‌گيرند؛ بدين معني كه نشان مي‌دهند آزمون شونده در بهترين شرايط قادر به انجام چه كاري است، در حالي كه آزمون‌هاي عاطفي وضع موجود آزمون شونده را در موقعيت‌هاي طبيعي زندگي مي‌سنجند. يكي ديگر از وجوه اختلاف آزمون‌هاي عاطفي با آزمون‌هاي توانايي آن است كه آزمون‌هاي توانايي به‌طور عمده براي مقاصد پيش‌بيني موفقيت‌هاي تحصيلي و شغلي مورد استفاده قرار مي‌گيرند، اما آزمون‌هاي عاطفي بيشتر به امور مشاوره در حل مسائل رواني، تربيتي و حرفه‌اي كمك مي‌كنند.

انواع آزمون با توجه به روش تهیه

از اين منظر، آزمون‌ها به دو دسته‌ی عمده‌ی «آزمون‌های استاندارد شده» و «آزمون‌های معلم‌ساخته» تقسیم می‌شوند:

آزمون‌هاي استاندارد شده: آزمون‌های استاندارد شده، آزمون‌هایی هستند که با استفاده از نمونه‌های بزرگِ آزمون‌شوندگان و غالباً به وسیله‌ی مؤسسه‌هاي آزمون‌سازیِ دولتی یا خصوصی و یا مراکز آموزشی و علمی، برای اندازه‌گیری پیشرفت تحصیلی با مقاصد ارزشیابی از دوره‌های تحصیلی، تهیه و توزیع می‌شوند. در این نوع آزمون‌ها، ملاکِ نسبی اندازه‌گیری مورد استفاده قرار می‌گیرد.

آزمون‌هاي معلم‌ساخته: آزمون‌های معلم‌ساخته آزمون‌هایی هستند که معلمان برای سنجش پیشرفت تحصیلی دانش‌آموزان خود تهیه می‌کنند و در طول دوره‌ی آموزش و یا در پایان دوره به اجرا درمی‌آورند. در این آزمون‌ها، ملاکِ مطلق اندازه‌گیری مورد استفاده قرار می‌گیرد.

تفاوت آزمون‌هاي استاندارد شده و معلم ساخته

نخست اين‌كه: تهيه‌ي آزمون‌هاي استاندارد شده در مقايسه با آزمون‌هاي معلم ساخته به زمان و تخصص بيشتري نياز دارد. از آن‌جا كه اين آزمون‌ها براي بيش از يك بار استفاده تهيه مي‌شوند، مؤسسات آزمون‌ساز، براي تهيه‌ي آن‌ها زمان و هزينه‌ي زيادي به‌كار مي‌گيرند. در تهيه‌ي اين آزمون‌ها برنامه‌هاي درسي مورد بررسي دقيق واقع مي‌شوند، محتواي درس‌ها و مهارت‌هاي مورد اندازه‌گيري نمونه‌گيري مي‌شوند، سؤال‌ها به وسيله‌ي متخصصان نوشته و ويرايش مي‌شوند، صورت مقدماتي آزمون به‌طور آزمايشي اجرا مي‌شود، سؤال‌ها تجزيه و تحليل مي‌شوند و مورد تجديدنظر قرار مي‌گيرند و پس‌ از هنجاريابي، صورت نهايي آزمون تهيه و جهت استفاده‌ي گسترده عرضه مي‌شود. اما براي تهيه‌ي آزمون‌هاي معلم‌ساخته نيازي به گذر از اين مراحل مفصل نيست، زيرا اين آزمون‌ها براي تعيين مقدار يادگيري دانش‌آموزان در درس‌هاي بخصوص تهيه و اجرا مي‌شود و پس‌از هر بار اجرا به سهولت قابل تجديدنظر و اصلاح هستند.

دوم اين‌كه: از آن‌جا كه آزمون‌هاي استاندارد شده براي استفاده در مناطق مختلف و مقايسه‌ي دانش‌آموزان مدارس مناطق گوناگون با يكديگر تهيه مي‌شوند، هدف‌هاي مختلف آموزشي مناطق مختلف را بايد در اين آزمون‌ها منظور كرد. اما آزمون‌هاي معلم‌ساخته با توجه به محتوا و هدف‌هاي ويژه‌ي درس‌هاي بخصوص تهيه مي‌شوند.

سوم اين‌كه: اصطلاح «آزمون استاندارد شده يا ميزان شده» به وجود داده‌هاي هنجاري اشاره مي‌كند، و ناشران اين نوع آزمون‌ها براي معني‌دار كردن نمرات آزمون خود هنجارهاي لازم را تدارك مي‌بينند. اما آزمون‌هاي معلم ساخته نيازي به هنجار و هنجاريابي ندارند. مقايسه‌ي بين گروه‌هاي مختلف دانش‌آموزان كه به وسيله‌ي آزمون‌هاي استاندارد شده سنجش مي‌شوند، وجود هنجارها را در اين نوع آزمون‌ها ضروري مي‌سازد. بنابراين، هدف اصلي آزمون‌هاي استاندارد شده مقايسه است، مقايسه‌ي يك فرد يا يك گروه با فرد يا گروه ديگر، يا مقايسه‌ي جنبه‌هاي مختلف عملكرد يك فرد يا يك گروه با خودش.

روایی آزمون

روايي0 اصطلاحي است كه به هدفي كه آزمون براي تحقق بخشيدن به آن درست شده است، اشاره مي‌كند. بنابر آن‌چه گفته شد، آزموني داراي روايي است كه براي اندازه‌گيري آن‌چه مورد نظر است، كافي و مناسب باشد. براي مثال، يك آزمون پيشرفت تحصيلي رياضي كلاس پنجم دبستان، درصورتي يك آزمون روا است كه محتوا و هدف‌هاي آن درس را به‌خوبي اندازه‌گيري كند و به‌جز يادگيري دانش‌آموزان از آن درس، چيز ديگري را شامل نباشد.

آزمون‌هاي مورد استفاده در آموزش و پرورش و روانشناسي داراي سه هدف عمده هستند كه به سه پرسش زير پاسخ مي‌دهند:

  • آيا سؤال‌هاي آزمون از محتواي درس يا موضوع مورد نظر يك نمونه‌ي خوب ارايه مي‌دهد؟
  • آيا نمرات آزمون عملكرد فعلي يا آتي دانش‌آموزان را پيش‌بيني مي‌كند؟
  • آيا نمرات آزمون به مفاهيم نظري يا سازه‌هايي كه آزمون براي سنجش آن‌ها درست شده، مربوط است؟

سه مورد فوق به ترتيب سه نوع روايي محتوايي، ملاكي و سازه را نشان مي‌دهد.

عوامل مؤثر بر روايي آزمون

عوامل دروني: نخستين عاملي كه مي‌تواند بر روايي آزمون تأثير بگذارد دستورالعمل يا راهنماي آزمون است. راهنماهايي كه دقيقاً به آزمون‌شوندگان نمي‌گويند چگونه به سؤال‌ها پاسخ دهند و چگونه پاسخ خود را ثبت نمايند، سطح روايي آزمون را كاهش مي‌دهند. عامل ديگري كه بر روايي آزمون تأثير بسزايي دارد كيفيت سؤال‌هاي آزمون است. سؤال‌هايي كه طبق قواعد درست سؤال‌نويسي تهيه شده‌ باشند به روايي آزمون مي‌افزايند و برعكس سؤال‌هايي كه از هر لحاظ مشكل داشته باشند به روايي آزمون لطمه مي‌زنند. علاوه بر اين هر كدام از سؤال‌هاي آزمون كه از هدف اصلي آزمون جدا مي‌افتد و چيزي جدا از آن را شامل مي‌شود نيز به سهم خود از روايي كل آزمون مي‌كاهد. همچنين واژگان و جمله‌بندي پيچيده كه از حد درك آزمون شوندگان فراتر باشد به روايي آزمون لطمه مي‌زند. عامل دروني ديگري كه بر روايي آزمون تأثير دارد ترتيب قرار گرفتن سؤال‌هاي آزمون به دنبال يك‌ديگر است. قرار دادن سؤال‌هاي بسيار دشوار در آغاز آزمون ممكن است سبب شود كه پاسخ دهندگان به آزمون نتوانند وقت خود را براي بخش‌هاي مختلف آزمون به درستي تقسيم كنند. همچنين اگر سؤال‌هاي مختلف آزمون از لحاظ درجه‌ي دشواري متنوع نباشند، روايي آزمون صدمه مي‌بيند. آزمون‌هايي كه داراي مجموعه سؤال‌هاي بسيار دشوار يا بسيار ساده‌اند از سطح روايي خوبي برخوردار نيستند. از عوامل ديگر مؤثر بر روايي، طول يك آزمون يا تعداد سؤال‌هاي آن است. يكي ديگر از راه‌هاي بالا بردن سطح روايي آزمون افزايش تعداد سؤال‌هاي آن است. علاوه بر اين، در آزمون‌هايي كه با روايي محتوايي معرفي مي‌شوند، هر چه تعداد سؤال‌ها بيش‌تر باشد نمونه‌ي بهتري از محتواي مورد اندازه‌گيري را شامل خواهند بود و به همان نسبت به روايي آزمون افزوده مي‌شود.

عوامل بيروني: علاوه بر عوامل دروني، چندين عامل بيروني نيز وجود دارند كه بر روايي آزمون‌ها تأثير مي‌گذارند و براي افزايش دادن سطح روايي يك آزمون مي‌توان آن‌ها را كنترل كرد. يكي از اين عوامل بيروني اجراي نامناسب آزمون است. كمبود زمان، فضاي نامناسب، مكان نامناسب و مانند اين‌ها از عوامل اجرايي هستند كه بر عملكرد آزمون‌شوندگان و در نتيجه بر روايي آزمون تأثير نامطلوبي به جاي مي‌گذارند. علاوه بر اجراي نامناسب آزمون، اشكالات موجود در تصحيح پاسخ‌هاي آزمون‌شوندگان و نمره‌گذاري آن‌ها به ويژه در آزمون‌هاي تشريحي مي‌تواند نتايج حاصل را مخدوش سازد و لذا از روايي آزمون بكاهد. عامل ديگر مؤثر بر روايي آزمون تركيب آزمون‌شوندگان از لحاظ توانايي مورد اندازه‌گيري است. هر چه گروه آزمون‌شوندگان از لحاظ توانايي مورد اندازه‌گيري نامتجانس‌تر باشند روايي آزمون بيش‌تر خواهد بود. به همين دليل آزمون‌هايي كه وقتي با گروه‌هاي نامتجانس به كار مي‌روند داراي روايي قابل ملاحظه‌اي هستند اگر با گروه‌هاي داراي تجانس بيش‌تر به كار گرفته شوند سطح روايي كم‌تري از خود نشان خواهند داد. علاوه بر عوامل فوق، ويژگي‌هاي رواني آزمون شوندگان نيز مي‌توانند بر روايي نمرات حاصل از يك آزمون تأثير داشته باشند. براي نمونه، بالا و پايين بودن سطح انگيزش آزمون‌شوندگان يا علاقه‌مند بودن و بي‌علاقه بودن آنان نسبت به پاسخ دادن به سؤال‌هاي آزمون و نيز كمي يا زيادي سطح اضطراب آنان بر نمرات حاصل و لذا بر ميزان روايي تأثير مي‌گذارد. علاقه‌مندي آزمون شوندگان به شركت در آزمون و پايين بودن سطح اضطراب، بر دقت آنان و روايي نتايج آزمون تأثير مثبت به جاي مي‌گذارد، اما بي‌علاقگي يا نفرت آزمون‌شوندگان يا اضطراب زياد آنان در جلسه‌ي آزمون هم بر دقت عمل و هم بر روايي نتايج حاصل تأثير منفي دارد.

دسته‌بندی ارزشيابي‌های پيشرفت تحصيلي

ارزشيابي به تمام روش‌هايي اشاره دارد كه در مدارس براي اندازه‌گيري رسمي عملكرد دانش‌آموزان مورد استفاده قرار مي‌گيرند. از جمله‌ي اين روش‌ها، امتحانات مستمر و امتحانات پاياني، ارزيابي‌هاي كتبي و نمرات هستند. معمولاً ارزشيابي دانش‌آموز بر پيشرفت تحصيلي تمركز دارد، ولي خيلي از مدارس، رفتارها و روش‌ها را نيز ارزيابي مي‌‌كنند و ضمناً تعدادي از مدارس ابتدايي توصيفاتي را از رفتار دانش‌آموز در اختيار مي‌گذارند، مانند «از دستورات پيروي مي‌كند»، «با دقت گوش مي‌دهد»، « با ديگران كار مي‌كند» و «از زمان عاقلانه استفاده مي‌كند». در دوره‌هاي راهنمايي، متوسطه و پيش‌دانشگاهي، رواج گزارش‌هاي رفتار به ترتيب كاهش مي‌يابد ولي خيلي از دبيرستان‌ها، دانش‌آموزان را طبق ملاك‌هايي چون «توانايي‌اش بهبود مي‌يابد»، «آمادگي دارد» و «وظيفه‌شناس است»، ارزشيابي مي‌كنند. ارزشيابي دانش‌آموزان شش هدف اصلي دارد:

دسته‌بندي ارزشيابي‌هاي پيشرفت تحصيلي با توجه به موضوع

ارزشيابي از دانش‌آموزان: ارزشيابي از دانش‌آموزان عمدتاً به معني ارزشيابي از پيشرفت تحصيلي يا ارزشيابي از ميزان يادگيري آنان است. استفاده از نتايج ارزشيابي دانش‌آموزي به‌ويژه نتايج ارزشيابي پيشرفت تحصيلي، نه‌تنها براي قضاوت درباره‌ي عملكرد يادگيرندگان، بلكه براي داوري درباره‌ي اثربخشي كيفيت آموزش، روش‌ها و مواد آموزشي نيز مفيد است. ارزشيابي پيشرفت تحصيلي كه مهم‌ترين نوع ارزشيابي آموزشي است، تعيين مي‌نمايد كه دانش‌آموزان تا چه ميزاني به هدف‌هاي آموزشي از پيش تعيين شده رسيده‌اند.

ارزشيابي از برنامه‌هاي درسي و مواد آموزشي: ارزشيابي آموزشي، گاهي به منظور تعيين اثربخشي برنامه‌ي درسي يا مواد آموزشي انجام مي‌شود و شامل ارزشيابي از عواملي چون روش‌هاي آموزشي، كتاب‌هاي درسي، ابزارهاي ديداري- شنيداري و تداركات فيزيكي و سازماني است. در ارزشيابي از برنامه‌هاي درسي و مواد آموزشي نيز عمده‌ترين ملاك، پيشرفت تحصيلي يا ميزان يادگيري دانش‌آموزان است.

ارزشيابي از پروژه‌ها و برنامه‌هاي آموزشي: علاوه بر برنامه‌هاي درسي و مواد آموزشي، برنامه‌ها و پروژه‌هاي آموزشي ويژه نيز مورد ارزشيابي واقع مي‌شوند. منظور از پروژه‌ها و برنامه‌هاي آموزشي ويژه، كوشش‌هايي است كه به‌عنوان بخشي از برنامه‌هاي معمول مدرسه‌ها به‌حساب نمي‌آيند. اين برنامه‌ها نوعاً ماهيت نوآورانه دارند و طول مدت حضورشان به موفقيتشان وابسته است.

ارزشيابي از مدرسه: منظور از ارزشيابي از مدرسه اين است كه تعيين شود هدف‌هاي پيش‌بيني شده براي مدرسه به چه ميزاني تحقق يافته‌اند و نقاط قوت و ضعف كدام‌اند. يكي از جنبه‌هاي مهم ارزشيابي از مدرسه، برنامه‌ي آزمون مدرسه است. هرچه اين برنامه جامع‌تر و كامل‌تر باشد، اطلاعات به دست آمده نيز به همان نسبت، قابل اعتمادتر و باارزش‌تر خواهد بود. مانند ساير ارزشيابي‌هاي آموزشي، در ارزشيابي از مدرسه نيز پيشرفت تحصيلي دانش‌آموزان مهم‌ترين بخش برنامه‌ي آزمون و منبع كسب اطلاعات است.

ارزشيابي از كاركنان مدرسه: مقصود از ارزشيابي از كاركنان مدرسه، ارزشيابي از همه‌ي كساني است كه به‌طور مستقيم يا غيرمستقيم مسئول بازده‌ آموزشي مدرسه هستند. شايد پيچيده‌ترين نوع ارزشيابي، ارزشيابي از كار معلمان باشد. علت پيچيدگي اين روش ارزشيابي، كم‌اعتباري و بي‌دقتي وسايل و روش‌هاي اندازه‌گيري و سنجش مورد استفاده در اين نوع ارزشيابي است؛ زيرا هيچ‌يك از منابع اطلاعاتي، اطلاعات دقيق و بي‌غرضانه‌اي را كه براي يك ارزشيابي سالم، ضروري است، به دست نمي‌دهد. بنابراين، متخصصان ارزشيابي معلم پيشنهاد مي‌كنند براي اين‌كه ارزشيابي سالم‌تري از معلمان به‌عمل آيد، بايد از همه‌ي منابع اطلاعاتي موجود داده‌هاي لازم را به دست آورد و قضاوت نهايي را بر اساس تركيبي از آن‌ها انجام داد.

دسته‌بندي ارزشيابي‌هاي پيشرفت تحصيلي با توجه به ملاك مورد استفاده:

ارزشيابي وابسته به ملاك: در اين ارزشيابي كه ارزشيابي ملاكي ناميده مي‌شود، معيار يا ملاك ارزشيابي از پيش تعيين مي‌شود و عملكرد يادگيرنده با توجه به آن ملاك مورد قضاوت قرار مي‌گيرد. اين نوع ارزشيابي تعيين مي‌كند كه آيا دانش‌آموزان مطالب و هدف‌هايي را كه قرار بوده است بياموزند، آموخته‌اند يا نه.

ارزشيابي وابسته به هنجار: اين نوع ارزشيابي به جاي يك ملاك مطلق از پيش تعيين شده بر نوعي ملاك نسبي وابسته است. در اين نوع ارزشيابي مي‌توان تعيين كرد كه پيشرفت يك دانش‌آموز نسبت به دانش‌آموزان ديگر چه وضعي دارد.

دسته‌بندي ارزشيابي‌هاي پيشرفت تحصيلي با توجه به زمان و هدف استفاده

ارزشيابي آغازين يا سنجش آغازين: نخستين ارزشيابي كه پيش از انجام فعاليت‌هاي آموزشي به اجرا درمي‌آيد، ارزشيابي آغازين يا سنجش آغازين ناميده مي‌شود. اين نوع ارزشيابي به دو منظور مورد استفاده قرار مي‌گيرد:
1- آيا دانش‌آموزان بر دانش‌ها و مهارت‌هاي پيش‌نياز درسِ تازه از قبل مسلط‌‌اند؟
2- دانش‌آموزان چه مقدار از هدف‌ها و محتواي درس تازه را قبلاً ياد گرفته‌اند؟
در مورد سؤال اول، سنجش آغازين به منظور اندازه‌گيري مهارت‌ها و دانش‌هاي پيش‌نياز يادگيريِ درس تازه به‌كار مي‌رود. در مورد سؤال دوم، به‌جاي آزمون آمادگی، از آزمون جايابي يا آزمون پايه‌گزيني81 استفاده مي‌شود. هدف از آزمون جايابي يا پايه‌گزيني كه به آن پيش‌آزمون نيز گفته مي‌شود، تعيين ميزان اطلاعات يادگيرندگان از مطالبي است كه قرار است به آنان آموزش داده شود.

ارزشيابي تكويني: آن‌چه عمدتاً به‌منظور كمك به اصلاح موضوع مورد ارزشيابي، يعني برنامه يا روش آموزشي مورد استفاده قرار مي‌گيرد، ارزشيابي تكويني نام دارد. هدف از اجراي اين ارزشيابي، آگاه ساختن توليد كنندگان برنامه از نواقص برنامه‌ي خود و كمك به اصلاح آن‌ها است. هدف از كاربرد ارزشيابي تكويني در رابطه با پيشرفت تحصيلي دانش‌آموزان، آگاهي يافتن از ميزان و نحوه‌ي يادگيري آنان براي تعيين نقاط قوت و ضعف يادگيري و نيز، تشخيص مشكلات روش آموزش معلم در رابطه با هدف‌هاي آموزشي است.

ارزشيابي تشخيصي: نوع ديگر ارزشيابي كه آن نيز در جريان آموزش انجام مي‌گيرد، ارزشيابي تشخيصي نام دارد. علت اين نام‌گذاري آن است كه اين ارزشيابي با هدف تشخيص مشكلات يادگيري دانش‌آموزان به‌كار مي‌رود. اين آزمون‌ها معمولاً به صورت انفرادي اجرا مي‌شوند و در قياس با آزمون‌هاي پيشرفت تحصيلي، سؤال‌هاي بيشتري را در بر مي‌گيرند. این ارزشیابی زمانی مورد استفاده قرار می‌گیرد که معلم با مشکلات مبرم و مکرری در یک یا چند دانش‌آموز روبه‌رو می‌شود، که با روش‌های اصلاحیِ معمولِ ارزشیابی تکوینی قابل رفع نیست.

ارزشيابي تراكمي: در ارزشيابي تراكمي تمام آموخته‌هاي دانش‌آموزان در طول يك دوره‌ي آموزشي سنجش مي‌شوند و هدف آن، نمره دادن به دانش‌آموزان و قضاوت درباره‌ي اثربخشي كار معلم و برنامه‌ي درسي يا مقايسه‌ي برنامه‌هاي مختلف درسي با يكديگر است. هدف ارزشيابي تراكمي هم نمره دادن و اتخاذ تصميم‌هاي مختلف و هم تعيين اثربخشي طرح آموزشي و هدف‌هاي معلم و ميزان موفقيت او در پياده كردن مراحل مختلف طرح آموزشي است.

دسته‌بندي ارزشيابي‌هاي پيشرفت تحصيلي با توجه به ارزشيابان

دو نوع ارزشيابي آموزشي ديگر كه با ارزشيابي تكويني و تراكمي رابطه‌ي نزديكي دارند، ارزشيابي دروني12 و ارزشيابي بيروني22 است. منظور از ارزشيابي دروني، اين است كه ارزشيابي توسط كاركنان و دست‌اندركاران تهيه و اجراي برنامه، يعني افراد درون برنامه انجام مي‌شود و منظور از ارزشيابي بيروني، ارزشيابي توسط افراد يا گروه‌هايي خارج از برنامه صورت گيرد. مك بيت و مك گلين (2002) هر دو نوع ارزشيابي دروني و بيروني را ضروري مي‌دانند و ارتباط بين آن‌ها را مطابق شكل زير نشان داده‌اند. دقت كنيد كه در اين شكل مدرسه در مركز قرار داده شده، براي اين‌كه تأكيد شود كه خودِ مدرسه نيروي محرك اصلي براي ارزشيابي است.

بنابراين، مدرسه بايد به اين پرسش‌ها پاسخ دهد: ما تا چه اندازه خوب هستيم؟ از كجا مي‌دانيم؟ لايه‌ي آخر نشان‌دهنده‌ي ارزشيابي در سطح بين‌المللي است. سؤالي كه در اين‌جا مطرح است، اين است كه «در مقايسه با ساير كشورها وضع ما چگونه است؟» مانند آزمون‌هاي تيمز و پرلز.

سنجش يادگيري دانش‌آموزان

مهم‌ترين وسيله‌ي سنجش پيشرفت تحصيلي دانش‌آموزان، آزمون است؛ البته بايد در نظر داشت كه آزمون‌هاي پيشرفت تحصيلي متداول كه به آزمون‌هاي كتبي يا آزمون‌هاي مداد و كاغذي معروف‌اند، به‌طور عمده با حوزه‌ي شناختي سر و كار دارند. هدف‌هاي آموزشي و بازده‌هاي يادگيري متعلق به حوزه‌هاي غيرشناختي، ازجمله نگرش‌ها، علاقه‌ها و ارج نهادن‌ها (هدف‌هاي حوزه‌ي عاطفي) و مهارت‌هاي مختلف مانند انجام آزمايش در آزمايشگاه، كار در كارگاه، فعاليت‌هاي ورزشي، و ايجاد ارتباط كلامي و غيركلامي (هدف‌هاي حوزه‌ي رواني – حركتي) به كمك وسايل ديگر سنجش ازجمله: مشاهده، مقياس درجه‌بندي، فهرست وارسي، واقعه‌نگاري، ثبت حضور و غياب، گزارش‌هاي كار عملي، و مانند اين‌ها سنجش مي‌شوند.

جدول مشخصات آزمون

مهم‌ترين گام در تهيه‌ي آزمون‌هاي پيشرفت تحصيلي، تهيه‌ي جدول مشخصات براي موضوعي است كه قرار است آزمون آن تهيه شود. جدول مشخصات يك جدول دوبعدي است با تعدادي رديف و ستون، متناسب با محتوا و هدف‌هاي آموزشي درس. در رديف بالاي جدول كه بُعدِ محتوا نام دارد، اجزاي مطالب درسي نوشته مي‌شوند و در ستون كنار آن كه بُعدِ هدف ناميده مي‌شود، فهرست هدف‌هاي آموزشي قرار مي‌گيرد.

يك آزمون خوب پيشرفت تحصيلي آزموني است كه به بهترين شكل منعكس كننده‌ي تمامي هدف‌هاي آموزشي و همه‌ي محتواي برنامه‌ي درسي باشد. از لحاظ نظري، بهترين آزمون براي يك درس يا يك موضوع آزموني است كه تمام مطالب و كليه‌ي هدف‌هاي آموزشي آن درس را شامل شود. اما اگر درس يا موضوع، مفصل باشد، تهيه‌ي چنين آزموني غيرعملي است. بنابراين، به‌جاي گنجانيدن همه‌ي سؤال‌هاي ممكن تهيه كننده‌ي آزمون به انتخاب تعدادي سؤال نمونه كه معرف هدف‌ها و محتواي درس باشد، اقدام مي‌كند. درصورتي چنين آزموني يك آزمون خوب يا به اصطلاح يك آزمون داراي روايي خواهد بود كه سؤال‌هاي آن حاوي نمونه‌ي درستي از هدف‌ها و محتواي درس باشد.

بعد از تكميل بُعد محتوا و بُعد هدف جدول مشخصات، آزمون‌ساز بايد تعيين كند كه سؤال‌هاي آزمون خود را به چه صورتي در ميان هدف‌ها و عنوان‌هاي درس توزيع نمايد؛ يعني تعداد سؤال‌هايي را كه به هر يك از موضوع‌هاي درسي و هدف‌هاي آموزشي اختصاص خواهند داشت، تعيين نمايد و اين تعداد را يا به صورت تعداد واقعي سؤال‌ها يا به صورت درصد، در خانه‌هاي جدول مشخصات وارد كند. براي تعيين درصد سؤال‌هايي كه به بخش‌هاي مختلف محتوا و هدف‌ها تعلق مي‌گيرند، جواب سؤال‌هاي زير را بايد تعيين كرد:

  • كدام بخش از محتوا و كدام دسته از هدف‌ها داراي حجم بيشتري است و وقت بيشتري صرف آموزش آن‌ها شده است؟
  • كدام هدف‌ها از لحاظ نگهداري در حافظه و كاربرد در آينده، ارزش بيشتري دارند؟
  • كدام قسمت يا قسمت‌هاي درس يا موضوع درسي از اهميت بيشتري برخوردارند؟
انواع آزمون‌هاي پيشرفت تحصيلي کتبی

آزمون‌هاي پيشرفت تحصيلي كتبي را مي‌توان ابتدا به دو دسته‌ي بسته‌پاسخ و بازپاسخ تقسيم كرد و سپس اين دو دسته‌ي كلي را نيز تقسيم نمود. آزمون‌هاي بسته‌پاسخ آزمون‌هايي هستند كه هم سؤال‌ها و هم جواب سؤال‌ها را در اختيار آزمون‌شوندگان قرار مي‌دهند و آزمون‌شوندگان درباره‌ي جواب‌هاي داده شده اعمالي انجام مي‌دهند يا تصميم‌هايي اتخاذ مي‌كنند.

در تصحيح برگه‌هاي آزمون‌هاي بسته‌پاسخ نظر شخصي مصحح هيچ‌گونه دخالتي ندارد و از اين رو به اين آزمون‌ها آزمون‌هاي عيني مي‌گويند.

آزمون‌هاي بازپاسخ آزمون‌هايي هستند كه دانش‌آموز، خودش پاسخ خواسته شده را مي‌سازد يا توليد مي‌كند. آزمون‌هاي تشريحي، آزمون‌هاي كوته‌پاسخ، امتحانات شفاهي انفرادي، توليد آثار هنري (شعر، موسيقي، نقاشي)، انجام پروژه‌هاي تحقيقي از اين جمله‌اند. اين نوع آزمون‌ها را نيز مي‌توان به دو دسته‌ي آزمون‌هاي گسترده پاسخ و آزمون‌هاي محدودپاسخ تقسيم كرد. شكل زير انواع آزمون‌هاي پيشرفت تحصيلي كتبي را نشان مي‌دهد:

آزمون‌هاي تشريحي

آزمون‌هاي تشريحي را با توجه به آزادي عمل دانش‌آموزان در پاسخ دادن به سؤال‌هاي آزمون، به دو دسته‌ي گسترده‌پاسخ (مانند آزمون درس انشا) و محدودپاسخ (مانند آزمون درس رياضي) تقسيم مي‌كنند كه محاسن اين آزمون‌ها به اين شرح است:

  • تهيه‌ي آزمون‌هاي تشريحي از تهيه‌ي آزمون‌هاي بسته‌پاسخ آسان‌تر است.
  • اين نوع آزمون بهترين وسيله‌ي سنجش توانايي دانش‌آموزان در پروراندن جواب سؤال‌ها و بيان آنها است.
  • اين آزمون‌ها توانايي پاسخ دادن به سؤال‌ها را مي‌سنجند نه توانايي انتخاب پاسخ‌ها را.
  • آنها موقعيت‌هاي واقعي‌تري را از آزمون‌هاي بسته‌پاسخ به دانش‌آموزان عرضه مي‌كنند.
  • آنها بر روش مطالعه‌ي دانش‌آموزان تأثير مثبت به‌جاي مي‌گذارند. اگر دانش‌آموزان از پيش بدانند كه با استفاده از آزمون‌هاي تشريحي، يادگيري آنان سنجش خواهد شد، با احتمال بيشتري به دنبال روابط در ميان مطالب به جستجو خواهند پرداخت و اطلاعات را به راه‌هاي معني‌دار سازمان خواهند داد.

معايب آزمون‌هاي تشريحي به شرح زير است:

  • اين آزمون‌ها با توجه به محدود بودن تعداد سؤالات آزمون، نمونه‌ي كوچكي از محتواي درس و هدف‌هاي آموزشي را اندازه مي‌گيرند.
  • تصحيح برگه‌هاي امتحاني اين‌گونه آزمون‌ها نمي‌تواند با دقت و در شرايط يكسان انجام گيرد.
  • تصحيح برگه‌هاي امتحاني اين آزمون‌ها بسيار وقت‌گير است.
آزمون‌هاي كوته پاسخ

آزمون‌هاي كوته پاسخ براي اندازه‌گيري هدف‌هاي شناختي سطوح پايين، به‌ويژه دانش يا معلومات، مفيد هستند. البته در پاره‌اي از اوقات از اين نوع سؤال‌ها براي اندازه‌گيري هدف‌هاي سطح بالاتر نيز مي‌توان استفاده كرد. يكي از محاسن آزمون‌هاي كوته‌پاسخ، سهولت تهيه‌ي سؤال‌ها و تصحيح پاسخ‌هاي آن‌ها است. علاوه بر اين، در مقايسه با آزمون‌هاي بسته‌پاسخ، نظير آزمون‌هاي صحيح ـ غلط يا چندگزينه‌اي داراي مزاياي ديگري به شرح زير هستند:

  • اجراي آن‌ها آسان است.
  • امكان تقلب را كاهش مي‌دهند.
  • نسبت به آزمون‌هاي چندگزينه‌اي، صحيح- غلط و جور كردني اطلاعات تشخيصي بيشتري را در اختيار معلمان مي‌گذارند.
  • امتياز ديگر آزمون‌هاي كوته‌پاسخ اين است كه در آن‌ها حدس كوركورانه كه از معايب عمده‌ي آزمون‌هاي بسته‌پاسخ است، وجود ندارد.

از معايب اين آزمون‌ها كاربرد محدود آن‌ها است. از آن‌جا كه پاسخ سؤال‌هاي اين نوع آزمون‌ها بسيار مختصر است، نمي‌توان از آن‌ها براي سنجش هدف‌هاي سطح بالاي يادگيري استفاده كرد و كاربرد آن‌ها به انداز‌ه‌گيري هدف‌هاي سطح دانش و حداكثر فهميدن و كاربستن (آن هم در موارد بسيار نادر) محدود مي‌شود. مشكل ديگر اين است كه كاربرد زياد اين آزمون‌ها سبب تشويق دانش‌آموزان به حفظ كردن اطلاعات جزئي و بي‌اهميت خواهد شد، زيرا در اين نوع آزمون‌ها بيشتر اين‌گونه اطلاعات سنجيده مي‌شود.

آزمون‌هاي صحيح ـ غلط

در آزمون‌هاي صحيح- غلط تعدادي سؤال يا جمله در اختيار دانش‌آموزان گذاشته مي‌شود و او صحيح و غلط بودن آنها را تعيين مي‌كند. سؤال‌هاي صحيح- غلط ساده‌ترين صورت‌ سؤال‌هاي بسته‌پاسخ هستند و به‌طور كلي مي‌توان محاسن اين آزمون‌ها را به شرح زير فهرست كرد:

  • بيان موضوع‌هاي درسي در قالب عبارت‌هاي ساده.
  • سادگي تهيه.
  • عيني بودن تصحيح جواب‌ها.
  • قابليت پاسخگويي آزمون‌شونده به تعداد زيادي سؤال در هر جلسه‌ي امتحان.

آزمون‌هاي صحيح ـ غلط را از جهاتي مورد انتقاد قرار داده‌اند و ايرادهايي به آن‌ها وارد كرده‌اند. ايرادهاي وارده به اين آزمون‌ها را مي‌توان به شرح زير برشمرد:

  • اين آزمون‌ها اغلب براي سنجش اطلاعات جزئي و كم‌اهميت به‌كار مي‌روند.
  • حدس زدن كوركورانه در آن‌ها خيلي زياد دخالت دارد.
  • كاربرد زياد آن‌ها سبب تأكيد بي‌مورد بر حفظ طوطي‌وار اطلاعات كم‌اهميت مي‌شود.
  • آن‌ها بيشتر براي سنجش هدف‌هاي سطح پايين مفيداند و توانايي‌هاي پيچيده‌ي سطح بالا را اندازه نمي‌گيرند.
آزمون‌هاي جوركردني

آزمون‌هاي جور كردني از تعدادي سؤال تشكيل مي‌شوند كه هريك از آن‌ها شامل دو ستون است. يك ستون، معرف پرسش‌ها و ستون ديگر نشان‌دهنده‌ي پاسخ‌ها است. وظيفه‌ي دانش‌آموز آن است كه پاسخ‌ها را با پرسش‌هاي مربوط جور كند. فايده‌ها و كاربردهاي سؤال‌هاي جور كردني را به نحو زير مي‌توان خلاصه كرد:

  • از آن‌جا كه پاسخ دادن به اين سؤال‌ها زمان زيادي لازم ندارد، تعداد زيادي از آن‌ها را مي‌توان در يك زمان معين مورد استفاده قرار داد.
  • تصحيح سؤال‌هاي جوركردني به سرعت و سهولت امكان‌پذير است و نيازي به مصحح متخصص ندارد.

آن‌جا كه بازده يادگيري بر توانايي تشخيص روابط بين امور تأكيد دارد و مي‌توان تعدادي پرسش و پاسخ متجانس يافت، سؤال‌هاي جوركردني مهم‌ترين نوع سؤال‌ها هستند. معايب اين آزمون‌ها را به صورت زير مي‌توان خلاصه كرد:

  • از آن‌جا كه در يادگيري تداعي بين امور، حفظ طوطي‌وار دخالت زيادي دارد و معلمان غالباً در تهيه‌ي اين نوع سؤال‌ها بر روابط حفظي بين امور تأكيد مي‌كنند، اين آزمون‌ها اگر به دقت تهيه نشود، ممكن است دانش‌آموزان را به يادگيري مطالب سطحي و غيرعمقي سوق دهد.
  • گاهي اوقات پيدا كردن مجموعه‌اي از پرسش‌ها كه به اندازه‌ي كافي شبيه به هم باشد تا بتوان براي آن‌ها پاسخ‌هاي همگوني پيدا كرد، كار دشواري است.
آزمون‌هاي چندگزينه‌اي

آزمون چند گزينه‌اي شامل تعدادي سؤال است كه هريك از آن‌ها از يك قسمت اصلي و تعدادي گزينه (پاسخ) تشكيل مي‌شود و دانش‌آموز از ميان گزينه‌هاي پيشنهادي، گزينه‌ي صحيح را انتخاب مي‌كند.

آزمون‌هاي چندگزينه‌اي تمام محاسن آزمون‌هاي صحيح ـ غلط و جوركردني را دارد. علاوه بر آن، اين آزمون‌ها قادر به اندازه‌گيري غالب بازده‌هاي يادگيري از دانش گرفته تا فهميدن، قضاوت كردن، حل مسأله، ارايه‌ي پيشنهادهاي عملي و پيش‌بيني امور هستند. تقريباً هرگونه درك و فهم يا توانايي را كه بتوان با آزمون‌هاي ديگر- كوته‌پاسخ، كامل كردني، صحيح غلط، جوركردني يا تشريحي- اندازه گرفت، مي‌توان با آزمون‌هاي چندگزينه‌اي سنجش كرد.

به‌طور كلي محاسن آزمون‌هاي چندگزينه‌اي را مي‌توان به شرح زير بيان كرد:

  • اين آزمون‌ها از ساير آزمون‌هاي بسته‌پاسخ، انعطاف‌پذيرترند. آنها علاوه بر دانش، توانايي استدلال، قضاوت و بسياري بازده‌هاي مهم ديگر يادگيري را مي‌سنجند.
  • با استفاده از سؤال‌هاي چندگزينه‌اي مي‌توان در يك زمان محدود تعداد زيادي از هدف‌هاي آموزشي و بخش مهمي از محتواي درس را اندازه‌گيري كرد.
  • آزمون‌هاي چندگزينه‌اي نسبت به آزمون‌هاي صحيح- غلط كمتر امكان حدس زدن كوركورانه را به آزمون‌شوندگان مي‌دهند.
  • پاسخ‌هاي اين سؤال‌ها به سادگي و با عينيت كامل قابل تصحيح هستند.
  • دانش‌آموزان و معلمان اين نوع آزمون‌ها را به ساير آزمون‌هاي بسته‌پاسخ ترجيح مي‌دهند.
  • اگر گزينه‌هاي انحرافي اين آزمون‌ها با توجه به اشتباهات و كج‌فهمي‌هاي متداول دانش‌آموزان تهيه شوند، منبع بسيار مناسبي براي تشخيص مشكلات دانش‌آموزان خواهند بود.

آزمون‌هاي چندگزينه‌اي از چند نظر مورد انتقاد قرار گرفته‌اند. ما در اين‌جا اين انتقادها را به‌عنوان معايب آزمون‌هاي چندگزينه‌اي ذكر مي‌كنيم.

  • ساختن اين آزمون‌ها بسيار دشوار است. معلمان غالباً نمي‌توانند تعدادي گزينه‌ي انحرافي خوب براي سؤال‌هاي چندگزينه‌اي انتخاب كنند.
  • معلمان اغلب سؤال‌هاي چندگزينه‌اي را در حد سنجش اطلاعات جزيي و كم‌اهميت مي‌نويسند. البته اين ايرادي است كه به همه‌ي آزمون‌هاي بسته‌پاسخ از جمله آزمون‌هاي چندگزينه‌اي وارد است.
  • در مقايسه با آزمون‌هاي صحيح- غلط، خواندن اين آزمون‌ها و پيدا كردن گزينه‌ي درست مستلزم صرف وقت زيادتري است.
  • زماني كه به پاسخ‌هاي غلط نمره‌ي منفي داده مي‌شود، دانش‌آموزاني كه خطر مي‌كنند، از ساير دانش‌آموزان نمره‌هاي بهتري مي‌گيرند. هم‌چنين دانش‌آموزاني كه در پاسخ دادن به اين‌گونه سؤال‌ها باتجربه هستند، از ديگر دانش‌آموزان نمره‌هاي بهتري كسب مي‌كنند.
  • دانش‌آموزان قوي بيش‌از دانش‌آموزان معمولي قادر به پيدا كردن اشكالات، پيچيدگي‌ها و نظرگاه‌هاي واگرا (غيرمعمولي) در سؤال‌ها هستند. اما از آن‌جا كه تنها يك پاسخ صحيح در سؤال وجود دارد، بابت اين تيزبيني‌هاي خود نه‌تنها تشويق نمي‌شوند، بلكه با دادن جوابي كه مورد نظر طراح سؤال نيست، ممكن است تنبيه هم بشوند.

نمره‌گذاري و تحليل آزمون

نمرات معيار: نمرات معيار، عملكرد هر دانش‌آموز را در يك آزمون، بنا بر اختلاف عملكرد او از ميانگين گروه، برحسب واحد انحراف معيار نشان مي‌دهد. آن دسته از نمرات معيار كه داراي توزيعي با ميانگين صفر و انحراف معيار واحد هستند، به نمرات Z شهرت دارند.

نمره‌ي T (نمره‌ي تراز): نمره‌ي T با ضرب نمرات Z در عدد ثابت a و جمع كردن نمرات حاصل با عدد ثابت b به‌دست مي‌آيد. بنابراين، آن دسته از نمرات معيار كه داراي توزيعي با ميانگين b و انحراف معيار a است، توزيع نمرات T نام دارد.
T = aZ + b
در محاسبه‌ي نمره‌ي تراز آزمون‌هاي مرآت، ميانگين 5000 و انحراف معيار 2250 درنظر گرفته مي‌شود. درنتيجه:
T = 2250Z + 5000

نمودار نرمال: پراكندگي نمرات معيار به صورت نرمال است. منحني نرمال از لحاظ شكل، شبيه به منحني زير است. در اين منحني، مقايسه‌ي درصدها و نمرات معيار، در توزيعِ نرمال مشاهده مي‌شود.

خصوصيات نمودار نرمال
  • دو قسمت منحني نرمال نسبت به خط وسط آن قرينه هستند.
  • در توزيعي كه اين منحني مُعرف آن است، اكثر نمره‌ها در وسط توزيع انباشته شده‌اند.
  • هرچه از وسط منحني به دوطرف آن پيش برويم، از ارتفاع منحني (حجم نمرات) كاسته مي‌شود و در انتهاي منحني دنباله‌هاي طويلي به‌وجود مي‌آيند.
  • دو امتداد منحني در بي‌نهايت محور افقي را قطع مي‌كنند، زيرا تعداد مواردي كه لازم است تا يك منحني نرمال واقعي درست شود، از لحاظ نظري بي‌نهايت است.
  • در منحني نرمال، ميانگين، ميانه و نما بر روي هم قرار دارند.
  • در روي اين منحني دو نقطه وجود دارد كه در آن‌ها جهت منحني تغيير مي‌كند. اين دو نقطه در فواصل 1 انحراف معيار از ميانگين قرار دارند.
  • در منحني نرمال، بين انحراف معيارها و نسبت افراد يك رابطه‌ي دقيق رياضي وجود دارد و در هر واحد انحراف معيار هميشه يك نسبت ثابت از افراد موجود است. اگر تمام سطح منحني نرمال را برابر يك واحد فرض كنيم، 26/68% = 13/34×2 از كل سطح منحني بين 1+ و 1- انحراف معيار واقع است. ضمناً در حدود 44/95% مساحت زير منحني بين 2+ و 2- انحراف معيار قرار دارد و در حدود 74/99% اين مساحت نيز در فاصله‌ي 3+ و 3- انحراف معيار واقع است. بنابراين، تقريباً تمام سطح زير منحني نرمال در اين فاصله‌ي انحراف معيار قرار دارد. به‌همين سبب است كه محققان و آمارگران، سطح منحني نرمال را عملاً بين 3+ و 3- انحراف معيار فرض مي‌كنند.
تحليل سؤال‌هاي آزمون

هدف از تحليل سؤال‌هاي آزمون، وارسي تك تك سؤال‌ها و تعيين ميزان دقت و نارسايي‌هاي آنهاست. در تحليل سؤال‌هاي آزمون، نقاط قوت و ضعف يك آزمون و كيفيت همه‌ي سؤال‌هاي آن تعيين مي‌شود.

براي تهيه‌ي يك آزمون خوب، علاوه بر رعايت پيشنهادهايي كه پيش‌تر ارايه شد، تحليل پاسخ‌هاي آزمون شوندگان و بررسي تجربي آنها ضروري است. تحليل پاسخ‌هاي آزمون شوندگان، اطلاعات تشخيصي لازم را براي بررسي كيفيت يادگيري دانش‌آموزان و مشكلات آموزشي معلمان فراهم مي‌آورد.

براي تحليل سؤال‌هاي يك آزمون، لازم است ضرايب دشواري و تمييز هر سؤال را تعيين كرد و به تحليل گزينه‌هاي انحرافي سؤال‌ها پرداخت.

ضريب دشواري: درصد كل آزمون‌شوندگاني كه به يك سؤال جواب درست مي‌دهند، ضريب دشواري آن سؤال است.

به‌طور كلي، ضريب‌هاي دشواري بين 3/0 تا 7/0 حداكثر اطلاع را درباره‌ي تفاوت بين آزمون‌شوندگان به‌دست مي‌دهند.

ضريب تمييز: برخلاف ضريب دشواري كه ميزان آسان يا دشوار بودن يك سؤال را نشان مي‌دهد، ضريب تمييز، كه با d نشان داده مي‌شود، قدرت سؤال را در تمايزگذاري يا تشخيص بين گروه قوي و گروه ضعيف آزمون‌شوندگان را مشخص مي‌كند.

هرقدر ضريب تمييز بزرگ‌تر باشد، قوه‌ي تمييز آن سؤال بيشتر و هر قدر اين ضريب كوچك‌تر باشد، قوه‌ي تمييز آن كمتر است. مثلاً اگر قوه‌ي تمييز سؤالي 90/0 باشد، آن سؤال آزمون‌شوندگان قوي و ضعيف را خيلي خوب از هم جدا خواهد كرد، اما اگر ضريب تمييز سؤالي 10/0 باشد، آن سؤال از عهده‌ي جداسازي دانش‌آموزان ضعيف و قوي به‌خوبي برنخواهد آمد. ضريب تمييز صفر حاكي از اين است كه آن سؤال به‌هيچ وجه نتوانسته بين گروه قوي و ضعيف تمايز قائل شود.