Сторінка
2
рекомендацій з інтерпретації тестових результатів.
Цілісність тесту означає взаємозв'язок завдань, їхня приналежність загальному вимірюваному фактору. Кожне завдання тесту виконує відведену йому роль і тому жодне з них не може бути вилучене з тесту без втрати якості виміру.
Структуру тесту утворює спосіб зв'язку завдань між собою. В основному, це так звана факторна структура, у якій кожне завдання зв'язане з іншими через загальний зміст і загальну варіацію тестових результатів.
У навчальному тесті завдання розташовуються в міру зростання складності - від найпростіших до найскладніших. Інакше кажучи, головною формальною системоутворюючою ознакою тесту є розходження завдань відповідно ступеня їх складності. Слово "формальне" вживається для пояснення того, що “тест” трактується не лише, як система завдань зростаючої складності, без обліку їх змісту.
Прояву системної якості тесту сприяє і єдина дисциплінарна спільність завдань, що реалізує ідею виміру підготовленості, тих хто проходить тестування, по одній якій-небудь визначеній навчальній дисципліні або їх комплексу.
Час нерідко називається в якості іншого системоутворюючого фактора. Дійсно, одне з розумінь, покладених в основу створення тестів - мати інструмент швидкого і точного оцінювання.
Один з актуальних напрямків сучасної організації тестового контролю в дистанційній освіті - це індивідуалізація контролю, що приводить до значної економії часу тестування. Контроль ведеться за допомогою заздалегідь відкаліброваних, зі рівнем складності, завдань.
Інша сторона питання полягає в тому, що від часу тестування істотно залежить якість результатів. Кожен тест має оптимальний час тестування, зменшення чи перевищення якого знижує якісні показники тесту. Оптимальний час тестування визначається емпірично, по показнику дисперсії тестових даних. Якщо по осі абсцис відкласти час тестування, а по осі ординат - значення дисперсії тестових результатів, що отримується після кожної спроби контролю, то з'єднавши крапки, одержимо представлення про зміну дисперсії; максимум значення останньої вкаже на оптимум часу, необхідного для тестового контролю.
Якість тесту традиційно зводиться до визначення міри його надійності і питань валідності отриманих результатів. Якісним, як і об'єктивним, можна назвати тільки той метод виміру, що обґрунтований науково і здатний дати необхідні результати.
Валідність означає придатність тестових результатів для тієї мети, заради чого проводилося тестування. Валідність залежить від якості завдань, їхнього числа, від ступеня повноти і глибини охоплення змісту навчальної дисципліни у завданнях тесту. Крім того, валідность залежить також від балансу і розподілу завдань за складністю, від методу добору завдань у тест із загального банку завдань, від інтерпретації тестових результатів, від організації збору даних, від підбора вибіркової сукупності випробуваних.
Специфічна форма тестових завдань говорить про те, що завдання тесту являють собою не питання і не задачі, а завдання, сформульовані у формі висловлювань, істинних чи помилкових, у залежності від відповідей.
Визначений зміст означає використання в тесті тільки такого контрольного матеріалу, що відповідає змісту навчальної дисципліни; інше в навчальний тест не включається.
Зміст тесту існує, зберігається і передається в одній з чотирьох основних форм завдань. Поза тестовими формами ні тест, ні його зміст не існують. Теоретично виправданим критерієм упорядкування змісту є критерій складності завдань. Позанавчальний зміст (наприклад, перевірка рівня інтелектуального розвитку) у навчальний тест не включається. Це предмет психологічного виміру.
Зростаючу складність завдань можна образно порівняти з бар'єрами на біговій доріжці стадіону, де кожен наступний вище попереднього. Пробігти дистанцію й успішно перебороти всі бар'єри зможе тільки той, хто краще підготовлений
Складність завдань можна визначати двома способами:
шляхом логічного міркування, на основі передбачуваного числа і характеру розумових операцій, необхідних для вдалого виконання завдань;
після емпіричної перевірки завдань, з підрахунком частки неправильних відповідей.
У класичній теорії тестів багато років розглядалися тільки емпіричні показники складності. У сучасних теоріях навчальних тестів, які використовуються в дистанційному навчанні, більше уваги стало приділятися характеру розумової діяльності у процесі виконання тестових завдань різних форм.
Показник складності завдання розглядається як важливий системо- і одночасно структуроутворюючий фактор тесту.
Можна додати ще один критерій - це критерій логічної визначеності тестового завдання. Його можна сформулювати словами, близькими до формулювання Х. Каррі: завдання є визначеним, якщо на нього можна відповісти позитивно чи негативно, і якщо існує ефективний процес для знаходження такої відповіді.
Відповідь на завдання навчального тесту являє собою коротке судження, пов'язане за змістом і за формою зі змістом завдання. Кожному завданню ставляться у відповідність відповіді правильні і неправильні. Критерії правильності заздалегідь визначаються авторами тесту. Ймовірність правильної відповіді на будь-яке завдання залежить від співвідношення рівня знань випробуваного і рівня складності завдання. При наявності порівняльної шкали цю ймовірність виражають значенням від нуля до одиниці.
Оцінка відповідей за ступенем їх правильності проводиться досить рідко, але при необхідності створюються завдання з такими відповідями, що правильні в різному ступені.
За допомогою тестування, частіше інших ознак, перевіряються знання, уміння, навички та уявлення. З погляду навчальних вимірів корисно ввести два основних показники якості знань - рівень і структура знань. Вони оцінюється за допомогою реєстрації оцінок, як за знання, так і за незнання всіх необхідних компонентів матеріалу, що перевіряється. Для об'єктивізації цього процесу усі компоненти повинні бути однакові.
Однаковими є і правила виставлення оцінок. Ці умови відкривають дорогу для об'єктивного порівняння індивідуальних структур знання і незнання.
Рівень знань виявляється при аналізі відповідей на всі завдання тесту. Чим більше правильних відповідей, тим вище індивідуальний тестовий бал. Звичайно в системах дистанційної освіти цей тестовий бал асоціюється з поняттям "рівень знань" і проходить процедуру уточнення на основі тієї чи іншої моделі виміру. Той самий рівень знань може бути отриманий за рахунок відповідей на різні завдання.
Наприклад, у тесті з тридцяти завдань студент одержав десять балів. Ці бали, скоріш за все, отримані за рахунок правильних відповідей на перші десять, порівняно легких завдань. Властиву для такого випадку послідовність одиниць, а потім нулів можна назвати правильним профілем знань учня.
Якщо тестовий бал нижче необхідного рівня (вимірюваного критерію), то виявлені при цьому знання, уміння, навички і представлення вказують на докритеріальний рівень підготовленості. Цей рівень є найпоширенішим і масовим. Для багатьох він виявляється цілком переборним у міру вивчення ними наук і оволодіння майстерністю. Однак деякі, переважно в силу недоліку здібностей і старанності, так і залишаються на цьому рівні.