Как ИИ-проверка, мгновенная обратная связь и интервальное повторение влияют на результаты и стресс при подготовке к ЕГЭ
Мы не изобретали способ учиться — мы собрали методы, у которых десятилетиями копится научная база, и встроили их в подготовку к ЕГЭ. Ниже — честный обзор этих исследований и того, как каждый метод соответствует функциям SdamEx.
Насколько вообще «двигает» индивидуальный разбор и обучающие системы
Отправная точка любого разговора о персональном обучении — классическая работа Бенджамина Блума (1984). Он сравнил обычный класс с занятиями один на один и обнаружил разрыв примерно в две стандартные отклонения (+2σ): средний ученик на индивидуальных занятиях обгонял около 98% сверстников из обычного класса. Важно держать в голове: это аспирационный бенчмарк, а не достигнутая планка. Сам Блум назвал задачу «как дать массовому обучению эффект репетитора» нерешённой — и она остаётся таковой. Мы приводим её как ориентир, к которому стремится индустрия, а не как цифру, которую кто-то воспроизвёл.
Дальше начинается более приземлённая и хорошо измеренная территория. Кеннет ВанЛен (2011) сравнил человеческое репетиторство, интеллектуальные обучающие системы (ITS) и более простые форматы. Оказалось, что хорошо устроенная обучающая система даёт эффект d=0,76 — почти вровень с живым репетитором (d=0,79), если сравнивать с подготовкой без наставника вообще. Мета-анализ Кьюлика и Флетчера (2016) показал медианный сдвиг +0,66 SD: типичный ученик с такой системой перемещается примерно с 50-го на 75-й перцентиль. А работа Ма и коллег (2014) на выборке более 14 тысяч человек дала g≈0,43 в сравнении с групповым обучением.
Что из этого следует честно: индивидуальный, отзывчивый разбор и грамотно спроектированные обучающие системы дают заметный эффект относительно «просто сидеть на уроке». Насколько он велик — зависит от качества системы и базы сравнения, поэтому мы и приводим разные цифры с разными базами, а не одну «среднюю по больнице».
Почему решать задачи полезнее, чем перечитывать теорию
Самая воспроизводимая находка в науке об обучении звучит почти контринтуитивно: попытка вспомнить материал укрепляет память сильнее, чем повторное чтение. В знаменитом эксперименте Рёдигера и Карпике (2006) студенты, которые после чтения решали тесты, через неделю помнили около 61% материала, а те, кто просто перечитывал его, — около 42%. При этом «перечитыватели» субъективно были увереннее в своих знаниях. Это и есть ловушка: ощущение, что «всё понятно», легко обмануть, а решённая задача — нет.
Это не единичный результат, а устойчивый паттерн. Мета-анализ Адесопе и коллег (2017) по сотням исследований дал эффект практики-через-тесты g=0,51 в сравнении с перечитыванием и g=0,93 в сравнении с отсутствием повторения вовсе. Масштабный обзор Яна и коллег (2021) — 222 исследования, почти 48,5 тысяч участников — подтвердил устойчивый эффект g≈0,50 в условиях, близких к реальной учёбе.
Второй важный рычаг — как именно распределена практика во времени. Сепеда и коллеги (2006) показали, что интервальное повторение (возврат к теме спустя паузы) надёжно превосходит зубрёжку в один присест: тот же объём работы, разнесённый по дням, даёт более прочный результат. Вывод для подготовки к ЕГЭ простой: лучше регулярно решать и периодически возвращаться к пройденному, чем «прочитать всё за выходные».
Какая обратная связь действительно помогает (и какая мешает)
Решать задачи полезно, но без понимания, где именно ошибка, прогресс замедляется. Обзор Хэтти и Тимперли (2007) — один из самых цитируемых в образовании — оценил эффект качественной обратной связи примерно в d≈0,79, когда она направлена на задачу и процесс её решения: что сделано, что пошло не так и что делать дальше.
Но здесь важна честная оговорка. Большой мета-анализ Клюгера и ДеНиси (1996) дал средний эффект скромнее — d=0,41 — и, что важнее, примерно в 38% случаев обратная связь вообще ухудшала результат. Вредит, как правило, оценка, направленная на личность («ты способный / неспособный»), а помогает — конкретный разбор задачи. Поэтому мы намеренно строим ИИ-проверку вокруг критериев ЕГЭ и фразы «здесь потерян балл за такой-то шаг», а не вокруг ярлыков.
Снижает ли регулярная практика тревогу перед экзаменом
Распространённый страх: «частые проверки только нагнетают тревогу». Данные говорят скорее об обратном. Мета-анализ Яна и коллег (2023) на выборке более 3,3 тысяч участников показал, что регулярная практика-через-тесты в среднем снижает экзаменационную тревожность, эффект g≈−0,52. Логика понятная: когда формат проверки знаком и предсказуем, он перестаёт быть пугающим сюрпризом.
Это подтверждается и «полевыми» данными. В исследовании Агарвал и коллег (2014) с опросом более 1 400 школьников 72% сообщили, что регулярные мини-проверки в классе заставляют их меньше волноваться, а 92% — что такие проверки помогали им учиться. Иными словами, тренировка в условиях, похожих на экзамен, работает как прививка от паники: к моменту настоящего ЕГЭ ситуация уже знакома.
Что показывают новые рандомизированные испытания
Классические работы выше — про обучающие системы и практику в целом. Но за последние пару лет появились рандомизированные контролируемые испытания (RCT) именно по ИИ-тьюторам. В работе Кестина и коллег (2025), опубликованной в Scientific Reports, студенты, занимавшиеся со специально спроектированным ИИ-тьютором, показали прирост примерно вдвое выше, чем при активном обучении на обычном занятии. Честный диапазон эффекта — 0,73–1,3 SD. Существенная оговорка: тьютор был заскриптован и снабжён педагогическими ограничителями — это не «голая» языковая модель, которой задают вопросы наугад, а тщательно выстроенный сценарий.
Вторая работа — Ван и коллеги (2024), проект Tutor CoPilot. Там ИИ помогал живым тьюторам в реальном времени, и это дало прирост успеваемости учеников на +4 процентных пункта, а у менее опытных тьюторов — до +9. Здесь тоже нужны две честные оговорки: это препринт (ещё не прошедший полное рецензирование), и ИИ выступал дополнением к человеку, а не его заменой.
Общий трезвый вывод: данные по ИИ-тьюторам обнадёживают, но они молодые, зависят от качества сценария и почти всегда говорят об ИИ как об усилителе хорошей методики, а не о магии самой по себе.
Как мы переносим эти методы в подготовку к ЕГЭ
Мы не запускали клинические испытания SdamEx и не измеряли собственные эффект-сайзы. Что мы действительно делаем — берём методы с прочной научной базой и встраиваем их в ежедневную подготовку. Вот как функции платформы соответствуют описанным выше механизмам:
Банк задач и варианты
Это практика извлечения (retrieval practice): вы решаете, а не перечитываете. Именно её эффект описывают Adesope и др. (2017) и Yang и др. (2021).
ИИ-проверка по критериям ЕГЭ
Это адресная обратная связь о задаче — «где именно потерян балл», а не общая оценка. На таком типе обратной связи сосредоточены Hattie & Timperley (2007) и предостережение Kluger & DeNisi (1996).
ИИ-репетитор
Это диалог по шагам, ближе к индивидуальному разбору. К этому типу взаимодействия относятся обзоры по интеллектуальным обучающим системам (VanLehn, 2011; Kulik & Fletcher, 2016) и свежие RCT по ИИ-тьюторам (Kestin и др., 2025).
Повторение и работа над ошибками
Это интервальное повторение: возврат к темам спустя время вместо зубрёжки в один присест. О его преимуществе над массированной практикой пишет Cepeda и др. (2006).
Главная оговорка ещё раз, явно: ни один внешний эффект-сайз с этой страницы не подаётся как измеренный результат SdamEx. Цифры описывают метод по данным сторонних исследований, а не наш продукт. Мы используем их, чтобы объяснить, почему делаем платформу именно так, — и будем рады, когда сможем честно показать собственные измеренные результаты.
Полный список исследований
Bloom, B. S. (1984). The 2 Sigma Problem: The Search for Methods of Group Instruction as Effective as One-to-One Tutoring. Educational Researcher, 13(6), 4–16. DOI 10.3102/0013189X013006004
Аспирационный бенчмарк +2σ — нерешённая задача, а не достигнутый результат.
VanLehn, K. (2011). The Relative Effectiveness of Human Tutoring, Intelligent Tutoring Systems, and Other Tutoring Systems. Educational Psychologist, 46(4), 197–221. DOI 10.1080/00461520.2011.611369
ITS d=0.76 против человека-репетитора d=0.79. База сравнения: подготовка без репетитора.
Kulik, J. A., & Fletcher, J. D. (2016). Effectiveness of Intelligent Tutoring Systems: A Meta-Analytic Review. Review of Educational Research, 86(1), 42–78. DOI 10.3102/0034654315581420
Медианный сдвиг +0,66 SD (с 50-го на 75-й перцентиль).
Ma, W., Adesope, O. O., Nesbit, J. C., & Liu, Q. (2014). Intelligent Tutoring Systems and Learning Outcomes: A Meta-Analysis. Journal of Educational Psychology, 106(4), 901–918. DOI 10.1037/a0037123
g≈0,43 против группового обучения (n=14 321).
Roediger, H. L., & Karpicke, J. D. (2006). Test-Enhanced Learning: Taking Memory Tests Improves Long-Term Retention. Psychological Science, 17(3), 249–255. DOI 10.1111/j.1467-9280.2006.01693.x
Через неделю: ~61% (группа, которая решала тесты) против ~42% (группа, которая перечитывала).
Adesope, O. O., Trevisan, D. A., & Sundararajan, N. (2017). Rethinking the Use of Tests: A Meta-Analysis of Practice Testing. Review of Educational Research, 87(3), 659–701. DOI 10.3102/0034654316689306
g=0,51 против перечитывания; g=0,93 против отсутствия повторения.
Yang, C., Luo, L., Vadillo, M. A., Yu, R., & Shanks, D. R. (2021). Testing (Quizzing) Boosts Classroom Learning: A Systematic and Meta-Analytic Review. Psychological Bulletin, 147(4), 399–435. DOI 10.1037/bul0000309
g=0,499 по 222 исследованиям (n=48 478).
Cepeda, N. J., Pashler, H., Vul, E., Wixted, J. T., & Rohrer, D. (2006). Distributed Practice in Verbal Recall Tasks: A Review and Quantitative Synthesis. Psychological Bulletin, 132(3), 354–380. DOI 10.1037/0033-2909.132.3.354
Интервальное повторение устойчиво превосходит массированное (зубрёжку). PMID 16719566.
Hattie, J., & Timperley, H. (2007). The Power of Feedback. Review of Educational Research, 77(1), 81–112. DOI 10.3102/003465430298487
d≈0,79 для обратной связи о задаче и процессе её решения.
Kluger, A. N., & DeNisi, A. (1996). The Effects of Feedback Interventions on Performance: A Historical Review, a Meta-Analysis, and a Preliminary Feedback Intervention Theory. Psychological Bulletin, 119(2), 254–284. DOI 10.1037/0033-2909.119.2.254
d=0,41 в среднем, но примерно в 38% случаев обратная связь ухудшала результат — отсюда важно, чтобы она была про задачу, а не про личность.
Yang, C., Li, J., Zhao, W., Luo, L., & Shanks, D. R. (2023). Do Practice Tests (Quizzes) Reduce or Provoke Test Anxiety? A Meta-Analytic Review. Educational Psychology Review, 35, Art. 87. DOI 10.1007/s10648-023-09801-w
Снижение тревожности g≈−0,52 (n=3 374).
Agarwal, P. K., D'Antonio, L., Roediger, H. L., McDermott, K. B., & McDaniel, M. A. (2014). Classroom-Based Programs of Retrieval Practice Reduce Middle School and High School Students’ Test Anxiety. Journal of Applied Research in Memory and Cognition, 3(3), 131–139. DOI 10.1016/j.jarmac.2014.07.002
Опрос n=1 408: 72% учеников сообщили, что меньше волнуются, 92% — что регулярные мини-проверки помогли учиться.
Kestin, G., Miller, K., Klales, A., Milbourne, T., & Ponti, G. (2025). AI Tutoring Outperforms In-Class Active Learning: An RCT Introducing a Novel Research-Based Design in an Authentic Educational Setting. Scientific Reports, 15, Art. 17458. DOI 10.1038/s41598-025-97652-6
Прирост примерно вдвое (честный диапазон 0,73–1,3 SD). Важно: тьютор был заскриптован и снабжён педагогическими ограничителями (guardrails), это не «голая» языковая модель.
Wang, R. E., Ribeiro, A. T., Robinson, C. D., Loeb, S., & Demszky, D. (2024). Tutor CoPilot: A Human-AI Approach for Scaling Real-Time Expertise. EdWorkingPaper 24-1054 / arXiv:2410.03017. arXiv:2410.03017
Прирост +4 процентных пункта (у менее опытных тьюторов до +9). Важно: это препринт, и ИИ дополнял живого тьютора, а не заменял его.