• Русский
  • English

Синергетическая лингвистика для нового поколения

Название проекта

Когнитивные и нейролингвистические технологии персонализации образования и реабилитации детей

Ключевая идея (слоган) проекта

Синергетическая лингвистика для нового поколения

Организации-партнеры:

Университет штата Аризона;

Хельсинкский университет;

Лейденский университет;

Глобальная научно-технологическая задача (вызов), на решение которой ориентирован проект

Разработка новых технологий развития человеческого потенциала (укрепления здоровья и совершенствования образования) – в соответствии с новой программой Организации объединенных наций «Преобразование нашего мира: Повестка дня в области устойчивого развития на период до 2030 года», принятой 70-й сессией Генеральной Ассамблеей ООН 25 сентября 2015 года.

Научный руководитель проекта

Даниэлла МакНамара (h-index – 29)

Описание проекта

Проект связан с решением глобального вызова – разработкой новых технологий развития человеческого потенциала. На мировом уровне представляется необходимой разработка новых диагностических и коррекционных технологий для широкого спектра нарушений развития, а также внедрение новых методов в образовательный процесс с выстраиванием индивидуальной траектории обучения.

Существующая во многих странах практика написания учебников и разработки тестов для школьников не учитывает уровня читабельности используемого текста и ориентирована на интуицию исследователя/автора. Определение уровня читабельности текста, используемого в учебном и экзаменационном дискурсах, а также подбор текстов, соответствующих когнитивным и языковым компетенциям школьника, – одна из самых актуальных проблем прикладной лингвистики.

Завышение уровня читабельности учебного дискурса ведет к снижению объема воспринимаемого текста, занижение – замедляет развитие школьников. Создание автоматизированного анализатора текста, способного определять количественные и качественные параметры текста, необходимо для выявления его соответствия этнокультурным особенностям и когнитивным способностям обучаемого, в особенности в ситуации наличия когнитивных расстройств. Нарушения речевого, когнитивного, психоэмоционального и социального развития на сегодняшний день признаны ВОЗ и ЮНЕСКО одним из наиболее серьезных вызовов в области здравоохранения. Они встречаются не менее чем у одной пятой детей, процент таких нарушений неуклонно растет. Проект включает в себя масштабное фундаментальное исследование лингвистических и психофизиологических механизмов развития языковых способностей и решает в числе прочих научную проблему изучения лингвистической составляющей речевых расстройств различного генеза и выработки принципов диагностики и реабилитации с опорой на лингвистический компонент.

Проект решает научную проблему валидности вербального материала, используемого в клинической практике. Лингвистическая составляющая психометрического инструментария, в том числе оценки речевого развития, когнитивных функций, болевых синдромов, в особенности у детей и подростков, в России на данный момент нуждается в серьезном научном развитии и экспериментальном обосновании с ориентацией на европейские образцы с целью оптимизации проведения совместных международных исследований, включающих данные по языкам различных семей и данные о культурной специфике носителей языков. Одновременное использование методов вызванных потенциалов и вызванных изменений ритмической активности ЭЭГ способствует максимально полному описанию электрофизиологических характеристик ответа мозга, связанных с восприятием речи. Значительный объем баз данных позволит апробировать такие методы анализа данных ЭЭГ,как deep mining и другие алгоритмы машинного обучения.

 Подходы к реализации проекта

Исследования речи в норме и патологии и исследования в области диагностики и лечения боли будут осуществляться комбинаторно: с использованием данных ЭЭГ, МРТ, айтрекинга в сочетании с применением лингвистических инструментов оценки речи на нескольких языках (в зависимости от языка носителя, с учетом фактора билингвизма), нейропсихологических и нейрокогнитивных тестов, нацеленных на различные возрастные группы.

Банк данных тестов будет включать в себя как собственные разработки, так и переведенные, валидизированные и адаптированные на российской почве зарубежные оценочные материалы (в коллаборации с их авторами или создателями). Перед включением лингвистического материала в тест каждый блок заданий входит в отдельный пилотный проект, направленный на анализ валидности материала на широкой выборке.

После статистической обработки данных на стадии пилотного проекта наиболее валидный материал входит в основную базу программы-анализатора. Для проведения исследования планируется разработать ряд новых модификаций парадигм для изучения нарушения ожиданий и негативности рассогласования, специально для оценки процессов, связанных с восприятием речи.

Автоматизированный анализатор текста представляет собой программу, определяющую уровень сложности (читабельности) текста с корреляцией по годам обучения и/или возрасту обучаемого. Существующие модели автоматизированных анализаторов текстов основаны на технологиях обработки текстовой информации и идентификации дискурсивных маркеров, их дискурсивных функций, иллокутивного потенциала и когнитивной нагрузки.

Используемые технологии: технология регулярных выражений, позволяющая идентифицировать регулярно повторяющиеся текстовые фрагменты в связном тексте, истоки которой лежат в теории автоматов Уоррена МакКаллока и Уолтера Питтса, теории формальных языков и классификации формальных грамматик Ноама Хомского, а также Технологии нечеткого поиска в тексте [поиск по сходству или fuzzy string search)], позволяющей идентифицировать и дифференцировать определенные текстовые фрагменты, совпадающие по формальным синтаксическим признакам и принципиально различающиеся по иным основаниям.

Имеющийся у университета опыт, научно-исследовательские и технологические наработки (заделы)

Уже имеется структура создаваемых компьютеризированных версий лингвистических инструментов оценки, налажено сотрудничество с партнерами за рубежом, частично запущены пилотные проекты по блокам тестов, имеется запрос от организаций здравоохранения на проведение данных работ, ведется работа по диагностике и терапии речевых расстройств сформированной речи.

Частично имеется инструментарий, связанный с валидацией психометрических и нейрокогнитивных тестов (более 20 батарей и шкал). Партнерами проекта разработана совокупность методов анализа вызванных изменений ЭЭГ и апробированы экспериментальные задания, оптимизированные под сочетанное использование метода вызванных потенциалов и метода вызванных изменений ритмов ЭЭГ, что имеет особое значение в контексте предлагаемого плана исследований.

Проекты такого масштаба, требующие организацию сбора нейро-, психо- и социолингвистических данных для 1000 и более человек, в том числе с нарушениями речевого развития, невозможен без налаженных контактов с целой сетью организаций, работающих в сфере здравоохранения, образования и коррекционной педагогики. В рамках проектов, осуществляемых лабораторий soLet, возглавляемой руководителем проекта, разработаны и внедрены программы автоматической обработки естественного языка, такие как Coh-Metrix, TERA, SiNLP, TAALES, TAACO, а также автоматизированные тьютеры для обучения iStart, Writing Pal. В настоящее время руководитель проекта участвует в ряде проектов: Использование программы Writing Pal в обучении взрослых (Exploration of Automated Writing Strategy Instruction for Adolescent Writers using the Writing Pal), Моделирование социальных контактов и действий при интегративном обучении.

У коллектива имеется достаточный опыт в области осуществления исследований и экспертизы уровня сложности тестов: члены коллектива участвовали в 5-летнем проекте европейского уровня (ТЕМПУС) по разработке и валидации тестовых заданий, являются членами федеральной команды разработчиков ЕГЭ, имеют опыт транскрибирования текстов и проведения экспериментов, имеют опыт создания объемных электронных корпусов текстов; исследования прошли апробацию на ряде международных конференций и получили одобрение экспертов, налажено сотрудничество с зарубежными партнерами. Зарубежные партнеры имеют опыт выявления уровня сложности англоязычных текстов.

Достижение глобального лидерства (превосходства), как один из результатов реализации проекта

Глобальное лидерство достигается за счет синергетического характера исследования, его фундаментальной лингвистической составляющей и высококвалифицированной команды, реализующей проект. Научная область, в которой достигается лидерство, находится на стыке компьютерных наук, нейронаук, психолингвистики, когнитивной лингвистики и смежных научных областей. В результате исследования создаются экономически выгодные технологии, выстроенные на лингвистически валидном материале, которые могут быть внедрены одновременно и в реабилитационный, и в образовательный процесс.

На одной основе создается инструментарий с широкими сферами применения. Полученные научные достижения выводят персонализацию медицины и образования на новый уровень. Компетенции: внедрение интегративных лингвистических методик в процесс оказания медицинской помощи и образовательную деятельность; разработка совокупности психофизиологических методов и парадигм для исследования нейробиологических коррелятов психических процессов, связанных с восприятием речи.

Результаты будут востребованы: А) в ежедневной практике врачей-неврологов, нейролингвистов, клинических лингвистов, дефектологов, психологов, нейропсихологов, врачей-терапевтов, ревматологов, врачей общей практики, педиатров; Б) создателями и разработчиками психометрического инструментария оценки различных параметров человеческой деятельности; В) тестологами при разработке и внедрении валидных лингвистических тестов; Г) авторами-составителями учебной литературы при определении целевой аудитории читателей (слушателей).

 Значимость, востребованность и научная новизна проекта

Проект носит полиаспектный характер, осуществляя вклад в медицину и образование на основе имеющихся в современной лингвистике новых подходов к анализу языкового материала. Создание инструментария для диагностики и оценки, применяемого в широкой сфере, с использованием научного аппарата когнитивных наук и прикладной лингвистики (нейролингвистики, компьютерной лингвистики, лингводидактической тестологии, корпусной лингвистики), является востребованным и значимым.

Новизна проекта состоит в его синергетическом характере и применении лингвистического аппарата и достижений в области лингвистики в областях, важных для развития человеческого потенциала (глобальный вызов). В рамках проекта планируется создание психофизиологического лабораторного комплекса, использующего сочетание широкого спектра методов анализа ЭЭГ, вегетативных параметров и биомаркеров, основанных на алгоритмах анализа видеопотока; такой подход обеспечит уникальность и высокую информативность методических подходов.

Компьютеризированная батарея диагностики речевых расстройств с автоматически генерируемым индивидуально для каждого нового обследования стимульным материалом из базы данных, содержащей лингвистически валидные элементы по каждому языковому уровню, на данный момент отсутствуют в практике работы с детьми, имеющими речевые расстройства различного генеза. База лингвистически валидного материала для оценки выраженности боли у детей и подростков на данный момент отсутствует. Соответственно, имеются проблемы в диагностике и реабилитации пациентов с болью, насущной является необходимость разработки индивидуальных терапевтических программ.

Выявленное на основе созданных в процессе реализации проекта корпусов текстов уникальное соотношение количественных и качественных параметров текстов (дискурсивных маркеров), определяющих их уровень сложности, будет существенным вкладом в теоретическую лингвистку и лингводидактику. Существующие отечественные анализаторы текста (включая Антиплагиат и Text Mining) способны выявлять только регулярные дискурсивные маркеры и рассчитывать количественные параметры текста (количество букв, слогов, слов, предложений). Имеющиеся в распоряжении исследователей и практиков программы не рассчитывают такие параметры, как синтаксическая простота, конкретность/абстрактность, глубинная и референциальная связность.

Впервые выведенная и научно обоснованная формула сложности текстов, а также построенный на ее основе анализатор сложности текстов могут быть использованы во всем мире для разработки аналогов для других языков. Современная аудитория учащихся лингвистически неоднородна, проблема дидактической и методической адекватности и эффективности учебных текстов является значимой, поэтому учебные материалы, создаваемые на основе текстов определенного уровня сложности, т.е., соответствующих возрастным когнитивным и лингвистическим способностям школьника, востребованы в образовательной практике.

Значимость и востребованность проекта в технологиях

Проект направлен на разработку лингвистических технологий оптимизации реабилитационных и образовательных процессов. Реализация проекта приведет к появлению не только принципиально новых данных по специфике нейробиологических аспектов восприятия речи, но и к разработке широкого спектра нейролингвистических и психофизиологических методов изучения восприятия речи в норме и патологии. Уникальным технологическим решением станет разработка экспериментальных заданий, оптимизированных под сочетанное использование методов вызванных потенциалов ЭЭГ (требующих относительно большого накопления реализаций однотипных стимулов) и вызванных изменений ритмической активности ЭЭГ (требующих более длительного межстимульного интервала).

Кроме того, следует отметить важность разработки нейролингвистических и нейрокогнитивных методик для оценки речевых нарушений, позволяющих осуществлять более точную диагностику с меньшими затратами времени. Публикация результатов в высокоранговых журналах, а также широкое научное партнерство обеспечат быстрое распространение разработанных исследовательских и диагностических методов, что позволит закрепить приоритет коллектива в данной области исследований.

Поскольку проект нацелен также на совершенствование технологии аналитической обработки текста, который сам по себе является основным средством передачи информации в образовательных целях, ее применение изменит традиционные методы лингводидактики. Научные результаты проекта могут внедряться в образовательный процесс непрерывно после каждой его стадии при разработке персонализированных учебных материалов и учебных курсов, а также для усовершенствования существующей системы оценивания языковых компетенций школьников. Проект напрямую связан с глобально научно-техническими задачами, направленными на разработку новых технологий развития человеческого потенциала (укрепления здоровья и совершенствования образования).