Новосибирские ученые разработали первую в мире «умную» программу диагностики по голосу болезней гортани и депрессий (видео)

Новости

В начале мая специалисты НГТУ НЭТИ совместно с коллегами из НГПУ и фониатрического центра разработали первую в мире систему, которая позволяет диагностировать по голосу долговременные и часто маскируемые пациентом психоэмоциональные отклонения, а также помогает определять на ранних стадиях развитие опухолей в голосовом аппарате. Помимо медицины, система может найти применение в педагогике, социальной работе, системе безопасности и идентификации.

Психоэмоциональные расстройства у человека можно диагностировать при помощи анализа звуковых волн. К такому выводу пришли ученые из Новосибирского государственного технического университета НЭТИ. Спустя годы исследований они обнаружили зависимость изменений в голосе от психоэмоциональных расстройств. Запатентованная методика позволяет точно определять нарушения при помощи цифровой обработки звука.

Ранее попытки создания подобных систем диагностики голоса были и за рубежом. В России подобные разработки велись в основном для военных целей. Главная уникальность устройства ученых факультета радиотехники и электроники — алгоритм цифровой обработки голосового сигнала, позволяющий найти связь между голосовыми изменениями и психоэмоциональными нарушениями говорящего.

Новосибирские ученые подтвердили гипотезу, что речь человека меняется в зависимости от типа расстройства. Благодаря тестам, проведенным на детях младшей школьной группы, специалисты нашли переменную в специально созданной математической модели, которая отвечает за связь голоса с психоэмоциальнальным состоянием. По словам ученых, сейчас число расстройств растет как среди детей, так и среди взрослых. Это может быть тревога, депрессия, агрессия или аутоагрессия.

Устройство производит анализ при помощи алгоритма, в основу работы которого включен акустический анализ звукового сигнала. Набор тестовых фраз записывается на микрофон и оцифровывается звуковой картой с высоким разрешением. Так звуковая волна преобразуется в цифровой сигнал. Далее программа производит обработку этой волны: алгоритм рассчитывает параметры высокочастотных и низкочастотных колебаний, мощности звука, строит кривую. Полученные параметры исследуемого голоса сравнивают с эталонным. На основании полученных различий определяется психоэмоциональное состояние человека. Система будет удобна в эксплуатации: для ее работы необходим только микрофон, специализированная аудиокарта и компьютер с программным обеспечением.

«Чтобы понять, как работает программа, приведу пример. Допустим, что есть параметр звука X, который у нормального человека 0,2—0,3, а у человека с явным психоэмоциональным нарушением равен 5. Отсюда мы можем прийти к выводу, что у человека есть симптомы, к примеру, аутоагрессии. Именно эту корреляцию мы искали и нашли», — говорит соавтор разработки, молодой ученый факультета радиотехники и электроники Дарья Боровикова.

Помимо психоэмоциональных заболеваний, программа может определять и функциональные нарушения голоса, которые в дальнейшем могут привести к стойким органическим изменениями в гортани: ларингиты, хордиты, узелки и полипы голосовых складок, папилломатоз гортани и другие заболевания. По словам ученых, функциональные нарушения диагностировать сложнее, чем органические, которые можно увидеть при помощи ларингоскопов и эндоскопов. Однако они также представляют угрозу. Подобные расстройства, как правило, связаны с неправильным использованием голосового аппарата. Такие нарушения встречаются у детей, которые в раннем возрасте начинают неправильно заниматься вокалом. Долгое неправильное звукопроизношение и приводит к появлению воспалений.

Ранее психологические расстройства и функциональные нарушения в голосе пациента выявлялись специалистом исключительно «на слух». Результаты такой диагностики носили субъективный характер и зависели от компетенции конкретного врача. «Определение нарушений в голосе у пациента объективным путем — очень сложная и актуальная задача. Возможность обратиться к высококвалифицированным специалистам есть далеко не всегда. А выявление на ранних стадиях функциональных нарушений в голосе позволяет не допускать развитие заболеваний», — рассказала фонопед-логопед высшей квалификационной категории, ведущий специалист областного консультативно-диагностического фониатрического центра Ольга Фетисова.

Другие разработки, основанные на использовании технологий анализа голоса, почти всегда подразумевали использование датчиков, которые нужно было фиксировать на шее пациента. Недостаток таких способов — необходимость контакта врача и пациента, что может быть невозможно, например, в условиях самоизоляции. Большая часть методов имеет уязвимые места, связанные с технологией обработки сигналов. Система анализа голоса, разработанная учеными НГТУ НЭТИ, лишена этих недостатков и предполагает возможность дистанционного распознавания его характеристик и изменений в нем.

Другой областью применения системы цифровой обработки голоса может стать сфера безопасности и военного дела. При дополнительных исследованиях программа позволит делать экспертизу голоса по телефонным разговорам террористов и преступников, стать дополнительным элементом в детекторе лжи и следить за психоэмоциональным состоянием солдат.

Помимо медицины и сферы безопасности, технология может использоваться в педагогике и социальной работе. В дальнейшем ученые планируют провести ряд дополнительных исследований и увеличить число испытуемых. По словам Дарьи Боровиковой, создание такой расширенной выборки поможет скорректировать параметры системы и сделать систему диагностики более точной.

В числе ученых в проекте — сотрудники НГТУ НЭТИ, кандидат психологических наук Новосибирского государственного педуниверситета и фонопед, которая занимается исследованиями голоса и его постановкой. По словам Дарьи Боровиковой, именно благодаря коллективной работе инженеров, специалиста по работе с голосом и психолога всей команде удалось добиться таких результатов.

Основоположник научной разработки — доктор технических наук, профессор факультета радиотехники и электроники Владимир Макуха, который на протяжении более чем 10 лет занимался вопросами объективизации голосоречевых характеристик. Заслуженный работник университета скончался в июле 2019 года. Сейчас проект реализуется под руководством профессора факультета радиотехники и электроники НГТУ НЭТИ доктора медицинских наук Олега Гришина.

Видео работы «умной» программы диагностики психоэмоциональных и функциональных нарушений

Для СМИ
Юрий Лобанов, пресс-секретарь, +7-923-143-50-65, is@nstu.ru
Алина Рунц, специалист по связям с общественностью, +7-913-062-49-28, derevyagina@corp.nstu.ru
Руслан Курбанов, корреспондент, +7-913-772-30-78, kurbanov@corp.nstu.ru

1 июня 2020

Размещение информации на странице:
Управление информационной политики