2016-11-10T18:43:01+03:00

Молодой ученый из Воронежа получит 1,2 млн рублей на предотвращение самоубийств

Татьяна Литвинова разрабатывает программу, которая поможет диагностировать у человека склонность к суициду
Поделиться:
Комментарии: comments1
Соотношение частиц и союзов в тексте могут рассказать о личностных характеристиках человека.Соотношение частиц и союзов в тексте могут рассказать о личностных характеристиках человека.Фото: Михаил ФРОЛОВ
Изменить размер текста:

Каждые 40 секунд один человек в мире заканчивает жизнь самоубийством. Ежегодно погибает около 800 тысяч. Это не факты для устрашения. Это официальные данные Всемирной организации здравоохранения. Научный сотрудник Речевого центра русского языка при Воронежском педуниверситете Татьяна Литвинова разрабатывает программу, которая позволит диагностировать по тексту склонность его автора к суициду.

Татьяна получила на этот проект президентский грант. Два года – в 2016-м и 2017-м - на ее работу будут выделять по 600 тысяч рублей. По итогу девушка должна предоставить рабочую модель программы.

- Я спрашивала у психологов, можно ли как-то определить вероятность того, что человек совершит самоубийство или предпримет повторную попытку, если его удалось спасти. Есть ли диагностики, которые позволяют это сделать. Выяснилось, что в своей работе психологи ориентируются на опыт и интуицию. И так во всем мире: чтобы оценить суицидальные склонности человека, клиницисты используют только опыт! – разводит руками Татьяна.

Проект Татьяны Литвиновой – междисциплинарный. Здесь задействованы лингвисты, математики, программисты, психологи и медики. Это ново для России – применять точные методы, чтобы анализировать личностные характеристики. При помощи компьютера тексты размечаются, затем численные значения языковых параметров передаются в программу для расчета. По этим данным компьютер сравнивает, насколько изучаемые материалы схожи с текстами совершивших самоубийство.

фото: предоставлено героиней публикации

фото: предоставлено героиней публикации

ВАЖНО НЕ ТОЛЬКО КАЧЕСТВО

Зарубежный опыт применения метода количественного анализа текста богаче российского. Так, ученые из университета Цинцинатти на протяжении пяти лет (с 2011 по 2016) наблюдали за подростками (13 - 18 лет), которые хотя бы однажды пытались покончить с собой, в том числе за их речью. Они записали интервью с 30 такими пациентами и с 30 обычными подростками, затем попросили врачей определить по текстам, является ли их автор суицидентом (человеком, совершавшим попытку самоубийства) или нет. Только в 55% случаев медики верно классифицировали тексты, в то время как компьютер, основываясь на количественном анализе речи, выдал точность в 93%.

– Конечно, специалисты нужны, – объясняет Татьяна. – Но компьютер благодаря программам может замечать такие структуры, которые не видит человек. Такая работа строится на методе все того же машинного обучения. Компьютер анализирует тексты суицидентов и несуицидентов и «обучается» их классификации. Дальше мы вводим тексты, об авторах которых машина не имеет данных. Если в 9 из 10 случаев материалы классифицированы верно, то мы можем говорить о том, что наша модель работает с точностью 90%.

Еще один пример подтверждает, что нельзя анализировать только содержание речи, ведь его легко контролировать. В университете Беркли ученые исследовали электронные письма студентов, страдающих депрессией, и студентов, которым не был поставлен такой диагноз. Выяснилось, что в письмах учащихся, которые относятся к первой категории, больше слов с положительной окраской, чем у здоровых людей. Эта работа показала, что качественный метод необходимо дополнять количественным, который как раз и использует в своем проекте Татьяна Литвинова.

ПО ЧАСТИЦАМ И ЗАПЯТЫМ

Материалы для исследования Татьяна собирала больше года. Главная трудность – найти тексты людей, покончивших жизнь самоубийством. Удалось собрать 40 «мертвых» дневников в «Живом журнале» и «ВКонтакте». О судьбе их авторов девушка узнала из записей друзей и комментариев. Дневники принадлежат людям от 15 до 29 лет из разных регионов страны. Материалом для сравнения стали тексты, которые входят в базу данных «RusPersonality». Этот массив материалов Татьяна создавала на протяжении нескольких лет. Там содержатся тексты более трех тысяч человек (обычных студентов и школьников из Воронежа, Москвы, Ростова-на-Дону и других городов). Респондентов просили описать свой вчерашний день, самый запоминающийся день в жизни, идеального спутника жизни и т. д. Все тексты максимально приближены к устной речи и правке не подвергались.

- Мы анализировали параметры речи, которые с трудом поддаются имитации. На начальном этапе у нас было 104 параметра: все части речи, разбитые на подкатегории, плюс оценивали лексическое разнообразие и сложность текста. Ведь в 100 словах может быть 20 повторов, а может 50. От 104 мы пришли к 10, в числе которых отношение неполнозначных (служебных) и полнозначных слов, доля местоимений, глаголов, предлогов, союзов, слов, обозначающих мыслительную деятельность, включение (например, «вместе»), сравнение, пространство, и число запятых, - рассказывает Татьяна.

Оказалось, что в текстах суицидентов выше доля местоимений и меньше индекс лексического разнообразия, но больше неполнозначных слов и глаголов.

В планах – исследовать тексты с синтаксической точки зрения. Количество дополнений и определений в предложении тоже может многое рассказать о психологических характеристиках человека.

- В итоге мы хотим получить компьютерную программу. На входе человек пишет текст на заданную тему. Конечно, чем больше будет в нем слов, тем лучше. Минимум - 500. На выходе компьютер выдает в процентах склонность автора к суициду. Конечно, для того, чтобы программа имела высокую точность, экспериментов, проведенных на текстах 40 человек, мало. Это количество предстоит увеличить. Затем мы попробуем апробировать проект с помощью психиатров из медуниверситета. Они работают с людьми, которые совершали попытки самоубийства. После тестирования программы можно будет выкладывать ее в открытый доступ, чтобы любой смог проверить себя или своего ребенка.

ЭТО РАБОТАЕТ?

Во Франции подобная программа работает в качестве эксперимента. Вы можете самостоятельно установить ее. После чего она начнет анализировать ваши записи в соцсетях. Когда программа посчитает, что ваши тексты схожи с текстами людей, совершивших суицид, более чем на 60%, вас перенаправят на сайт помощи или подадут тревожный сигнал вашим родным.

В Бельгии тестовый вариант похожей программы введен на государственном уровне. Она также выдает тревожные сигналы на основании анализа поведения подростков в соцсетях. Были случаи, когда родителям сообщали о кризисном состоянии ребенка, о его предрасположенности к суициду, а также рассказывали о травле детей в Сети.

Программа посылает тревожные сигналы родителям. Фото: Михаил ФРОЛОВ

Программа посылает тревожные сигналы родителям.Фото: Михаил ФРОЛОВ

В ТЕМУ

Если мужчина притворяется женщиной

Помимо создания модели диагностирования склонности к суициду лаборатория корпусной социолингвистики и автороведческих исследований, которая уже пять лет существует при воронежском педуниверситете, занимается определением пола и возраста участника интернет-коммуникации.

- Много незнакомых людей добавляется к нам в соцсетях. И мы можем узнать о них только то, что они сами говорят, - рассказывает Татьяна. – А ведь часто они добавляются к детям. И цели самые разные, например кибербуллинг (травля человека в Интернете) или педофилия.

Также часто бывает, что мужчины в тексте выдают себя за женщин и наоборот. Лаборатория количественным, а не качественным методом пытается и эти случаи диагностировать.

- Люди писали текст от лица противоположенного пола, от своего лица, от своего пола, но в несвойственной ему манере, - рассказывает Татьяна. – Результаты, конечно, предварительные. Но уже сейчас можно сказать, что мужчины имитируют письмо женщин очень примитивно, вставляют много уменьшительно-ласкательных слов типа «пупсик», - девушка улыбается. – Это характерно для гендерных стереотипов. В текстах мужчин всегда преобладает количество предлогов, местоименных наречий, существительных, потому что мужчинам важно передать информацию о мире. Для женщин характерно большое число местоимений, глаголов. Им важно встроить себя в систему отношений. Местоимения как раз и помогают сделать это.

Как отличить правду от лжи

Еще одним из проектов Татьяны является распознавание лжи в тексте.

- Когда человек читает текст, он не пытается сознательно распознать ложь. Обычно ее узнают в 50% случаев. Мы сейчас запустили пилотную программу, которая по одному лишь параметру - соотношению местоимений и наречий – определяет правдивый или ложный текст. Мы попросили 150 человек написать два текста о том, как они провели вчерашний вечер. Один текст – правдивый, второй – нет. Практически у всех в ложном тексте падает количество местоимений, а наречий – вырастает. Только по одному математическому уравнению программа выдает 67% верных ответов. В скором времени лаборатория собирается исследовать транскрипты устной речи.

 
Читайте также