Форум «Армия» – это не только открытая демонстрация сегодняшней военной силы, но и разговор о будущем, который идет на мероприятиях деловой программы, многие из которых носят закрытый характер. Одно из них – конгресс по искусственному интеллекту. Представитель НИКСа побывал на нем и послушал, о каких технологиях ученые рассказывали военным.
Речь шла о самых разных вещах, перечислять которые в силу понятных причин мы здесь не станем, благо, каждый может догадаться о них и сам. Расскажем лишь об одном, довольно невинном докладе, который назывался «Психолингвистический анализ письменной речи». Никакой военной тайны в нем не содержалось, это было вполне академическое исследование на совершенно гражданскую тему, и все же, на всякий случай, обойдемся без фамилии докладчика и названия организации, которую он представлял.
В докладе рассказывалось, как искусственный интеллект, то есть специальным образом обученная искусственная нейронная сеть, применяется для выявления людей, страдающих депрессивными расстройствами. Выявление происходит на основе анализа написанных ими текстов.
«Психологов на всех не напасешься, поэтому хочется это дело автоматизировать», – объяснил замысел исследования докладчик.
Естественно, для того, чтобы анализировать тексты на предмет психических расстройств их авторов, нужно, чтобы эти тексты где-то появились. Благо, есть социальные сети, которые дают огромный охват самых разных слоев населения и колоссальный объем информации, в том числе в виде «авторских» текстов, причем в открытом доступе.
Однако сначала искусственную нейронную сеть надо обучить выявлять депрессивные тексты на массиве конкретных их примеров. Откуда взять такие «примерные» тексты? Оказывается, в тех же социальных сетях есть сообщества людей, страдающих депрессией. На их текстах и можно обучать программу распознавать это состояние. Хотя в этом подходе есть спорный момент, потому что некоторые люди только думают, что у них депрессия, а на самом деле они просто дурью маются, не зная, что такое депрессия на самом деле. Если кто-то думает, что депрессия – это некая романтическая грусть по неудавшейся жизни, то он ошибается. Это серьезное заболевание, и когда человек реально впадает в депрессию, то он не то что посты писать, а порой и говорить не в состоянии. В общем, отсутствие клинического подтверждения диагноза у авторов «депрессивных» текстов – это серьезная проблема для исследователей, но приходится работать с тем, что есть.
Определение депрессии, между прочим, – это самая популярная задача психологического мониторинга, как глобального, так и локального. Например, есть компании, которые считают необходимым проверять своих сотрудников на предмет выгорания. Конечно, не надо путать настоящую депрессию с выгоранием, но речь в любом случае идет о некоем психологическом неблагополучии, которое должно так или иначе сказываться в тексте.
Как определяется психическое состояние автора текста? Во-первых, по соответствующей лексике. Во-вторых, есть психолингвистические маркеры. Например, коэффициент Трейгера – отношение количества глаголов к количеству прилагательных в тексте. У людей в нормальном состоянии он близок к 1, а если он превышает единицу, то это признак депрессии. К примеру, коэффициент Трейгера в постах о ковиде поднялся с 1,35 в 2019 до 1,47 в 2020 году, то есть людей в депрессию ковид таки вогнал. Этот маркер каждый легко может приложить к своим текстам. К примеру, коэффициент Трейгера текста, который вы читаете, близок к 1, то есть написан нормальным человеком. Аналогичными маркерами могут служить и отклонение от нормы в соотношении других частей речи.
С помощью такого анализа можно решать три типа задач: во-первых, выявление психологического неблагополучия – депрессий, посттравматических синдромов, расстройств поведения. Второе – это выявление некоторых долгосрочных психологических особенностей, то есть личностных черт, склонности к определенному типу мотиваций и шаблонам поведения. Эта задача важна, например, для маркетинга. Есть так называемая большая пятерка категорий: нейротизм, экстраверсия, готовность к согласию, открытость к опыту, сознательность. К сожалению (для маркетинга), исследования показали, что в среднем готовностью к согласию отличается только 12 % людей. Самая же большая категория – около 40% – отличаются сознательностью, то есть это люди, которые все понимают, а потому их не нае... ну, в общем, маркетологи меня поймут.
Докладчик рассказал, кстати, что одно из аналогичных западных исследований, проведенное на основе постов в «Фейсбуке» с огромным охватом – 58 000 человек – недавно нашумело тем, что определяло политические убеждения, религиозные взгляды, национальную принадлежность и даже ориентацию. Так что подобный анализ может много чего сообщить о человеке, интересного не только маркетологам.
Наконец, третья задача, самая любопытная, – это выявление психологического состояния в момент написания текста, то есть ситуативное проявление психологических черт, например – эмоций, под воздействием которых был написан конкретный текст. Существует такая наука, как сентимент-анализ. Она позволяет оценить текст не просто как отрицательный и положительный с точки зрения эмоций, но выявлять отдельную эмоцию, под воздействием которой человек писал этот текст, будь то страх или радость, и даже чем эта эмоция вызвана. Можно даже выявить причины возникновения эмоции и субъекта, на которого она направлена. На самом деле, именно это больше всего интересует заказчиков подобных исследований. А это уже семантический анализ, то есть понимание смысла текста.
Разумеется, любой опытный психолог или, скажем, прокурор сможет это определить, поскольку зачастую сам автор, не скрываясь, прямо пишет в своем посте как о своих чувствах, так и о том, на кого они направлены, но в данном случае речь идет о создании алгоритма, который может определять это автоматически, причем по текстам миллиардов людей.
Докладчик скромно отрапортовал, что такой инструмент психоэмоционального анализа текстов из социальных сетей в России создан и уже опробован на 1500 клиентах сети «Вконтакте». Глубоко в душу испытуемым ученые пока не лезли, и в качестве тестовой задачи определяли отношение авторов постов к здоровому образу жизни. Но присутствующие хорошо поняли, что алгоритм может определить не только это.
Так что наш вам совет: если дорожите работой, а возможно – и чем-то большим, то тщательно подсчитывайте число глаголов и прилагательных в своих постах.
Источник: НИКС - Компьютерный Супермаркет
Комментарии к статье из сети в Вконтактеоткрыть страницу обсуждения |
Валерий Саранчук |
Курятника на крыше не хватает |
29-08-2022 18:05 ответить |
Михаил Меринов, г. Москва |
Робот собака ниндзя с базукой, вот все технологии блин) у китайцев украсть, сказать что наше |
29-08-2022 19:49 ответить |
Василий Мазур |
Причём собаку на все форумы возят. Скоро и танки китайцы будут делать. |
29-08-2022 20:41 ответить |
Дмитрий Прокофьев |
Извините, а причём здесь компьютерный супермаркет Никс? Он танками начал торговать? |
29-08-2022 23:49 ответить |
Aleksandr Lapenko |
Валерий, мозгов тебе в голове не хватает! это "Хохломская роспись" ей всё,что угодно можно раскрасить! |
29-08-2022 23:49 ответить |
Павел Чередниченко |
Александр, нет, это Гжель. |
30-08-2022 00:19 ответить |
Петр Королев |
Танк из 60х годов на армии 2022 ещё бы т-34 показали |
30-08-2022 10:32 ответить |