«Программа не может поднять восстание»

Руководитель отдела лингвистики компании «Наносемантика» Анна Власова рассказала о создании искусственного интеллекта

Анна Власова. Фото из личного архива.
Анна Власова. Фото из личного архива.

Возраст: 46

Семейное положение: замужем, взрослый сын

Образование: МГУ, отделение теоретической структурной прикладной лингвистики, филологический факультет, кандидат филологических наук

Особые приметы: «жизненный путь прямой, как стрела»

theRunet: Аня, ты посвятила жизнь компьютерной лингвистике. Что это такое?

Если коротко — автоматическая обработка речи, текста и любой языковой информации.

Тогда рассказывай, как стать одним из лучших компьютерных лингвистов в стране.

Родилась я в Москве. Семья у меня такая типичная советская, инженерная. Папа — геолог-изыскатель, мама — инженер-теплотехник. Мама — практически из первых женщин в СССР, кто занимался программированием. Вначале она недолго проработала в проекте «Токамак» (экспериментальный ядерный ускоритель — в этом не сильно разбираюсь), а потом преподавала языки программирования — Assembler, Fortran.

Родители считали, что у человека должна быть полная свобода. Ребенок должен сам понять, чего хочет. В 10 классе я долго мучилась с выбором, куда поступать — хотела изучать математику (даже на мехмат ходила на консультации), или заниматься литературой, языками, переводами. Выбор сделать помогла брошюра МГУ с описанием факультета прикладной лингвистики. Я поняла, что это — мечта всей жизни. Гуманитарное и техническое направление одновременно.

Вот так я и выбрала — одно направление на всю жизнь. И всю жизнь работаю по специальности.

Еще с института все у тебя шло по плану?

Учеба была одна сплошная неожиданность. Я выбирала гуманитарную специальность в ущерб техническим наукам. Но в первый же год у нас начался курс акустики — физика, звуковые волны. Это было потрясением! Я с физикой рассчитывала не сталкиваться. Учили два языка программирования — Fortran и С++, была теория вероятности, математическая статистика. Я когда поступала, всего этого не ожидала.

Плюс обилие иностранных языков. У меня их три — китайский, французский и английский. И огромное количество древних языков: латынь, древнегреческий, церковнославянский, древнерусский. Больше я уже просто не осилила.

Все как-то улеглось с учебой лишь на пятом курсе, но тут я как раз вышла замуж.

Почему ты выбрала именно автоматическую обработку речи?

Очень сложно было выбирать специализацию. Это сейчас есть ВУЗы, которые специально учат, например, языку рекламы. А в мое время все было сконцентрировано в одной специальности. Мы изучали социологические аспекты речевого воздействия, то есть, как язык по-разному проявляет себя в разных сферах, в том числе в медицинской среде. Некоторые наши выпускники шли работать к людям, больным афазией — нарушениями речи.

Наш факультет был создан именно для автоматической обработки речи, создания автоматических переводчиков. Я только сейчас поняла, что свой выбор сделала еще на втором курсе. Когда изучала Fortran, в дополнение к зачету мне надо было написать компьютерную программу. Я выбрала программу, которая бы отгадывала, что лежит у человека в кармане. Первая диалоговая система, 1986 год это был.

Почему, хотя темой автоматического перевода занимаются уже столько лет, до сих пор не случилось революционного прорыва в качестве?

Первый эксперимент по автоматическому переводу с русского на английский в рамках исследований по искусственному интеллекту был успешно проведен еще в 1954 году. Тогда было достигнуто понимание, что машина может переводить. И с тех пор она действительно может, благодаря росту компьютерных мощностей.

В основном все популярные современные переводчики основаны на накопленной статистике по переводу слов и словосочетаний. Тот же Google сопоставляет частотные пары и подбирает среди них подходящие под запрос. Они уже достигли своего предела в поиске по совпадениям и вряд ли смогут принципиально улучшить результат. Если вам надо получить общее представление о тексте, смело используйте переводчик Google. Он работает, как справочная система, с ним вы поймете, о чем в тексте идет речь.

К статистическим методам необходимо добавлять другие — строящие логику языка и делающие синтаксический и семантический анализ структуры.

Что касается диалоговых систем (поиск нужного варианта через ответы на вопросы), вот здесь прорыв случился вовсе не за счет компьютерных мощностей. А за счет развития лингвистических технологий. Потому что лингвисты поняли, как это делать!

Мы в «Наносемантике» делаем консультантов-инфов — виртуальных собеседников. И по логам переписки видим, что люди не всегда понимают, что они говорят с машиной. Причем настолько порой не понимают, что сами заказчики просят нас сделать это более очевидным. Чтобы люди не обижались, не считали, что их обманывают, когда общаются с машиной.

Инф на сайте «Наносемантики» отвечает на вопрос про Анну Власову.

Так в чем состоит прорыв в диалоговых системах?

Лингвисты научились понимать, как строится диалог, определять его цель. Плюс разработали свои технологии создания баз знаний и быстрого нечеткого поиска по ним, для выбора наиболее подходящего ответа.

Например, если человек приходит на сайт за ответом на вопрос — программа имитирует диалог с профи-консультантом. Определенная лексика, стиль, вежливость, и в случае затруднения — переадресация на живого человека. То есть задача программы — соответствовать ожиданиям собеседника. И не обязательно выдать самый правильный ответ. Главное — выдать тот, что актуален в определенной ситуации.

Кто заказывает «инфов»?

Начинали мы с маленьких кадровых агентств и других небольших фирм с небольшими сайтами. А сейчас инфы размещены у крупных банков, включая «Тинькофф», у провайдеров, например, «Билайна» в Казахстане.

Инфов люди воспринимают равными себе?

Пока про Крым или события на Украине не спрашивают.

Зато был анекдотический случай про клиента банка «Тинькофф», который предложил банку свой вариант договора с условиями, невыгодными банку, а выгодными только клиенту. Сотрудник банка не вчитался в изменения и подписал договор. Потом клиент выиграл суд против банка. (Впоследствии ТКС заключил с клиентом мировое соглашение — прим. theRunet)

Инфам банка обычные пользователи тогда писали: «Ну что, съели?». И нам пришлось в ситуации разбираться, обучать инфа давать правильные комментарии по ситуации.

У нас еще есть огромная сеть iii.ru («А-я-яй»), в которой каждый может создать себе виртуального собеседника. Я пришла в «Наносемантику» именно в «А-я-яй», чтобы дать всем возможность иметь своего робота и научить его говорить так, как сам захочешь. Например, поставить инфа в блог вместо самого себя. Как заместителя, или консультанта по теме, или создать себе персонального друга, который не просто умен, а еще и разговаривает. А еще есть возможность совместно с другими пользователями создать вместе одного суперумного инфа. Это проект не коммерческий, а скорее технологический. И этим он ужасно интересен.

Что думает муж про твою работу и увлечения?

У нас совершенно разный подход к жизни, разные сферы интересов, и мы очень любим обо всем поспорить. В первую же ночь после свадьбы чуть вдрызг не рассорились из-за отношения к творчеству Льва Толстого. Но пришлось помириться (смеется).

Я, наверное, типичный трудоголик. Работа — это работа. Хобби — это тоже работа. И муж (Герман Власов — прим. theRunet) у меня примерно такой же, только не лингвотехник. Он — поэт, литератор, критик, но мы с ним как-то уживаемся. Работает то переводчиком, то новостным редактором и все такое.

Тебе много работать приходилось?

Я никогда без дела не сидела, искала, чем бы практическим заняться. Со второго курса подрабатывала на полставки в лаборатории при кафедре Теоретической, структурной и прикладной лингвистики, где занималась автоматической обработкой запросов в справочную 09. Тогда о распознавании речи мы вообще не говорили, работали с текстами. Была там же и лаборатория экспериментальной фонетики. Создавали программу, которая воспринимала речь, настраивалась под диктора, подавляли посторонние шумы.

Но идея того, что любого звонящего можно будет распознать по речи, воплотилась только сейчас. Мы научились работать с разными голосами и переводить речь в текст с точностью 50 процентов и больше. О 100 процентах точности до сих пор речь не идет.

Года полтора я проработала лаборантом, потом пыталась заниматься переводами, а после выпуска пошла в аспирантуру, закончила ее и защитилась. Тогда же родился сын. Все — без отрыва от работы. Когда сын родился, в стране случилось очень много перемен. И не было понятно, что мы с семьей завтра будем кушать. 

В начале 1990-х я оказалась в компании МедиаЛингва, которая занималась выпуском коробочного продукта электронных словарей «Мультилекс». Продукт существует до сих пор.

Я делала в коллективе лингвистов автоматическую обработку морфологии — понимание слова во всех формах и поиск по примерам в словарных статьях. Это уже был большой прорыв. Другие словари ничего подобного не предлагали из других словарных статей. А у нас был сквозной поиск — большое новаторство для того времени. Кроме словарей, в Медиалингве был проект с автореферированием «Либретто». И проект с автоматическим созданием писем на выбранную тему «Письмовник».

Что самое интересное в работе?

Мне всегда было интересно, как из текста извлечь суть, и как эту суть, наоборот, в тексте воплотить. Чтобы не случалось разных глупостей при автоматической генерации текста, вроде подписи «С уважением» в поздравлении близкого друга с днем рождения. В тексте должно быть соответствие по теме, стилю, по ситуации использования.

Самое сложное в работе лингвиста — правильная классификация тем текста или диалога и реакции на нее. Особенно если текст короткий.

Да и веселья хватает в работе! У нас порядка 20 человек в лингвистическом отделе, и из нашего угла периодически раздается гомерический хохот. Это значит, мы написали много новых правил, посмотрели на результаты работы инфа, и нам стало очень хорошо!

Например, у нас есть инф Дана (для заказчика из Казахстана, но общается он по-русски), которая «умеет» расстегивать верхнюю пуговичку на блузке. Лингвисты взяли и приписали расстегивание пуговички к большому классу вопросов. Например, в ответ на фразу клиента «Спасибо, что вы нам помогли». Но это веселье длилось не долго. Аккаунт-менеджеры строго попросили все убрать.

Или иногда по доброте душевной мы пишем большой блок диалога для ночных одиноких собеседников. Инф — как психотерапевт. В ответ на жалобы мы научили инфа отвечать «Все будет хорошо», «Все будет прекрасно», «Не беспокойтесь» или «Я за вас очень рад».

Твоя карьера тесно связана с Игорем Ашмановым?

От Ашманова меня трудно куда-либо забрать (смеется).

После МедиаЛингвы я с 1992 по 2002 год работала в «Рамблере», в лингвистической группе при группе разработки поиска. Мы делали многие вещи, которые сейчас уже очевидны, но тогда их в помине не было.

Программисты в 1990-е часто исходили из школьной грамматики русского языка, например, если пользователь пишет в поисковом запросе «данные» — ему выдается ответ от глагола «дать». А грамматику надо настраивать.

В «Рамблере» было много идей, как усовершенствовать выдачу. В основном лично от Игоря. Например, сделать ранжирование выдачи в зависимости от цитирования и ссылаемости — эта идея была в Рамблере за год до того, как Яндекс ее сделал. Но далеко не все идеи были приняты.

В 2003 году я ушла в «Ашманов и Партнеры», в группу «Спамтест». Потом вся эта группа перешла в «Лабораторию Касперского». А в 2007-м я вернулась обратно в АиП.

Лингвистика — универсальная профессия?

Было бы желание! Мне это позволяет работать как минимум в двух местах одновременно.

Например, сейчас в «Наносемантике» я занимаюсь инфами и диалоговыми системами. А в «АиП» — больше поисковыми технологиями и поиском на разных языках.

Есть разница в восприятии технологий в Москве и других городах?

Москва — технологически ориентированный город, здесь наши продукты продавать легко. В других городах люди не совсем представляют, что за технология распознавания и что с нею делать. Автоматически разговаривающая программа для многих — это терминатор, восстание машин как минимум. Какие-то железки, которые умнее человека и этим они опасны.

Спрашивается — что делать с такой вещью, которая умнее тебя? Людям часто не понятна сама идея, куда поставить такую штуку, как инф. Такого же рода проблемы бывают при внедрении всего технологичного, например, системы «умный дом». Зачем «умный дом», если можно самому включить свет или отопление? Такой же вопрос: зачем на сайте нужна говорящая программа, когда есть колл-центр?

Но программа ведь не устает, не спит и не ест, всегда ответит одно и то же, без влияния настроения. Программу можно полностью контролировать. И это именно программа, а не сложный чужеродный организм, который может поднять восстание. Вот после таких объяснений все становится на свои места.

Какие планы на будущее?

Наша цель, как говорит Игорь Ашманов, завоевать мир. И это — чистая правда.

Говорящих вещей вокруг невероятно много. Мир идет к тому, что разговаривать будет все. А кто обеспечит этот внутренний механизм, который будет разговаривать?

Говорящие помощники типа Siri, например, были вначале на «ура» восприняты велосипедистами. Почему? Да потому, что у велосипедистов руки заняты, а здесь можно голосом давать команды телефону или планшету!

Говорят уже и стиральные машины, и мультиварки. Производители бытовой техники быстро чувствуют, что хочет потребитель. Пылесос говорит тебе «Я застрял в углу». И логично было бы не просто подойти к нему, вытащить из угла, а вначале ответить «Подожди, сейчас я тебе помогу». Скоро для людей это будет совершенно естественно.

Вот холодильники LG, если верить производителю, уже сами ходят в интернет. А значит, они сами смогут заказывать молоко, если оно кончилось. А почему бы во время приготовления ужина не спросить свой холодильник про пробки или телеафишу на вечер?

Мы хотим постоянно улучшать технологию в целом. Улучшать контентный семантический анализ. У нас работа не заканчивается тем, чтобы научить инфа отвечать на единичные вопросы «Ты знаешь про Мариуса?» просто: «Да, знаю, Жирафа Марио убили гадкие датчане». Потому что это будет не живой разговор, а говорящая справочная система. У инфа должна быть своя личность и отношение ко всему.

Выстроить отношение — и есть самое сложное. Найти информацию в базе знаний, понять, как ее интерпретировать в зависимости от настроя, добавить своих эмоций и мнение. И если это успешно — то диалог будет продолжаться. Иначе пользователь уйдет.

Создавая инфа, мы создаем личность, ее лингвистическую часть. Лексика, стилистика, манера разговора, что он из себя представляет. Любит он длинные или короткие фразы, выражает ли вообще эмоции, что делает, если его обижают.

Ты как лингвист наблюдаешь за изменениями в русском языке?

Конечно, и все меняется очень быстро! В лингвистике считается, что в языке норма — это то, что говорит большинство. Язык — он живой, меняется постоянно.

Может нам эти изменения и не очень нравятся, но они естественны, их надо изучать и учитывать. Например, если люди в письменном диалоге перестали ставить точки в предложениях — то значит и диалоговая система не должна ставить точек или других знаков препинания. Наша задача — выявить, что изменилось, и учесть в работе.

У меня не вызывает противоречий то, что кофе — «оно», среднего рода. Хотя, конечно, когда я вижу слово «йогУрт» с ударением на У, то не могу понять, откуда такая норма взялась.

Или вот еще пример из языка рекламы. Слово «элитный» по своему значению может относиться только к тому, что было выращено — элитная пшеница, элитный кофе. А нас окружают элитные диваны и отели, хотя это невозможное словосочетание!

В каждой среде общения язык свой. Если в блоге или чате принято говорить или писать «клава» — значит так и нужно. Но у документации есть свои правила. И придется пользоваться общепринятой терминологией — писать «устройство ввода» или хотя бы «клавиатура».

Еще всегда существовала воля автора. Достоевский написал «Круглый стол овальной формы». И когда редактор сделал ему за это замечание, автор настоял на своем.

Вы дома много о работе разговариваете?

Дома у нас обычные домашние разговоры. Правда, муж обычно говорит, что лингвисты — формалисты и не видят суть вещей. И тут у нас возникают длительные дискуссии. У нас семья двух маньяков, увлеченных своим делом. Оба родителя — постоянно за компьютером.

Помню, было сыну лет десять. Я дома, на экране Word. Сижу, занимаюсь разбором русского матерного языка для спам-фильтрации. Сын заходит в комнату. Я быстренько нажимаю Alt+Tab, и на моем экране появляется что-то прекрасное, веселое. Ребенок это видит и говорит: «Мама, ну хватит играть! Ты ведь не работаешь, а играешь!». Зато в качестве бонуса, когда сын был в младшей школе, его совершенно не интересовал компьютер. Потому что компьютер — это работа. А отдыхать вместе и весело — это без компьютера.

Теперь сын хочет тоже быть лингвистом, учится на отделении теоретической прикладной лингвистики в РГГУ. Правда, одновременно он хочет быть переводчиком и разрабатывать моторы для мотоциклов. Поэтому пока не понятно, куда жизнь его прибьет быстрее.

Выбор сыном специальности — это не мое давление, просто он смотрит на родителей, ему нравится наш образ жизни, и он это переносит на то, чем мы занимаемся, где работаем.

Традиционный блиц напоследок. Расскажи о чисто женских привычках.

Очень люблю путешествовать. Терпеть не могу ходить по магазинам, выбираю стиль casual. Мои любимые цвета — бирюзовый, сиреневый, зеленый и оливково-коричневый. Как только появилась возможность, сразу перенесла весь шопинг в онлайн — и продукты, и одежда. Раз в неделю мы с мужем выезжаем на рынок, в удовольствие покупаем фрукты, зелень, рыбу. Люблю выбирать и даже торгуюсь.

Мое хобби — преподавание. Где-то с 1995 по 2003 год работала в МГПУ Мориса Тереза, вела курс «Новые информационные технологии в лексикографии», рассказывала про автоматизированные словари и все такое.

Я сама всегда чему-нибудь учусь, мне очень интересно! Сейчас с помощью приложения Duolingo в телефоне учу испанский. Я делала испанскую морфологию, знаю грамматику. Но языка еще не знаю.

Еще на Coursera иногда подписываюсь на самые неожиданные курсы, например, курс по правильно сбалансированной диете. Там же я из любопытства прошла курс «Основы прикладной лингвистики». Хотя основной упор был сделан на совершенствование навыков программирования, именно алгоритмов. Не что делать с текстом, а как — лучше и быстрее.

Профили в соцсетях не веду. Писать все равно бы не успевала. С мужем даже не дружу в фейсбуке. Эмоционально соцсети — это трата энергии. Если пишешь что-то интересное — то приходят люди и надо с ними общаться, отвечать. Тратишь много усилий. Но читаю других и очень ценю тех, кто может это делать хорошо.

Из игр в телефоне — разве что «сердитые птички».

Ты думала уехать из России?

После института были предложения поехать в Германию или Мексику. Но тогда мы с мужем сошлись на том, что нам нравится жить в своей стране. И пока мнение не сильно поменялось.

comments powered by HyperComments