Source: State University Higher School of Economics – Государственный университет “Высшая школа экономики” –
Созданная в 2011 году Международная лаборатория алгоритмов и технологий анализа сетевых структур (ЛАТАСС) НИУ ВШЭ в Нижнем Новгороде ведет широкий спектр фундаментальных и прикладных исследований, в том числе совместные проекты с крупными компаниями: Сбером, Яндексом и другими лидерами IT-отрасли. Разработанные учеными Вышки методы не только обогащают науку, но и позволяют улучшить работу транспорта компаний, более успешно вести медицинские и генетические исследования. О работе лаборатории «Вышка.Главное» побеседовала с ее заведующим — профессором Валерием Калягиным.
— Расскажите, как создавалась лаборатория.
— Она была организована в 2011 году по программе мегагрантов правительства России. Тогда работа иностранного ученого являлась обязательным условием участия в конкурсе. Нам повезло, что на наше предложение о сотрудничестве откликнулся профессор Университета Флориды Панагиотис Пардалос. Он и сейчас продолжает активно сотрудничать с ВШЭ и остается научным руководителем лаборатории. В подготовке заявки активно участвовали Олег Козырев, Эдуард Бабкин и Борис Гольденгорин. Борис Гольденгорин сыграл важную роль в становлении лаборатории.
Тогда изучение алгоритмов для анализа сетевых структур и то, что сейчас принято называть компьютерными науками, было новым направлением для Вышки в Нижнем Новгороде.
Через три года работу по гранту высоко оценило Минобрнауки РФ, его продлили на два года. Когда он заканчивался, мы подали заявку на создание международной лаборатории уже в Вышке, нас поддержали, и теперь мы продолжаем свою деятельность как лаборатория НИУ ВШЭ.
В первые годы работы мы привлекли много молодых исследователей, ставших затем известными учеными и специалистами-практиками.
— Что заинтересовало их в новой лаборатории?
— У них появилась уникальная возможность развития, работы с известными учеными в творческой атмосфере. Практически все воспользовались ей и за прошедшие годы выросли как ученые, исследователи и педагоги. Стратегия развития с самого начала была построена на обязательном сочетании научных исследований и преподавания. И сейчас все наши научные сотрудники преподают, этот компонент работы, передача опыта и компетенций, очень важен для ученого.
— Что удалось сделать за это время?
— За прошедшие годы лаборатория стала известным научным центром в России и в мире во многом благодаря усилиям профессора Пардалоса, обращающего много внимания на узнаваемость. У нас много контактов с коллегами из разных университетов и научных центров. Наша лаборатория — соорганизатор большой международной конференции по оптимизации и приложениям, мы участвуем в ее программном комитете, а наш научный руководитель — многократный почетный председатель программного комитета.
Мы активно взаимодействуем с нашими ведущими вузами — МФТИ, МГУ, с Институтом прикладной математики им. М.В. Келдыша РАН, с сибирскими и уральскими научными центрами в Новосибирске, Иркутске и Екатеринбурге.
— Каковы ключевые направления ваших работ?
— Это в основном компьютерные науки: сетевые модели, технологии анализа сетевых структур, различные аспекты оптимизации, в том числе задачи комбинаторной или дискретной оптимизации на графах, приложения к интеллектуальному анализу данных.
— Как это объяснить человеку, несведущему в высшей математике?
— Попробую пояснить доступно. Сеть — это набор узлов и связей между ними. Самые понятные примеры — социальные и телекоммуникационные сети, где узлы — люди или клиенты мобильного оператора, а связи — коммуникации между ними, измеренные определенным образом. Это может быть граф со специальными атрибутами или гиперграф.
Задача оптимизации тоже понятна: у вас есть, например, социальная сеть, и вы хотите понять, в какие узлы поместить информацию, чтобы она быстрее прошла по сети, или, напротив, какие узлы заблокировать, чтобы фейковое сообщение перестало циркулировать в сети.
Еще один класс задач, которые интересуют сотрудников, — большие базы данных, запросы информации в них. Это называется «задача поиска ближайшего соседа» в массиве данных, когда вы даете некоторый запрос в большой набор данных и хотите найти самый похожий на ваш запрос объект в этой базе.
Если база состоит из 10–20 объектов, сложностей нет, а когда их много, нужно правильно и быстро организовать поиск. Для этого поиска создается специальная графовая структура на этих данных, и она на порядок ускоряет поиск с помощью специальных алгоритмов.
— Возможно ли использовать ваши результаты в биологии или медицине?
— Мы исследуем класс сетевых моделей, к которому относятся некоторые биологические сети, например сеть нейронов головного мозга или сеть коэкспрессии (совместной экспрессии) генов.
Нейронов миллиарды, и мы не можем измерить что-либо в этих сетях. Но с помощью электроэнцефалограммы вероятно проследить активность отдельных участков мозга и проанализировать связь между ними. Создаются интересные сетевые структуры, которые можно использовать для изучения активности мозга, в том числе при заболеваниях, — например, анализ сетей нейронов при болезни Паркинсона и эпилепсии, что помогает в их исследованиях.
Сеть коэкспрессии генов (GCN) строится на основе профилей экспрессии генов для нескольких образцов или экспериментальных условий. Исследователи ищут пары генов, которые демонстрируют схожий паттерн экспрессии во всех образцах. В итоге создается сетевая модель, анализ которой используется в практических целях, в частности выделяются наиболее важные узлы этой модели. Выявленный кластер генов означает, что у гена и его соседей похожие профили экспрессии. Это в дальнейшем позволяет упростить тестирование лекарств.
— Насколько активно применимы ваши работы в экономике?
— Еще одна известная сеть — фондовые рынки. Мы анализируем активы, выявляем связи между ними. С их учетом образуется сеть фондового рынка. Анализ сетей фондовых рынков позволяет формировать инвестиционные портфели. Классический пример: модель оптимального портфеля инвестиций Марковица. Вместе с тем использование таких моделей не означает, что вы избежите риска, способного аннулировать весь потенциальный доход.
Крупные трейдерские компании, банки, фирмы, консультирующие инвесторов, хотят иметь понятную модель, как формировать инвестиционные портфели. Они не стремятся к сверхдоходам, а хотят надежно вкладывать средства. И тогда сетевые модели оказываются полезными. Дополнительная информация о связях помогает выделять портфели с нужными характеристиками.
— Наверное, вы и ваши коллеги — богатые люди.
— Мы не торгуем на рынках и не даем рекомендаций. Студенты пишут выпускные работы по этим и иным темам и анализируют, как и какие портфели работают на разных рынках.
Это не заменяет анализ, но полезно для него, открывает дополнительные возможности для деятельности на фондовом рынке.
Например, есть возможность выбора портфеля через построение рыночного графа сети и выделение в нем независимых множеств. Экспериментально доказано, что такие множества дают диверсифицированные и интересные с точки зрения доходности портфели.
— Предполагают ли разработанные вами модели разные сценарии развития?
— В лаборатории активно исследуется неопределенность алгоритмов построения различных графовых структур в сетевых моделях типа сетей коэкспрессии генов, сетей головного мозга, сетей фондовых рынков.
Если неопределенность велика, то выводы могут оказаться ложными: мы надеемся разбогатеть, но наши ожидания не сбываются.
— Как решение фундаментальных научных задач сочетается с прикладными работами?
— У нас работает сильная группа под руководством Дмитрия Малышева. По своему направлению (алгоритмическая теория графов) исследования этой группы ближе к теоретической информатике и дискретной математике. Значительное число аспирантов и молодых сотрудников лаборатории защитили диссертации по этим темам. Несмотря на фундаментальный теоретический характер исследований, они имеют и прикладное значение. Оценки вычислительной сложности задач на графах помогают выделить вычислительно трудные задачи и найти классы задач, которые возможно решить быстро.
В первые годы работы лаборатории у нас появилось направление интеллектуального анализа данных и ИИ. Им руководит Андрей Савченко. Он развивает направление интеллектуального анализа данных в условиях ограниченных ресурсов, например на мобильных устройствах, менее мощных, чем стационарные компьютеры или ноутбуки. Например, мы хотим классифицировать фотографии, тексты, что-то другое на нашем смартфоне, но у нас нет доступа к мощному ресурсу. На смартфоне вы не можете развернуть полноценную нейронную сеть. Он с коллегами разработал подход, позволяющий эффективно решать такие задачи, и запатентовал его как результат интеллектуальной деятельности (РИД). Уже есть приложения, которые можно скачать и пользоваться.
— Нужно ли это сейчас, когда нам обещают квантовые компьютеры с неограниченными возможностями?
— Руководитель исследовательского центра одной крупной зарубежной компании говорил недавно, что мы вернулись в ситуацию 1970-х годов, когда ученые и практики в условиях ограниченных возможностей процессоров и памяти компьютеров обращали особое внимание на эффективность алгоритмов. Потом скорость процессоров и емкость памяти, в том числе оперативной, резко выросли, и это несколько потеряло свою актуальность. Сейчас проблема вернулась, так как мы не ожидаем серьезного улучшения железа. Когда вы обучаете большие языковые модели или ведете поиск в больших базах данных, то возвращаетесь к необходимости быстрых вычислений в условиях ограниченных ресурсов. Сейчас многие крупные производители вычислительных ресурсов и IT-компании ведут исследования эффективного использования существующих возможностей. Если мы сократим вычисления хотя бы на одном узле на 1%, получим весомый эффект. У нас был успешный проект с одной IT-компанией по применению паттернов (шаблонов) графа вычислений для ускорения обучения нейронных сетей. Такие задачи приобретают все большую популярность.
Появление квантового компьютера с неограниченными возможностями — дело все же не самого ближайшего будущего.
— Какие компании пользовались вашими разработками?
— Мы разрабатывали алгоритм организации доставки продуктов к магазинам для крупной торговой сети. Это называется задача маршрутизации транспорта, она тоже сетевая и рассчитывает движение по сети дорог. Задача имеет высокую вычислительную сложность. Если у вас 100 автомашин и 1000 магазинов и вы хотите оптимизировать движение транспорта, то решить такую задачу вручную сложно. Компьютеру решить ее тоже нелегко, но помогают хитрые алгоритмы. Это дает возможность ИИ управлять логистикой использования транспорта.
— Есть ли проблема перехода ученых к индустриальным партнерам?
— Проблема оттока кадров в IT-компании есть. Мы начинаем взаимодействовать с компаниями, компании видят квалификацию наших кадров, предлагают им заниматься наукой и решением интересных задач и привлекают специалиста лучшими условиями.
— С какими подразделениями Вышки сотрудничает лаборатория?
— Наиболее тесное взаимодействие налажено с Международным центром анализа и выбора решений и с Лабораторией прикладного сетевого анализа.
— Какими вы видите перспективы исследований?
— Мы ориентируемся на сочетание фундаментальных и прикладных исследований, чтобы мы имели как хорошие теоретические результаты и публикации, так и совместные проекты с индустрией.
Стратегия кампуса — расширение прикладных исследований, это и общероссийский тренд. Надо научиться содержательно отвечать на вопрос, как с помощью наших теоретических разработок можно получить реальный вклад в развитие экономики и социальной сферы страны. Мы видим свои перспективы в развитии алгоритмов и технологий для систем искусственного интеллекта.
Кроме чисто научной составляющей, важна популяризация науки, чтобы сделать теоретические и прикладные результаты доступными для школьников, наших будущих студентов и сотрудников лаборатории.
Лаборатория как один из ведущих научных центов в области компьютерных наук и приложений открыта к новым партнерским проектам как фундаментального, так и прикладного характера.
— В каких образовательных программах вы участвуете?
— Мы вовлечены в две ключевые программы в кампусе: «Прикладная математика и информатика» (подготовка бакалавров) и «Интеллектуальный анализ данных» (подготовка магистров). Тематика лаборатории активно присутствует в этих программах. Это находит отражение как в преподавании, так и в научной работе студентов.
Все международные лаборатории развивают исследовательскую экспертизу и передают ее молодежи. Если не иметь контакта со студентами, то где мы наберем новых молодых сотрудников?
Добавлю, что наши выпускники востребованы во многих компаниях и странах.
— Почему важно сохранять фундаментальные исследования?
— Мы видим сейчас второе рождение математики, развитие интеллектуального анализа данных и технологий искусственного интеллекта породило задачи, требующие специалистов с развитым абстрактным мышлением и широким кругозором, который дает фундаментальная математика. При этом востребованы многие разделы математики. Это признак XXI века.
Например, мы имеем огромный набор данных и стараемся понять, как он устроен. Часто высокая размерность данных является препятствием для их анализа. Чтобы понизить размерность без потери информации, надо хорошо понимать многие разделы фундаментальной математики — от классических методов линейной алгебры и математического анализа до продвинутых вероятностных моделей и топологии.
Математики встрепенулись, люди видят, что им надо расширять поле своей деятельности на прикладные исследования, это характерная черта Вышки.
— Как удается поддерживать международные связи?
— Мы продолжаем контакты с зарубежными учеными. Начиная с 2012 года мы регулярно проводим ежегодную международную конференцию по сетевому анализу, международные школы для молодых ученых. Практически все, кто приезжал в Нижний Новгород, продолжают общение, откликаются на предложения, несмотря на прошедшую пандемию и текущую ситуацию. Для молодых ученых это дополнительная возможность оценить уровень своих исследований, он становится понятнее при контакте с коллегами из-за рубежа. Мы стремимся, чтобы молодежь активно общалась с гостями. Студентам это тоже интересно.
Обратите внимание; Эта информация является необработанным контентом непосредственно из источника информации. Это точно соответствует тому, что утверждает источник, и не отражает позицию MIL-OSI или ее клиентов.