Как предсказание превратить в прогноз — знают в МГТУ им. Н.Э. Баумана
Е. Афонина:
- Приветствуем наших радиослушателей в Москве и в других городах вещания. Я думаю, что те, кто внимательно следит не только за оперативными событиями, но и вообще интересуется тем, что происходит в нашей стране, я хочу напомнить, что завершается у нас особый год – Год науки и технологий. Было огромное количество различных мероприятий, мы с вами знакомились с интересными открытиями. И вот я предлагаю сейчас в завершение этого года, для тех, кто, может быть, желает не просто заглянуть в недалекое будущее, представить себе, как вы будете жить в 22-м году или чуть дальше, ну а вообще поговорить о том, можно ли, анализируя большой объем данных, понять, а что ждет нас в науке, в технике, в политике, ну, или в обычной повседневной жизни.
И вот здесь я хочу с удовольствием представить наших сегодняшних экспертов. Это декан факультета информатики и систем управления МГТУ им. Баумана, доктор технических наук, профессор Андрей Пролетарский. Андрей Викторович, здравствуйте.
А. Пролетарский:
- Здравствуйте.
Е. Афонина:
- И кандидат технических наук, доцент кафедры «Компьютерные системы и сети», руководитель лаборатории интернета вещей МГТУ им. Баумана Алексей Попов. Алексей Юрьевич, здравствуйте.
А. Попов:
- Здравствуйте.
Е. Афонина:
- И давайте для начала просто объясним, что это не только разработки, это целый центр, который специально создан, для того чтобы мы с вами могли не просто заглянуть в будущее из какого-то любопытства, но и найти в этом необходимую для себя информацию. Вот что это за центр, можете рассказать?
А. Пролетарский:
- Это центр МГТУ им. Баумана, центр предиктивной аналитики в рамках наших стратегических проектов и большого проекта академического «Лидерство. Приоритет-2030». Прогнозы и рекомендации на основе анализа больших данных.
Е. Афонина:
- Насколько я понимаю, если мы сейчас говорим о центре, то это значит, что есть уже понятие, в каких сферах предиктивная аналитика может давать результаты, которые в том числе будут интересны не только людям, обладающим особым научным складом ума, интересующиеся этой информацией в своих научных целях, но и, так скажем, обычному потребителю, если можно так сказать?
А. Пролетарский:
- Да, предиктивная аналитика уже активно используется и приносит положительные результаты, в общем-то, в различных областях человеческой деятельности. Драйверами рынка больших данных и бизнес-аналитики выступают на сегодняшний день несколько отраслей, на которые, кстати, по экспертным оценкам, приходится около половины всех инвестиций. А это ни много ни мало, не менее 100 миллиардов долларов. Это банковская сфера, дискретное и непрерывное производство, специализированные услуги, федеральное правительство, микробиология, медицина, безопасность городской среды, борьба с налоговыми и финансовыми мошенничествами.
Можно предположить, что наибольший рост рынка в ближайшем будущем обеспечат такие направления, как розничная торговля, а также операции с ценными бумагами и инвестиционные услуги.
Е. Афонина:
- Ну, а есть те сферы… Вот вы перечисляете действительно те области нашей жизни, в которых есть и четкие цифры, есть и четкое понимание, есть, наверное, огромная база данных и аналитика, без которой, видимо, невозможно создавать прогнозы. Но ведь есть, например, культура, есть кино, театр, есть музыка, в конце концов, в общем, творческие сферы. Там такая предиктивная аналитика сработает или нет?
А. Пролетарский:
- Если говорить о творческих направлениях, то надо прежде всего определить, что мы понимаем под творчеством. Многие простейшие творческие задачи уже успешно решаются с использованием современных технологий искусственного интеллекта. Например, вы можете создать фотографию, обработать ее и получить картину в стиле Винсента Ван Гога, возможно, и другие, более даже сложные варианты, сочетание различных стилей живописи. Поэтому, кстати, среди искусствоведов ведутся бесконечные споры о том, можно ли считать созданные компьютером изображения творческими. Пока основным является мнение, что принципиально новых произведений компьютер не может создать, а речь идет о повторении уже известных решений.
В связи с развитием интеллектуальных технологий появляются новые области использования в области компьютерного творчества. Например, на основе текста можно сгенерировать изображение. Вообще, 2021 год в машинном обучении ознаменовался мультимодальностью, активным развитием нейросетей, работающих одновременно с изображениями, текстами, речью, музыкой. Удастся ли с их помощью достичь прорыва в компьютерном творчестве и создать что-то подобное, например, произведениям литовского художника Микалоюса Чюрлёниса, покажет время.
В связи с вашим вопросом хотел бы сказать о другом. Предиктивная аналитика основана на использовании наборов данных, которые доступны для обучения компьютерных моделей. Вот здесь мы говорим именно о компьютерных моделях, а не о компьютерных сетях и компьютерных нейросетях. Если этих данных недостаточно, то мы не сможем обучить модель и выполнить прогнозирование. Поэтому возможности предиктивной аналитики ограничены, для редких или уникальных событий. В таких случаях мы используем метод прогнозирования на основе исторической аналогии, когда компьютер находит аналог текущей ситуации в прошлом и по аналогии предлагает сценарий возможного развития в будущем. Но и в этом случае успех будет заключаться в том, удалось ли найти такой аналог, и насколько он будет близок к текущей ситуации.
В связи с этим можно сказать, что для уникальных, беспрецедентных ситуаций прогнозирование, основанное на машинном обучении, в принципе невозможно.
Е. Афонина:
- А просчитать, например (это мечта всех режиссеров, музыкантов, продюсеров и т.д.), коммерческий успех, коммерческий потенциал, неважно, фильмов, книг, сейчас – YouTube-каналов или, допустим, соцсетей в принципе возможно?
А. Пролетарский:
- Да. С помощью таких технологий активно оцениваются указанные вами ресурсы. В частности, даются рекомендации о наиболее эффективном размещении контекстной рекламы. Более того, развитие самих произведений ресурсов уже учитывает результаты предиктивной аналитики. Ну, например, в киноиндустрии на их основе составляются портреты посетителей кинотеатров, определяются их основные социально-демографические характеристики, оцениваются зрительские предпочтения такого общего характера, жанр фильма, сюжет, актерский состав, выполняется анализ аудитории фильмов-аналогов, определяется стратегия дистрибьюции фильма. Вот, например, сериал «Карточный домик», выпущенный Netflix, является примером успешного кинопроекта, который впервые доказал киноиндустрии, насколько сильны могут быть данные не только о том, что касается охвата нужной аудитории (ну, определенными разновидностями контента), но и в управлении самим контентом на основе сбора и анализа данных об интересах зрителей.
Для достижения успеха здесь, пожалуй, требуется очень сложная система, способная понять предпочтения зрителей лучше, чем они сами.
Е. Афонина:
- Но мы же понимаем, что зачастую мир так быстро изменяется, и вносятся такие повороты сюжета, что каким-то образом предсказать их достаточно сложно. Но, опять же, это всё нужно сначала увидеть, как это работает, понять, как это работает. Но есть такие области, которые, если мы отойдем немножко от искусства, в которых очень нужны именно вот такие четкие рекомендации, это четкое прогнозирование. Это в первую очередь… Ну, например, выбор школы для ребенка. Вот какую школу выбрать? Казалось бы, есть мнения, есть рейтинги, есть еще что-то, а поди-ка, выбор сделай. Или, допустим, хочет человек купить какую-то квартиру и думает: эту взять или вот эту взять, на что обратить внимание? Вот такие инструменты правильного прогнозирования, они будут доступны желающим даже в таких обычных, казалось бы, житейских вопросах?
А. Пролетарский:
- Такие средства уже имеются. Вопрос их широкого распространения – собственно говоря, это вопрос времени. Общей тенденцией является создание мобильных приложений, при помощи которых любой владелец современного мобильного телефона сможет получить доступ к интересующей его информации, в том числе и к результатам аналитических исследований.
Е. Афонина:
- Вы знаете, мы, к сожалению, живем с вами в такое время, когда тут же мы говорим о плюсах, о том, что предиктивная аналитика, наука о прогнозировании, а вот у некоторых наших слушателей наверняка в голове возникает такая, знаете ли, мрачная картинка. Некий злоумышленник, который использует эти инструменты предиктивной аналитики и говорит: вот туда инвестируй, а туда не инвестируй. В итоге люди теряют деньги. Ну, или используются какие-то другие мошеннические схемы, которые опираются, может быть, на доверие людей к вот таким прогнозам.
А. Пролетарский:
- Так это все возможно и без предиктивной аналитики. Способы весьма изощренного мошенничества существовали задолго до появления компьютеров. Если говорить о новых технологиях, то они могут сформировать у непрофессиональных инвесторов иллюзии простоты и обоснованности принятия решений. Это может приводить к ошибкам таких инвесторов, а также привести к появлению новых способов манипулирования их мнением. Очевидно, что необходимо будет учиться применять такие новые технологии. Предиктивная аналитика здесь не будет исключением. В МГТУ уже ведется такое обучение. Например, мы создали новую магистерскую программу, и в рамках ее реализации читается такая дисциплина, как искусство аналитической работы с большими данными. В рамках этой дисциплины студенты обучаются правильному использованию соответствующих методов анализа, их применение в аналитической деятельности. В частности, рассматриваются вопросы проявления когнитивных искажений в аналитике, способы манипулирования чужим мнением и то, как, соответственно, этого избежать или, наоборот, применить в своих интересах.
Е. Афонина:
- Поскольку человек действительно существо любопытное, и мы все с вами знаем, что ничего интереснее, чем заглянуть в какой-нибудь прогноз для нас быть не может, тем более, если эти прогнозы не просто берутся откуда-то из воздуха, а это большой объем знаний и данных, которые в итоге и сливаются в единую науку о прогнозировании, в так называемую предиктивную аналитику, то, безусловно, эта тема интересна абсолютно всем. И кстати, как мы выяснили, может быть использована в любой области нашей жизни. Поэтому наши сегодняшние эксперты, а это декан факультета «Информатика и системы управления» МГТУ им. Баумана, доктор технических наук, профессор Андрей Пролетарский и кандидат технических наук, доцент кафедры «Компьютерные системы и сети», руководитель лаборатории интернета вещей МГТУ им. Баумана Алексей Попов, рассказывают нам о том, как это работает, где это можно применять.
Ну, и давайте в продолжение нашего разговора. Мы закончили нашу предыдущую часть определенными опасениями, что такой большой объем данных может быть использован людьми, мягко говоря, нечистыми на руку. Вы эти опасения развеяли. Но ведь развитие технологий в мире может породить и новую гонку, эту самую гонку прогнозов. Вот если есть гонка вооружений, пусть она в какой-то степени виртуальная, но, тем не менее, она есть. Появится гонка прогнозов, и чем это может грозить?
А. Пролетарский:
- А вы знаете, наверное, это неизбежно. Компания, обладающая лучшими технологиями аналитики, будет, конечно, более эффективной по сравнению со своими конкурентами. Это следует из результатов анализа динамики развития сложных систем и может быть описано дифференциальными уравнениями. Но можно это все понять и на уровне просто простой интуиции. Например, в случае возникновения чрезвычайной ситуации эффективность ее ликвидации будет гораздо выше, если она будет заранее предсказана, и у нас будут необходимые силы и средства в нужном месте для ее предотвращения.
Е. Афонина:
- А за рубежом проводятся какие-то работы именно в этой сфере - DeepAnalytics, и наши достижения как-то можно охарактеризовать по сравнению с зарубежными?
А. Пролетарский:
- Интерес к средствам анализа данных в России и за рубежом только растет, что приводит, соответственно, к росту соответствующих сегментов IT-рынка. Капитализация этого рынка в США оценивается экспертами значительно выше, чем в России. При этом также отмечается и более высокие темпы роста российского рынка. Но здесь я бы вообще-то не стал говорить о технологическом отставании России в этой области от западных стран. Все основные программно-технические решения в России присутствуют. Единственным ограничением, пожалуй, является преимущественное использование зарубежных аппаратных решений в области DeepAnalytics. Поэтому наши усилия, усилия наших специалистов направлены на преодоление этого отставания.
Мы смогли разработать принципиально новые решения, не имеющие пока прямых аналогов в мире. Вот примером такой разработки является процессор Leonhard.
А. Попов:
- Да, мы в МГТУ создали уникальный микропроцессор, ничего подобного нет в мире. Кратко если рассказать, что это за устройство. Дело в том, что современная вычислительная техника очень хорошо справляется с арифметикой, с числами, с вычислениями на основе чисел, но очень плохо работает с теми самыми графами. То есть задача наша была увеличить эффективность вычислительной техники для обработки сложных моделей, как я сказал, важных для таких областей, как микробиология, исследования новых лекарств, создание вакцин. Процессор этот, несмотря на то, что он в сотни раз меньше аналогов зарубежных, он работает в несколько раз быстрее, чем они. Это наш такой очень интересный, уникальный результат.
И это еще не всё. Мы создали, во-первых, многоядерный чип. Кроме того, мы сейчас, прямо в это время, создаём суперЭВМ, которая будет называться «Тераграф», и обрабатывать она будет триллион вершин графа, что очень важно как раз для крупномасштабных исследований аналитики и создания моделей биологических систем.
Е. Афонина:
- Да, впечатляет. Тогда возникает вопрос. Какие глобальные проблемы, с которыми мы сейчас все сталкиваемся (например, та же самая пандемия коронавируса), можно было бы просчитать? Но ладно было бы, просчитать, а можно было бы предотвратить, если бы был такой аналитический инструмент, и был бы он создан на несколько лет раньше?
А. Пролетарский:
- Наверное, саму пандемию коронавируса предсказать было невозможно. Это очень редкое явление, такие явления, как я выше говорил, с помощью таких технологий мы предсказывать не можем. Другое дело, когда появляется статистика по распространению пандемии, и мы уже тогда можем делать прогнозы и вырабатывать рекомендации по борьбе с ней. При этом будут эффективны методы самообучения компьютерных моделей, когда компьютер постоянно учит по ходу поступления новых данных и, соответственно, повышает точность прогнозных моделей. Модель развития пандемий хорошо описывается графовыми и сетевыми моделями высокой размерности. С использованием наших новых аппаратных решений, о которых мы уже говорили, мы сможем в ближайшее время решать подобные задачи. В результате может быть выполнен доскональный анализ развития пандемии, путей и центров распространения инфекций, эффективности предпринимаемых санитарных мер.
С использованием предиктивной аналитики будет возможно получать обоснованные рекомендации по тем мерам, которые надо применить для борьбы с пандемией, основанными на анализе больших данных, исключающие субъективные экспертные оценки, которые часто противоречат друг другу. Считаю, что доступ к таким результатам анализа общественности, который легко технически реализовать, будет способствовать повышению доверия населения к принимаемым мерам по борьбе с пандемией.
Е. Афонина:
- Даже сейчас, Андрей Викторович, вы говорите, а я понимаю, что кто-то, когда вы начали говорить об определенных задачах, которые будут не просто ставиться перед машинами, но и будут чуть ли не выполняться ими, что называется, в таком порядке, даже, может быть, предвосхищающем желания человека, возникает вопрос. А мы не станем рабами машин, они не начнут нами управлять?
А. Пролетарский:
- Вы знаете, наверное, такая опасность есть. Но, честно говоря, как, впрочем, от любого неумелого применения любой новой технологии. Опять хочется вернуться к тезису о необходимости изучения методов предиктивной аналитики и способов их применения для решения как профессиональных, так и повседневных бытовых задач. Такая возможность есть уже сейчас. Использование умных машин, всех их богатых возможностей повышает ответственность их пользователей и требует от пользователей новых знаний.
Е. Афонина:
- Андрей Викторович, лично вы в какой бы сфере сразу начали применять эту аналитику для широкого использования? Не для узких профессионалов, а для широкого использования, когда будет готов этот инструмент.
А. Пролетарский:
- Могу рассказать, пожалуй, здесь о некоторых наших разработках. Ну, например, по заказу Министерства обороны была разработана система анализа обстановки, способная самостоятельно, в автоматическом режиме сделать выбор и сформировать рекомендации. Перед нами была поставлена задача комплексной автоматизации. Требовалось организовать работу системы в автоматическом режиме. Эксперт, конечно, вмешивался и корректировал процесс, но важно, чтобы компьютер дал предложения, предположения, выявил угрозы, ранжировал их, показал их места на карте, предложил варианты действий. Для решения э тих задач мы использовали методы из области искусственного интеллекта и компьютерной лингвистики. Такой подход с точки зрения математики и с точки зрения модели отличается от традиционного, который обычно используется. В результате система позволяет гораздо быстрее оценить обстановку и сформировать рекомендации как военного, так и не военного характера. Наша система анализировала вообще все возможные источники информации и сама выявляла проблемные ситуации.
Далее она использует метод работы, основанный на исторических аналогиях. Если нечто подобное уже было, система видела сходство, то она подскажет то решение, тот сценарий, который тогда привел к успеху. И в принципе такой подход и такая система, она является универсальной. Это означает, что ее могут использовать не только военные, но и гражданские организации.
Е. Афонина:
- С таким советчиком, о котором мы сейчас говорили, жить вообще будет проще, спокойнее, сложнее, выгоднее? Можно в нескольких словах описать свои личные ожидания от того мира, где предиктивная аналитика станет повседневностью?
А. Пролетарский:
- Предиктивная аналитика, безусловно, в чем-то упрощает принятие решений. В некоторых случаях, например, в случаях отражения угроз различного характера, ликвидации чрезвычайных ситуаций, предотвращения быстро развивающихся кризисных процессов, позволит существенно сократить время для принятия обоснованных решений, следовательно, спасти человеческие жизни, минимизировать экономические потери.
Е. Афонина:
- Ну что ж, спасибо огромное за этот интересный разговор. Декан факультета «Информатика и системы управления» МГТУ им. Баумана, доктор технических наук, профессор Андрей Пролетарский и кандидат технических наук, доцент кафедры «Компьютерные системы и сети», руководитель лаборатории интернета вещей МГТУ им. Баумана Алексей Попов сегодня рассказывали нам. Действительно, для некоторых в завершение Года науки и технологий в России предиктивная аналитика стала таким открытием, может быть, сегодняшнего дня, наука и прогнозирование. Но на самом деле в центре ею занимаются достаточно давно, и это действительно уникальная методика. Центр создан на базе факультета «Информатика и системы управления». И вот с помощью действительно огромного объема знаний можно будет не только анализировать эти данные, но и принимать, что очень важно, выгодные решения и для каждого человека, и для всей страны.
Вот, собственно, как превратить предсказания в прогноз, точно знают в МГТУ им. Баумана. Мы в этом убедились.
Спасибо огромное, наши уважаемые гости и эксперты.
А. Пролетарский:
- Спасибо.