Войны искусственных интеллектов. Что будет зависеть от человека

Евгения Гусева / kpmedia.ru
Новый выпуск подкаста «Время науки» посвящен суперкомпьютерам и войнам искусственных интеллектов! Обсудим эту остросюжетную тему с академиком РАН, специалистом в области многопроцессорных вычислительных и управляющих систем, заместителем академика-секретаря Отделения энергетики, машиностроения, механики и процессов управления РАН, заслуженным деятелем науки РФ Игорем Каляевым.

М. Баченина:

- Друзья, это «Время науки» на «КП». Меня зовут Мария Баченина. И я приветствую в студии радиостанции «Комсомольская правда» научного руководителя Национального центра физики и математики, академика Российской академии наук Александра Михайловича Сергеева, который вместе со мной ведет эту программу. Сегодня у нас в гостях академик Российской академии наук, специалист в области многопроцессорных вычислительных и управляющих систем, заместитель академика-секретаря отделения энергетики, машиностроения, механики и процессов управления РАН, заслуженный деятель науки Российской Федерации Игорь Каляев.

Игорь Анатольевич, что такое суперкомпьютеры, о которых мы сегодня с вами будем говорить? Суперкомпьютер – в моем понимании это как бы родитель, папа искусственного интеллекта.

И. Каляев:

- Ну, необязательно. Вообще-то, какого-то такого четкого общепринятого определения суперкомпьютеров нет, но подспудно под суперкомпьютером понимается вычислительная система, которая по своим техническим параметрам существенно опережает существующие в настоящее время другие вычислительные системы. Правда, при этом возникает вопрос – а по каким параметрам она должна их превышать? Есть шуточное определение суперкомпьютера, что, например, суперкомпьютер – это вычислительная машина, которая весит больше тонны, или суперкомпьютер – это вычислительная машина, которая стоит больше миллиона долларов. Но это, конечно, шуточно. В реальности все суперкомпьютеры оцениваются по их вычислительной производительности. То есть это количество вычислительных операций в единицу времени, которые они могут осуществлять при решении каких-то прикладных задач.

Ежегодно два раза в год публикуется так называемый список топ-500, в который входит 500 наиболее производительных вычислительных систем мирового сообщества. Собственно говоря, вот эти системы, которые входят в топ-500, их, собственно говоря, и можно считать суперкомпьютерами. Потому что, действительно, по своим параметрам они опережают все остальные вычислительные системы.

М. Баченина:

- Игорь Анатольевич, а сейчас – детский вопрос. А зачем выполнять как можно больше вычислений за максимально короткий период времени?

И. Каляев:

- Ну, есть целый ряд задач, которые требуют очень больших вычислений. Это и научные задачи - космология, криптография, например. Ну, такой, чисто практический пример. Если вам нужно расшифровать какое-то сообщение, если вы будете его 10 лет расшифровывать, то результат этой расшифровки никому будет не нужен. А если использовать суперкомпьютер, вы получите результат через минуту или секунду. Соответственно, это сообщение уже можно использовать для принятия каких-то решений.

Еще один пример. Например, моделирование сложных газотурбинных двигателей в нестационарных режимах. Например, при использовании суперкомпьютера с производительностью 1 петафлопс (это 10 в пятнадцатой степени операций в секунду) моделирование такого сложного объекта, как газотурбинный двигатель, потребует 7 лет. Но если вы работаете в конкурентной среде, и вам нужно быстро получить какое-то техническое решение, соответственно, если вы будете 7 лет ждать, пока он вам что-то посчитает, то ни о какой конкуренции речь вести нельзя. Нужно использовать такой суперкомпьютер, который это сможет посчитать за неделю. Тогда вы конкурентоспособными становитесь.

А. Сергеев:

- Очень важное замечание относительно конкурентоспособности – то, что суперкомпьютеры существенным образом влияют сейчас на экономику. Но если уйти в историю вопроса появления первых высокопроизводительных машин, то, вообще говоря, самые мощные компьютеры (ну, давайте будем сравнивать Советский Союз и Соединенных Штаты) были в атомной отрасли, именно потому, что они занимались обсчетом различных вариантов, связанных с ядерными вооружениями. И до сих пор так, что самые мощные компьютеры, они в атомных отраслях.

М. Баченина:

- На страже страны.

А. Сергеев:

- Да. И если сейчас взять самый мощный компьютер, который есть в США (он лидирующий), сейчас это El Capitan. Это где-то чуть больше, чем 2,5 на 10 в восемнадцатой операций в секунду.

И. Каляев:

- 2,75.

А. Сергеев:

- Да. Десять в восемнадцатой – это уже экза. То есть это 2,75 экзафлопса. До этого самый мощный компьютер был в Ок-Ридже в США. Есть соответствующие компьютеры (по-видимому, с меньшими мощностями) в Китае. Поэтому, когда мы говорим, отцом чего является суперкомпьютер, понятно, что в каждое время…

М. Баченина:

- Вы хотите сказать, у него много детей.

А. Сергеев:

- Я хочу сказать, что когда мы говорим о 50-х годах, то те самые мощные компьютеры, которые тогда были, они были родителями очень важных таких решений, устройств в атомной отрасли. Потом пришли другие времена, другие технологии стали развиваться, и везде суперкомпьютеры были на острие. Поэтому можно сказать, что очень много таких передовых технологий появилось на свет именно благодаря суперкомпьютеру. И дальше оказалось, что в последние 5-10 лет суперкомпьютеры стали отцом искусственного интеллекта.

М. Баченина:

- Игорь Анатольевич, вы сказали, что рейтинг 500 самых мощных вычислительных систем с 1993 года появляется. Я читала, что производительность оценивается по результатам теста, в ходе которого компьютер решает систему линейных уравнений. А кто эти уравнения составляет для них?

И. Каляев:

- Вообще-то этот тест появился еще в 1979 году. Создатель этого теста Linpack - Джек Донгарра, такой знаменитый американский ученый. Он просто использовался для внутреннего пользования, а с 1993 года как раз Джек Донгарра, собственно говоря, и является прародителем этого списка топ-500, и он его начал использовать. Там используется система линейных уравнений. Изначально это были линейные уравнения матичные 100 на 100, потом 1000 на 1000. А сейчас более сложные тесты, но они стандартные, для того чтобы можно было одни и те же тесты использовать для разных компьютеров.

М. Баченина:

- И померить скорость.

И. Каляев:

- И сравнивать. Но тут есть палка о двух концах. Эти современные суперкомпьютеры, их делают зачастую именно под эти тесты. Потому что от этого будет зависеть объем продаж. Потому что ты можешь продекларировать, что…

М. Баченина:

- Это как натаскивают на ЕГЭ или на олимпиаду людей.

И. Каляев:

- Да. А когда человек обольщается этими большими вычислительными возможностями, как Александр Михайлович говорит, 2,75 экзафлопса, он покупает такой супердорогующий суперкомпьютер, начинает решать свои прикладные задачи, и тут оказывается, что его реальная производительность на этих задачах на порядок меньше той декларируемой пиковой производительности. А все это вызвано тем, что все эти современные суперкомпьютеры имеют жесткую архитектуру, которая закладывается в процессе их создания. И когда вы пытаетесь отобразить в эту жесткую архитектуру сложную современную задачу, а задача представляется, скажем так, в виде операций, которые связаны друг с другом сложным образом, попробуйте туда отобразить. Там возникают огромные накладные непродуктивные расходы. То есть компьютер не занимается решением полезных вычислений, а занимается организацией вычислительного процесса. Поэтому тут как бы палка о двух концах. И вот эта борьба за этот Linpack, она тоже ведет к отрицательным последствиям.

А. Сергеев:

- Чтобы было понятно. В компьютерах есть hardware. Это «железо» - процессоры, сопроцессоры, память и т.д. И есть software. Это программы, которые туда загружают, и которые этот hardware читает. Даже если у вас есть самый мощный по hardware, как говорят, по «железу», суперкомпьютер, необязательно, что он будет считать достаточно быстро. Потому что тот алгоритм задачи, который просят его посчитать, может быть неадекватен тому «железу», которое вы сделали.

И это очень важный вопрос. Потому что мы можем еще на порядок увеличивать скорость, с которой на стандартных тестах этот компьютер работает, а те задачи, которые нам нужны из жизни, этот компьютер будет решать медленно. И вот здесь очень важные слова сказал Игорь Анатольевич – архитектура суперкомпьютеров. Что если суперкомпьютер имеет жесткую фиксированную архитектуру, то есть, есть какое-то количество процессоров, они жестко связаны друг с другом, жестко связаны с памятью (длительной, оперативной памятью), то это не является в настоящий момент передним краем этого суперкомпьютерного движения. Очень важно, чтобы суперкомпьютеры имели, ну, такую гетерогенную структуру. То есть, там есть различного типа процессоры, различные связи между этими процессорами, сопроцессорами и памятью. А программисты должны писать программы таким образом, чтобы максимально эффективно использовать вот эти возможности гибкой архитектуры суперкомпьютера. И вот в этом сейчас лидирующие позиции занимают те, кто умеет на хорошем современном «железе» таким образом программировать, чтобы, действительно, ставить рекорды по тем задачам, которые решаются.

М. Баченина:

- Коллеги, возьмем суперпрограммиста, назовем его условно гениальный программист. Он в принципе понимает, что ему надо сделать, и для него это – как некая алгебраическая или тригонометрическая задачка, которую надо решить, или он вообще видит это «железо» и думает: так-так-так, как к нему подобраться? То есть это совершенно новый, оригинальный процесс должен каждый раз начаться? И это такой вызов, мне кажется, прямо как полет в космос.

И. Каляев:

- Как правило, современные программисты вообще не знают, что там внутри находится с точки зрения «железа», для них это «черный ящик», они используют стандартные языки программирования. Но самые классные программисты должны понимать, на каком «железе» они программируют, и пытаться адаптировать свою эту программу именно под то «железо». Как правильно говорит Александр Михайлович, современные компьютеры – это гетерогенные системы, состоящие из разных вычислительных узлов, и каждый из этих узлов лучше может решать ту или иную часть задачи. И программист должен таким образом распределить задачу, чтобы та часть, которая лучше всего решается вот на этом узле, чтобы она решалась именно на этом узле. И это тоже очень сложно.

И вот здесь очень хорошо может нам помочь искусственный интеллект, который может оптимизировать эти распределения, с учетом различных разгруженностей этих узлов. Поэтому здесь такой хороший симбиоз получается суперкомпьютеров и искусственного интеллекта.

М. Баченина:

- Еще один достаточно наивный вопрос. Все эти переводы на русский звучат как-то непривычно. Мы совсем недавно привыкли к словосочетанию «большая языковая модель». Что такое большие языковые модели, по которым в лидеры, как я прочитала, вышел Китай? И как это связано с суперкомпьютерами?

И. Каляев:

- Честно говоря, эта технология не столь новая. В принципе в любом телефоне есть эта система подсказки, когда вы набираете, например, SMS-текст, вам вываливается следующее слово, чтобы не думать, искусственный интеллект вам подсказывает, какое следующее слово вам нужно вставить. А эта технология больших языковых моделей, она появилась где-то в 2019 году, не так давно. Это первая версия ChatGPT-2, где была использована вот эта технология так называемого трансформера, когда на вход в систему подается какой-то набор символов или слов, и она по многопараметрическому, такому сложному алгоритму выдает на выход тоже не одно слово, а сразу множество слов. Ну, такой качественный сказок произошел в 2020 году, когда появился ChatGPT-3. В ChatGPT-2 использовалось 1,5 миллиарда параметров. Причем они обучили эту систему очень хитро. Они из онлайн-сервиса Reddit выкачали все сообщения, которые имели больше трех лайков, и на базе этих сообщений обучили нейронную сеть ChatGPT-2. А таких сообщений было, по-моему, больше 8 миллионов, а их общий вес в байтах составлял 400 гигабайт. Для сравнения. Все произведения Шекспира весят 5,5 мегабайт, то есть больше чем в 1000 раз меньше. Если вы будете читать по одной странице текста каждую минуту 24 часа в сутки, то вам нужно будет, наверное, лет 40, чтобы получить тот объем данных, который был вкачан в этот ChatGPT-2. А ChatGPT-3, там уже было 175 миллиардов параметров.

М. Баченина:

- А за какое время эти чаты обучились, переварили все эти страницы?

И. Каляев:

- Это еще один вопрос. Кроме того, его обучили, там не 40 гигабайт было, а 420, то есть в 10 раз больше. Само обучение – это очень сложный и дорогостоящий процесс. На обучение ChatGPT-4, насколько я знаю, потратили миллиард долларов.

М. Баченина:

- Я боюсь даже представить, что они будут решать через 10-15 лет. Что это будет? Мы моргнем, а он нам выдаст, как выходить в открытый космос без скафандра?

А. Сергеев:

- Нет. Совет, что вам делать дальше.

М. Баченина:

- Я не хочу. Я сама хочу решать.

А. Сергеев:

- Это как раз и есть главная опасность того, что человек может подсесть на иглу искусственного интеллекта. Искусственный интеллект, зная нас всё больше и больше, о том, как мы моргаем, как мы относимся к каким-то другим ситуациям, и, получая от нас всё больше нашей персональной информации, он дает всё лучше и лучше подсказки, как себя вести. И одна из самых больших проблем, которую видят сейчас не только ученые, но и политики уже давно, что человечество может, следуя этим подсказкам искусственного интеллекта (в общем, правильным подсказкам, как себя вести дальше по жизни), могут сказать: а чего мне думать-то, зачем мне самому принимать решение? Вот есть искусственный интеллект, он дает… И чисто психологически подавляющее число людей расположены к тому, чтобы вот таким образом подсесть на эту иглу. Это очень сложный такой момент.

Мария, вы очень интересный вопрос про языковые модели ставите. Ведь языковые модели, они очень разные для разных языков. У нас с вами язык – это слова, слоги и т.д.

М. Баченина:

- Звуки и буквы.

А. Сергеев:

- А давайте перейдем теперь на китайский. Там совсем другие языковые модели, потому что там все устроено по-другому. И это очень интересно. В каком-то смысле сейчас даже соревнование о представлении слов или представлении через характер, через иероглифы. Особенно если мы возьмем Китай (потому что понятно, что у Китая есть и такой подход, и такой подход к искусственному интеллекту), сейчас это различное продвижение вперед по-разному позволяет оценить, каким образом эти новые подходы в искусственном интеллекте опираются на нашу манеру мышления. Что такое язык? Мы с вами говорим на каком-то языке, но это же не просто слова, которые мы пишем, и т.д., у нас все это есть в голове. Поэтому, когда мы говорим «языковая модель», и как суперкомпьютер, искусственный интеллект обрабатывает что-то, встает вопрос: а это соответствует более-менее тому, как наш мозг обрабатывает информацию? И вот это, по-видимому, самый передний край науки сейчас, вот эти искусственные модели, как искусственный интеллект их обрабатывает, и соответствие тому, что есть в нашем мозге. И это, вообще говоря, взаимообогащающие друг друга процессы.

М. Баченина:

- Потому что нейроны, они схожи?

А. Сергеев:

- Современный искусственный интеллект, искусственные нейронные сети, они, конечно, базируются просто на двух таких существенных (но только двух) аспектах обработки информации мозгом. Первый – это очень сложный коннектом, как мы говорим. Потому что большое число нейронов связано с большим числом нейронов, у нас 10 в 10-й нейронов, 10 в 13-й синапсов, то есть связей. И второй – пластичность синапсов. Это то, как в зависимости от того, какой сигнал прошел через синапс, он начинает лучше или хуже пропускать. Вот эти два момента, они лежат в основе всех современных искусственных нейронных сетей. Поэтому в этом смысле это такая похожая история. Конечно, мозг обрабатывает с помощью гораздо более такой изощренной техники, которую мы еще до конца не поняли, но если мы поймем, то можем это вставить в систему искусственного интеллекта и сделать его еще мощнее.

М. Баченина:

- Тогда у меня сразу перед глазами встает картина 1994 года, первые кадры Джеймса Кэмерона, роботы идут по человеческим черепам. Мы им не нужны будем. Меня это бросает в дрожь. С одной стороны, я думаю: боже, это же вакцины, это спасенные жизни, сколько будет лекарств.

И. Каляев:

- Современный так называемый искусственный интеллект никакого отношения к интеллекту, с моей точки зрения, не имеет. Это просто очень сложные гигантские аппроксиматоры. Вот мы привыкли аппроксимировать функцию переменных, а тут 175 миллиардов этих переменных. Ну, они работают в рамках этого заложенного алгоритма аппроксимации, это трансформер так называемый. И какой вы язык ни будете использовать, сам алгоритм обработки будет одинаковый, просто обучение разное. И именно от обучения зависит, как будет работать тот или иной так называемый искусственный интеллект. Интересно, что сейчас начинается некое размежевание всех этих разных искусственных интеллектов по разным признакам. В том числе недавно провели исследование, и оказалось, что большинство вот этих больших языковых моделей, они придерживаются левых взглядов. А почему? Потому что люди, которые их обучают, они тоже придерживаются левых взглядов, соответственно, они использовали для обучения ту информацию, которая им казалась наиболее правильной.

Дальше появится коммунистический искусственный интеллект, капиталистический, женский, мужской и т.д. То есть будет размежевание по всем этим различным признакам. А все эти размежевания по всем этим признакам – это путь к войне. То есть все начинают говорить: вот это будет самый правильный искусственный интеллект, этот неправильный. И они начнут воевать друг с другом. И в этом случае, как вы правильно говорите, человек становится лишним. То есть искусственный интеллект начинает воевать сам с собой, и зачем ему тут человек?

М. Баченина:

- Коллеги, а как выглядит эта война, как ее представить? Это же не роботы ходящие, как у Кэмерона.

А. Сергеев:

- Война эта уже давно идет. Мы с вами слышим: белые хакеры, черные хакеры и т.д. Это то, что называется кибервойной. Один из аспектов кибервойны, он, конечно, есть, и там очень активно используется искусственный интеллект. Дальше еще сильнее будет использоваться. Может быть, это меньше касается обывателей (в хорошем смысле слова), но когда мы говорим о гибридных войнах, то кибервойна – это один из серьезных…

И. Каляев:

- Дипфейки, интернет-влияние – это всё элементы этой гибридной войны.

М. Баченина:

- Это то, что вы сказали, искусственный интеллект воюет с другим искусственным интеллектом.

И. Каляев:

- Ну, это одно. Но сейчас искусственный интеллект используется, в том числе, для ментального влияния на людей. И такие системы тоже уже существуют. Ну, дипфейки, например, те же самые, когда вам по интернету вкладывают в мозги то, чего не было, или это какое-то интернет-влияние. Это так называемые ментальные войны. То есть в будущем, как я думаю, не будет таких войн, как сейчас, что люди с автоматами или даже роботы бегают. А зачем? Нужно просто воздействовать на психику населения той страны, на которую вы хотите напасть, и переключить ее на прямо противоположные понятия, и они сами вам сдадутся.

М. Баченина:

- Игорь Анатольевич, значит, это означает, что та страна, у которой будет наиболее развит ИИ, та и будет иметь больше возможностей и инструментария влиять на тех, на кого считает нужным?

И. Каляев:

- Если будет доступ…

М. Баченина:

- …к нашим мозгам.

И. Каляев:

- Да.

М. Баченина:

- До своего поколения я уверена. Ну, может быть, еще плюс два. А дальше я не уверена. Потому что, когда я говорю своему ребенку, что тебе неправильно сказал ChatGPT, а я правильно решила или ответила, он говорит: нет, это же сказано мне через интернет. И требовались огромные усилия, чтобы убедить подростка, что интернет – это помойка (простите за грубость).

И. Каляев:

- Знаете, я недавно посмотрел интересный ролик – использование человеком свободного времени в процентах, для чего он его использует, по годам. Ну, 1975 год, по-моему, 16% времени он использует на общение с друзьями, 15% - семья, онлайн-общения там ноль (его еще не было). Начало 2000-х годов: друзья, по-моему, 12%, семья – 10%, онлайн – 10%. А сейчас онлайн – 60%, друзья, по-моему, 8%, а семья – 4%. Вот к чему мы идем.

А. Сергеев:

- Сейчас мы говорим, что выросло поколение детей, и мы видим, что они сильно отличаются от нас, мы считаем, что в плохую сторону, они считают, что в хорошую сторону. И дальше встает такой вопрос: лет через 20 что будет? Эти наши дети вырастут. Продвижение вперед искусственного интеллекта, его невозможно остановить, это уже огромная экономика, и если это экономика, то понятно, что невозможно противостоять этому процессу. Что делать? Знаете, Китай в последнее время показывает пример всему миру. С одной стороны, это очень быстрое развитие всех технологий, в том числе искусственного интеллекта. Смотрите, с этим DeepSeek такая же история, которая просто всколыхнула весь мир. А с другой стороны, они действительно регулируют доступ к различным сайтам…

М. Баченина:

- Да, у них закрытый интернет.

А. Сергеев:

- Да. Наверное, в каком-то смысле, с учетом того, что Китай стремительно развивается и является технологическим примером для всего мира, наверное, мы тоже должны, глядя на Китай, смотреть, в каком направлении и мы тоже будем двигаться.

Относительно DeepSeek, наверное, действительно стоит поговорить, потому что это как-то очень быстро стало явлением. Действительно, многие серьезные люди, сравнив пользование DeepSeek с ChatGPT, говорят: конечно, это гораздо более удобно. А китайцы ведь только начали, это первая выброшенная в мировое пространство компьютерная модель, и дальше она будет совершенствоваться.

М. Баченина:

- И они потратили гораздо меньше времени, а главное, денег, как они заявили, и американские акции рухнули. DeepSeek – «глубокий поиск» (ну, я перевожу дословно). А в чем там отличие от ChatGPT?

И. Каляев:

- DeepSeek – это, так сказать, глубокий поиск. Но на английском языке Seek – это еще «больной». Поэтому DeepSeek, некоторые говорят: может быть, это глубоко больной?

М. Баченина:

- Все-таки чем они отличаются? Если я ChatGPT попользуюсь, через две минуты – системой DeepSeek, я замечу разницу?

И. Каляев:

- Не знаю. С моей точки зрения, DeepSeek – это более узкая, более специализированная система. Если ChatGPT, они пытались охватить, создать какой-то интеллект, который охватывает все что можно, а чем больше вы его обучаете, тем более становятся размыты эти данные. А здесь более сконцентрировано.

М. Баченина:

- Если идти по человеческой модели. Мы же детям своим обозначили: о, профориентация в старших классах. Так и здесь должна быть профориентация.

И. Каляев:

- Да, к этому все и будет идти. Ну, история по спирали и развивается. Сначала были суперкомпьютеры, которые решали всё, потом их начали делать специализированными, потом что они быстрее. Потом появляются те, которые еще решают… Точно так же и здесь, скорее всего, будет развиваться.

По поводу интеллекта я хотел сказать. Александр Михайлович приводил тут пример с китайским языком. Есть такой парадокс Сёрла, «Китайская комната» называется. Когда есть комната, в ней перегородка, маленькое окошечко. С этой стороны сидит человек, который знает китайский язык, а с той стороны сидит человек, который ничего не понимает по-китайски. И тот, который знает, пишет вопросы иероглифами и через окошечко передает тому. Тот не понимает, но у него есть инструкция, что вот на такой набор этих самых иероглифов нужно написать вот такой набор иероглифов. И он пишет и передает обратно. И тот первый человек начинает считать, что тот понимает китайский язык. Вот так работает искусственный интеллект. Он ничего не понимает, он просто преобразовывает поток входных данных в поток выходных данных.

М. Баченина:

- И это касается не только китайского?

И. Каляев:

- Любого.

М. Баченина:

- Это такой дипфейк, я бы сказала.

А. Сергеев:

- Знаете, насчет дипфейков тоже можно поговорить, потому что дипфейки стали обыденным явлением, очень распространенным. Более того, когда лет 10 назад была такая формулировка, что мы живем в обществе постправды, действительно, состояние человечества – состояние постправды. Потому что эти сознательные или несознательно генерируемые фейки, они распространяются, прежде всего, средствами массовой информации. Потому что таков закон жанра – чем быстрее и громче ты сказал, тем…

М. Баченина:

- …цитируемость выше.

А. Сергеев:

- Да. И тем больше главный редактор выписал премию. Это во всем мире так. Опасность очень большая, что не только мы с вами, здесь сидящие, или вечером общаясь со своими детьми, внуками, на основании такой неточной или ошибочной информации принимаем какие-то решения, но и очень важные, ответственно принимаемые решения базируются на дипфейках. Ну, я не говорю о военном деле, поскольку это другой вопрос, но те же самые политики, они имеют некий набор информации и принимают решение о переговорах, еще что-то. Представьте себе, что эта информация фальсифицирована в значительной своей части. Тогда решение, которое будет приниматься, это решение, не соответствующее ничему.

М. Баченина:

- А что же с этим делать?

А. Сергеев:

- Поэтому, когда мы говорим о дипфейках, некоторые говорят: ну, искусственный интеллект – это… Бороться с дипфейками может только искусственный интеллект. Потому что дипфейки делаются искусственным интеллектом.

М. Баченина:

- То есть я тебя породил, я тебя и убью?

А. Сергеев:

- Поэтому противодействие, оно тоже связано с тем, что искусственный интеллект начинает распознавать: это правдивая картинка, информация или что-то туда вкраплено, какие-то пиксели вставлены и т.д. И вот этот вопрос относительно правдивости информации, он очень серьезный. Знаете, на Генеральной Ассамблее ООН в прошлом году тоже этот вопрос обсуждался, принимались решения, как сделать так, чтобы, действительно, были доверенные источники информации, какой они там своя водяной знак должны оставлять, что это действительно проверенная или непроверенная информация. И каким образом тренировать систему искусственного интеллекта, чтобы он искал вот такие фейки.

М. Баченина:

- Игорь Анатольевич, вы сказали, что он никакой не интеллект. Недавно Трамп объявил о мегапроекте по искусственному интеллекту для развития инфраструктуры, собираются выделить 1,5 триллиона долларов. И у многих возникает вопрос: что в этом процессе стоит таких денег?

И. Каляев:

- Во-первых, для примера. 1,5 триллиона долларов – это 150 триллионов рублей, это 50% ВВП России. Конечно, это мне тоже напоминает некие «Звездные войны». Помните, как в 80-е годы Рейган нас вогнал в «Звездные войны», которые на 90% были фейком? Ну, наше государство потратило огромные силы, огромные средства, и это в какой-то степени повлияло и на развал Советского Союза.

Пусть кто-то мне скажет: а что мы хотим получить на выходе, то есть, какая цель этого бесконечно развиваемого искусственного интеллекта, мы что, станем жить лучше? То есть хоть какие-то цифры привели бы. Их нет. Это просто такой бесконечный хайп. Зачем эти вложения? Если вкладывать, нужно решать какие-то более-менее понятные и конкретные задачи, где искусственный интеллект даст нам понятный эффект. Ну, медицина, безусловно.

М. Баченина:

- Помните, как в пандемию обрабатывались рентгеновские снимки? Медики не справились бы с таким потоком.

А. Сергеев:

- Коллеги, ничего не поделаешь, мы все равно живем в этом обществе. Если мы сейчас скажем: давайте перестанем пользоваться теми услугами, которые нам искусственный интеллект предоставляет. Моментально наши смартфоны перестанут работать, все дороги встанут в пробках, много чего перестанет делаться. Поэтому прогрессу противостоять все равно невозможно. Вопрос контроля – это вопрос действительно очень важный.

Я должен сказать, что искусственный интеллект очень много дает и для современной науки - и для астрофизики, и для ускорителей, и для много чего другого, для химии. Давайте посмотрим Нобелевские премии прошлого года. Фактически две из них связаны с искусственным интеллектом. Одна премия, которую дали по физике (ну, потому что по информатике нет Нобелевских премий). И дали ученым, которые разрабатывали аспекты функционирования искусственного интеллекта. А вторая – это за разработку разных лекарств, за разработку химических соединений, в которых тоже использовался искусственный интеллект. Мир уже пошел по этому направлению. Да, мы вступили в эру искусственного интеллекта.

М. Баченина:

- Мне кажется, нам обязательно нужно поговорить о российской суперкомпьютерной инфраструктуре. Я читала ваше интервью. Игорь Анатольевич, вы сказали, что для этого нужно. Я прошу тоже об этом сказать. И есть ли это все у нас? Чтобы участвовать в этой гонке, чтобы не над нами ставили эксперименты, а чтобы мы тоже диктовать могли, что нам необходимо.

И. Каляев:

- Следует признать, что мы существенно отстаем в этой гонке.

М. Баченина:

- Кадровый голод, деньги, в чем причина?

И. Каляев:

- Во-первых, в последнем списке топ-500 всего лишь 6 суперкомпьютеров, которые работают на территории России. Я их даже не называю российскими, просто говорю, что они работают на территории России. На 90% все это из зарубежных комплектующих сделано, закуплено за рубежом. Но даже по количеству этих параметров мы занимаем, по-моему, 16-е место в мире. У американцев в списке топ-500 173 компьютера, у китайцев – 80, по-моему. Нас обгоняет Саудовская Аравия, чуть ли не Марокко обгоняет. Конечно, мы очень сильно в этом плане отстаем. И мы не можем, как Трамп, взять и выделить 1,5 триллиона долларов на развитие этой суперкомпьютерной отрасли, в том числе для искусственного интеллекта. Поэтому нужно искать какие-то пути, как догнать и перегнать Америку с учетом наших ограниченных ресурсов, наших ограниченных возможностей и т.д.

С моей точки зрения, один из таких возможных вариантов – создание некой сети тех суперкомпьютеров, которые стоят у нас на территории России, объединить их в общий пул. То есть сейчас каждый как бы живет своей жизнью, доступ к ним ограничен, эти могут, эти не могут. Если сделать общую такую суперкомпьютерную инфраструктуру, то, по крайней мере, мы обеспечим возможность доступа к ним более широкому кругу пользователей, в том числе и работающих в области искусственного интеллекта. А во-вторых, таким образом, мы можем объединить эти вычислительные ресурсы для решения таких больших задач, в том числе, может быть, для создания таких крупных языковых моделей. Потому что на отдельном таком суперкомпьютере она жить не сможет. Например, тот же ChatGPT живет на суперкомпьютере Azure AI 30 петафлопс, то есть 30 на 10 в 15-й степени операций в секунду. У нас в стране нет компьютера с такой производительностью.

М. Баченина:

- А в чем причина? Здесь речь про деньги идет? Или у нас кадровый голод? У нас что, программистов не хватает?

А. Сергеев:

- Наверное, историю можно увести в микроэлектронику, что, действительно, базой всего является микроэлектроника, которой, так оказалось, мы похвастаться не можем. Поэтому, как Игорь Анатольевич говорит, даже если у нас есть суперкомпьютеры, они собраны из комплектующих, которые приехали к нам из-за рубежа. Ясно, что если хотим соревноваться с другими экономиками…

М. Баченина:

- Ну, тут нельзя рассматривать один сектор экономики, а нужно в целом.

А. Сергеев:

- Даже если мы и вкладываем какой-то процент ВВП в нашу науку, в наши разработки, то это, конечно, существенно меньше, чем тот же самый процент ВВП, который вкладывают такие гиганты, как Китай, Соединенные Штаты Америки. Поэтому здесь соревноваться, конечно, очень тяжело. Но у нас есть такие направления, которые позволят нам не соревноваться впрямую, догоняя или пытаясь догнать и обогнать. Потому что, когда мы говорим, скажем, о системах с искусственным интеллектом, то есть использовании суперкомпьютеров для искусственного интеллекта, то там нам с вами вовсе не нужен, скажем так, универсальный суперкомпьютер, который умеет решать любые задачи, что бы мы ни захотели. Системы, которые используются в искусственном интеллекте, с точки зрения алгоритмом, то есть что там нужно, выполняют очень небольшой класс математических задач. Фактически это задачи умножения матрица на матрицу или матрица на вектор. И для того, чтобы выполнять эту задачу, вам не нужен универсальный компьютер, у вас может быть специализированный компьютер, который заточен именно под такую конкретную операцию. И если говорить о специально заточенных суперкомпьютерах, то Россия смотрится очень неплохо. Игорь Анатольевич, например, он один из отцов нашего российского суперкомпьютера, который для специальных задач демонстрировал и демонстрирует высочайшую производительность. Поэтому тут должны быть «мозги», под какой класс задач какой хард вы должны строить.

Мы в рамках Национального центра физики и математики разрабатываем вычислительную машину, которая базируется не на обычных электронных процессорах, а на процессорах, в которых информация обрабатывается с помощью света. Это так называемые фотонные вычислительные устройства. И здесь есть очень интересные результаты как раз применительно именно к системам искусственного интеллекта. То есть такие решения, что давайте сделаем грид, в эту сеть объединим наши мощности, пусть они маленькие, но в целом эта система уже будет очень приличным суперкомпьютером. И это может быть одним из решений.

Второе решение, тоже связанное с нашей головой, как мы умеем программировать - а как правильно на этой сети большой распределять задачи. Ведь можно сделать так, что мы, используя множественные возможности этой гетероархиректуры суперкомпьютера большого, можем очень эффективно двигать задачи по ней и решать большее количество задач за тот же самый промежуток времени.

И. Каляев:

- Причем все эти суперкомпьютеры, они гетерогенные, то есть, как правило, этот лучше эту задачу решает, этот – лучше другую. И вот нужно очень правильно распределять эти задачи.

А. Сергеев:

- И вот тут искусственный интеллект, который распределяет задачки, он был бы очень хорош.

И последнее, третье – это то, что мы предлагаем вычисления на новых физических принципах. Не с помощью ЭВМ, а на новых физических принципах, куда входит, конечно, фотонные вычисления, квантовые вычисления и нейроморфные вычисления.

И. Каляев:

- Обратите внимание, что все эти великие научно-технические проекты прошлого века (советские космические, атомные проекты, американский проект высадки человека на Луну), они рассчитывались с помощью допотопных арифмометров и логарифмических линеек. А мы сейчас с помощью всех этих наших суперпуперкомпьютеров, сверхсильного искусственного интеллекта даже во многом повторить этого не можем. То есть не всё зависит от вычислительных мощностей, искусственного интеллекта. От людей всё зависит.

А. Сергеев:

- Но я боюсь, что с логарифмическими линейками мы все-таки…

И. Каляев:

- Я не предлагаю возвращаться к логарифмическим линейкам. Кстати, Александр Михайлович упомянул, что первые суперкомпьютеры появились в атомной отрасли. А вы знаете, какой был самый первый суперкомпьютер, на котором рассчитывали нашу первую атомную бомбу (это академик Самарский)? Он посадил 500 девочек с арифмометрами, и каждая считала точку. Там сеточные уравнения нужно было считать. И каждая считала функцию этой точки и на бумажке передавала четырем соседним. И, таким образом, они просчитали все это сложнейшее сеточное уравнение.

А. Сергеев:

- Да, первый суперкомпьютер действительно был такой. Пока не появились электронно-вычислительные машины.

М. Баченина:

- Друзья мои, я хочу вам пожелать терпения (сколько терпения надо иметь, и не потому, что что-то надо решать, а вам приходится еще ждать, лавировать между экономикой, политикой и наукой) и, конечно, здоровья. Потому что меня просто восхищает упорство, которое присуще ученым. Спасибо вам за это большое.

Подписывайтесь на наш подкаст, чтобы не пропускать новые выпуски!

Игорь Каляев