В Москве прошла ежегодная технологическая конференция GigaConf, главной темой которой стал генеративный искусственный интеллект (GenAI). Его ключевое отличие — в способности создавать новый контент, комбинируя все доступные инструменты. Перспективы развития данной технологии обещают фантастические изменения для обычных пользователей и в бизнес-процессах. О том, за счет чего будет формироваться новый технологический ландшафт, как трансформируются нейросети и почему уже сегодня нужно делать ставку на продуктовые инновации, «Лента.ру» поговорила с одним из спикеров конференции — директором по развитию технологий искусственного интеллекта Сбера Сергеем Марковым.
«Лента.ру»: Что происходит на GenAI-рынке к середине 2025 года?
Сергей Марков: Мы живем в интересную эпоху, поскольку оказались в самом разгаре лета искусственного интеллекта. Тренды настоящего во многом связаны с технологиями генеративного искусственного интеллекта. Сегодня мы находимся в стадии системной трансформации технологии генеративного ИИ в технологию интерактивного ИИ. Системы искусственного интеллекта подступаются к решениям задач, которые не выполняются за один шаг.
Одно дело сгенерировать картинку по текстовому запросу, другое дело — найти необходимые референсы, сгенерировать эскизы, обсудить их с пользователем, возможно, по результату выбрать наилучший вариант, затем его отредактировать в соответствии с командами пользователя и т. д. Когда мы говорим об интерактивном ИИ, речь идет именно о системах, способных решать комплексные интеллектуальные задачи и в процессе их решения взаимодействовать с заказчиком, другими системами ИИ, использовать различные внешние инструменты.
Что такое LLM-модели, как они работают и какие тренды, связанные с ними, определяют ситуацию в индустрии?
Строительным кирпичиком систем интерактивного ИИ являются LLM-агенты. Сам по себе термин в основе своей содержит латинский корень и, переводя его дословно, мы понимаем, что речь идет о чем-то или ком-то, кто может выполнять действия. В основе LLM-агента лежит большая языковая модель. И принципиальное отличие современных языковых моделей от тех, которыми мы пользовались еще несколько лет назад, заключается в том, что они способны не только выполнять простые задачи вроде написания текста или мозгового штурма, но и строить цепочки рассуждений, генерировать команды для вызова внешних инструментов.
Эти модели уже на этапе обучения проектируют таким образом, чтобы они могли использовать внешние инструменты. Речь идет о переходе от фундаментальных моделей к фундаментальным агентам. Сегодняшние наиболее продвинутые языковые модели можно в полной мере отнести именно к этой категории.

Фото: Виталий Невар / РИА Новости
Какие еще тренды, помимо агентности, можно выделить сегодня?
Справедливо будет назвать быстрое развитие мультимодальности (модели учатся оперировать не только текстом, они осваивают и речь, и музыку, и изображения, и видео). Появляются модели, которые в решении разных задач способны сочетать разные модальности. Священным Граалем в этой области являются модели, которые могли бы получить на вход смесь текста и картинок и на выход выдать любую композицию. Но в целом направлений исследований сегодня очень много. Понятно, что, когда появился ChatGPT, внимание и интерес общества, финансовых и исследовательских кругов сместились в сторону ИИ и в особенности больших языковых моделей.
На эту сферу было выделено дополнительное количество ресурсов, вычислительных и человеческих. Поэтому сегодня эти технологии развиваются стремительно. Тестируется много идей, некоторые из них связаны с определенными вызовами, которые наметились в развитии больших языковых моделей. Например, с тем, что количество текстовых данных в мире растет темпами более медленными, чем растут вычислительные бюджеты на обучение моделей. А это значит, что для того, чтобы обеспечивать дальнейшее совершенствование моделей, мы должны каким-то образом придумать, как более эффективно использовать доступные нам данные. Все это определяет положение дел в индустрии и задает тренды.
Каковы тенденции развития ИИ в глобальном масштабе, с учетом национальных особенностей крупнейших игроков?
В мире идут процессы, связанные с регионализацией, увеличением закрытости. Все уже давно шутят на тему того, что OpenAI, как компания, которая в своем названии содержит слово «открытый», в действительности делится минимумом результатов своих исследований с сообществом. Она ограничивается только скупыми техническими отчетами. Если еще год-два назад в публичной сфере в области ИИ самыми обсуждаемыми были вопросы, связанные с этикой, с применением технологии ИИ во благо человечеству, то сегодня тон обсуждений сменился. Вектор обсуждений направлен на поиск «неправильных» стран, которые хорошо бы ограничить в технологиях.
В целом очевидно стремление определенных кругов оградиться в своем развитии технологий. Оборотной стороной этой тенденции стало то, что дистанция, которая разделяла лидеров индустрии и лучшие open-source-решения сократилась. То есть если 2 года назад многие считали, что «догнать» ChatGPT практически невозможно и все остальные исследовательские лаборатории обречены на отставание, то сегодня мы видим DeepSeek, GigaChat и другие модели, способные соперничать с детищем OpenAI. То есть нарратив соперничества и регионализма во многом, мне кажется, подстёгивается тем, что дистанция между лидерами гонки и «догоняющими» сокращается.
Можно ли говорить, что РФ является полноценной участницей гонки ИИ?
Да, но с поправкой на масштабы. Нужно понимать, что в том же Китае сегодня есть около 20 проектов по созданию «с нуля» больших языковых моделей. У нас в стране таких проекта два (GigaChat и YandexGPT). Учитывая тот факт, что по населению Россия в 10 раз меньше Китая, число проектов на душу населения примерно одинаковой. Если говорить о российских больших языковых моделях, то с отдельными задачами они справляются вполне на уровне или даже лучше моделей, созданных мировыми лидерами (например, когда решение задач требует более глубокого понимания русского языка или особенностей русской культуры).

Фото: Александр Кряжев / РИА Новости
GigaChat в бенчмарке MERA, например, обходит GPT-4o и лишь на 0,7 процентных пункта отстаёт от DeepSeek v3. Но для того, чтобы уверенно достичь уровня лидеров при работе на других языках и в более широком спектре задач нам ещё предстоит проделать немало работы. Мы ставим перед собой цель не только сократить имеющийся разрыв, но и стремимся вырваться вперёд. По крайней мере, если говорить об исследованиях, которые ведутся в топовых российских командах, то они совершенно точно находятся на мировом уровне и содержат достаточно много оригинальных идей. Наши инженерные команды не занимаются слепым копированием чужих идей, а ставят собственные эксперименты.
Многие результаты мы публикуем, публикуем и модели в open-source, публикуем статьи в авторитетных международных изданиях, выступаем на международных академических площадках. В этом смысле Россия не выключена из всемирного исследовательского процесса. Довольно активно мы взаимодействуем с Китаем, есть много поездок, обсуждений. Я позитивно оцениваю это сотрудничество, поскольку оно проходит в очень дружелюбной и конструктивной атмосфере. Россия должна в полной мере использовать возможности в международном партнерстве.
Если заглянуть в ближайшее будущее, то мои надежды связаны с созданием в России промышленного конвейера исследований. Создание более эффективных алгоритмов и методов возможно только, если мы поставим эксперименты и инновации на поток, если в единицу времени мы будем проверять больше гипотез, если сможем обеспечить более надежную проверку гипотез, снижая вероятность ошибки в такой проверке. Я верю в то, что исследования, поставленные на «промышленные рельсы», способны привести к феноменальным результатам.
Технологии будут менять мир к лучшему?
Конечно, ИИ в конечном итоге принесет благо человечеству, поскольку технологии — важная часть общественного прогресса. Они расширяют границы возможного для человека, для нашего разума, подобно тому, как это произошло в других областях. У нас нет острых когтей и клыков — появились вилки и ножи.
У нас нет густого меха и толстой шкуры — мы придумали одежду. Наш биологический разум ограничен, эволюция идёт гораздо медленнее, чем технологический прогресс — мы создаём такой класс инструментов, который позволяет расширить границы возможного для человека, усилить его возможности в решении интеллектуальных задач.

Фото: Владимир Трефилов / РИА Новости
Может ли достигаться некий предел эффективности нейросетей, учитывая постоянное улучшение и расширение их способностей?
Когда мы говорим о пределах развития ИИ, то важно понимать, что есть некоторые фундаментальные пределы, которые диктуются ограничениями пространства и времени. Еще в 60-е годы математик и биофизик Ханс-Йоахим Бремерманн задумался о том, что информацию нельзя предавать быстрее скорости света, по крайней мере в рамках известной нам физики, а элементы вычислительной машины не могут быть меньше планковского масштаба из-за проблемы квантовой неопределенности.
Из этого следует, что машина массой 1 килограмм не может выполнять в секунду больше чем примерно 1.36 × 1050 двоичных операций. То есть существует фундаментальный предел скорости вычислений, который диктуется самими свойствами пространства и времени. Однако это не единственное, что нас ограничивает. Есть еще термодинамика: машины нагреваются во время вычислений (смотрите принцип Ландауэра) — поэтому машина, которая будет производить вычисления очень быстро рискует испариться.
Словом, есть физические лимиты, дальше которых мы не сможем ускорять вычисления. Конечно, мы можем масштабироваться — создавать вычисляющие устройства всё большего и большего размера, но и здесь нас ждет рад ограничений. Если один строитель строит дом за год, то это не значит, что миллион строителей возведут его за мгновенья. Производительности параллельных вычислений ограничена действиями таких законов, как, например, закон Густафсона—Барсиса. Влияние вычислительных ограничений мы начнем ощущать уже довольно скоро. Помимо них есть и другие барьеры, не такие строгие, как физические, но, тем не менее, они есть. Например, это энергетика.
Мы сегодня тратим большие объёмы энергии на обучение топовых моделей. Масштабировать энергетику такими же темпами, как вычислительные устройства человек пока не умеет. И, наконец, важно понимать, что «интеллект» систем не растёт линейно с увеличением их скорости. Многие интеллектуальные задачи (например, выбор оптимальной стратегии поведения в многоагентной среде) обладают высокой комбинаторной сложностью (по всей видимости, несократимой), из-за чего прирост «уровня интеллекта» систем по мере ускорения и оптимизации вычислений в будущем будет замедляться.
То есть того самого интеллектуального взрыва в ИИ, которого многие боятся, скорее всего, не будет?
Да, этого, вероятно, не произойдет по тем причинам, что я озвучил. Живя в эпоху, когда почти любая разумная идея превращается в успех, сложно представить, что со временем это будет не так. Представьте: в конце XIX века толковый инженер-механик в гараже мог улучшить конструкцию двигателя внутреннего сгорания так, чтобы его коэффициент полезного действия увеличился на единицы процентов.
Сегодня автоконцерны тратят миллиарды долларов, чтобы на десятитысячные доли процента повышать КПД тепловых двигателей, и считают это успехом. С технологиями ИИ будет происходить примерно то же самое. На сегодняшний день мы ещё очень далеки от использования потенциала этих технологий. Мы нащупываем возможности, которые открываются перед нами благодаря ИИ. Есть инновации технологические, которые встали на прочные рельсы. Но вслед за ними должны идти инновации продуктовые.
Еще один распространенный страх: заменит ли ИИ человека?
Прямой путь на замену человека в существующих бизнес-процессах реально имеет очень маленький экономический потенциал. Простой пример. В конце 40-х годов в мире было около 100 программистов. С тех пор технологии программирования изменились до неузнаваемости, а производительность труда программиста возросла в 100 раз. То есть если бы технологии использовались только для того, чтобы заменять людей, то мы бы оказались в мире, где был бы нужен только один программист. Он бы заменил тех 100 человек.
Вместо этого мы оказались в мире, где не 1, не 100, а скорее 100 миллионов программистов. Почему это произошло? Потому что технологии способны создавать новые продукты, сервисы, целые индустрии. Например, индустрия компьютерных игр привела к появлению огромного количества рабочих мест, причем, не только для разработчиков, но и для маркетологов, бухгалтеров, управленцев и т. д. На технологии ИИ нужно смотреть именно так, если вы хотите на них заработать. Фантазия и интеллект востребованы именно там.
Каковы самые распространенные сценарии использования GenAI в обычной жизни?
Конечно, очень востребовано применение GenAl в учебных задачах (помощь в выполнении самых разных задач в школе, институте), в написании самых разных текстов, в креативной индустрии. Это и мозговые штурмы, генерация идей, с помощью GenAI решается довольно много творческих задач. Часто люди используют современные модели генеративного искусственного интеллекта как продвинутый поисковик.
Если нужно в чем-то разобраться, то проще попросить модель дать обобщенное объяснение, а не изучать самостоятельно десяток ссылок. Если мы посмотрим на потенциал GenAl, то увидим, что происходит, по сути, новая большая революция в области обработки информации, сопоставимая с появлением книгопечатания или интернета. Я четко вижу, что через несколько лет у нас появятся системы, которые будут способны по вашему запросу написать для вас книгу на ту тему, которую вы зададите. Представьте, еще несколько минут назад не было книги — и вот она перед вами. То есть у нас будет технология создания произвольных проекций цифрового следа человечества на наши запросы в моменте.

Фото: Александр Кряжев / РИА Новости
Есть мнение, что развитие рассуждающих моделей (Reasoning AI Models) значительно повысит эффективность применения AI в различных областях. Поддерживаете ли вы такую точку зрения? Объясните, пожалуйста, почему.
Важность развития рассуждающих моделей сегодня связывают не столько с тем, что они способны значительно лучше решать некоторые классы задач. Хотя это действительно так. Медийный эффект, который вызвали рассуждающие модели, связан с тем, что работа модели выглядит более понятной для человека. Это уже не «черный ящик» — модель генерирует цепочку размышлений на понятном человеку языке.
В этом смысле люди более склонны доверять таким моделям и у них возникает ощущение, что они понимают, как эти модели «мыслят». Однако, на мой взгляд, основная потенциальная ценность моделей, генерирующих цепочки рассуждений, заключается не в этом, а в том, что этот подход является одним из способов преодоления сложностей, которые большие языковые модели пока что испытывают в задачах, где решение не может быть найдено в рамках вычислительного бюджета на генерацию токенов ответа. Иногда для нахождения правильного ответа просто необходимо подумать дольше, и генерация цепочек размышлений — один из способов это сделать.
Бигтехи активно обучают пользователей работе с ИИ, поскольку главный риск видят не в самих технологиях, а в неграмотном использовании. Есть специальные курсы, тренинги, обучающие видео. Вы согласны, что основные риски могут исходить не от искусственного интеллекта, а от недостатка навыков у пользователей?
Попробуйте в рассуждениях о рисках, связанных с ИИ, заменить словосочетание «искусственный интеллект», словами «умножение матриц» или «математика», или «металлообработка». ИИ — это большая отрасль науки и технологий, а сами по себе знания и технологии обычно нейтральны. Вы можете использовать математику для того, чтобы строить дома, а можете для того, чтобы создавать оружие. Обычным молотком можно забивать гвозди или разбивать головы — и ответственность за применение инструмента лежит не на технологии, а на тех, кто эту технологию использует.
С применением любой достаточно могущественной технологии часто связаны серьёзные риски. Электричество даёт нам свет, тепло и множество других благ, но человек может пострадать от удара током. Паровая машина приводит в движение паровозы и пароходы, но в результате взрыва котла могут погибнуть люди. Причиной несчастья может стать и низкий уровень квалификации пользователей, и несоблюдение техники безопасности, и даже злонамеренное применение технологии.
Рост уровня технической грамотности, принятие правил безопасности, иногда и обязательная сертификация потенциально опасных систем, а также создание технических средств защиты позволяют снизить риски техногенных инцидентов. Если говорить конкретно о технологиях искусственного интеллекта, то лично я убеждён в том, что грамотное развитие этих технологий способно создать в будущем более безопасное и справедливое общество.