О ключевых моментах экономического обоснования инвестиций в инфраструктуру для ИИ-моделей и об особенностях их «экономики» в зависимости от выбранной модели развертывания инфраструктуры мы попросили рассказать экспертов, готовящихся выступить на конференции «Цифровая инфраструктура ― 2026».

Резюме статьи

Основная тема: подходы к экономической оценке и обоснованию инвестиций в инфраструктуру для ИИ-моделей.

Подробности:

  • Базовые принципы оценки
  • Основные факторы, которые нужно учесть
  • Временной горизонт оценки
  • Критически важные компоненты затрат
  • Важные аспекты внедрения
  • Рекомендации экспертов
  • Основные выводы

Начинать нужно с TCO

Некоторые из опрошенных нами экспертов считают, что основывать экономическую оценку следует на общей стоимости владения решением (TCO).

Сергей Карпович: «Оптимальная модель часто комбинирует локальные и облачные ресурсы: обучение модели происходит в облаке, а инференс — локально»

Так, Сергей Карпович, заместитель руководителя направления Т1 ИИ (ИТ-холдинг Т1), первой из рекомендуемых им метрик называет именно TCO: «Сравните с облаком — оно может быть дешевле на старте, но локальное размещение окупается при высоких нагрузках в тысячи часов использования. Разделяйте капитальные затраты от операционных. Для оценки можно провести сценарный анализ и определить точку безубыточности при заданной нагрузке с учетом стоимости инференса в сравнении с альтернативными расходами на облако. Также стоит учитывать потенциальную ценность владения (ROI), в том числе снижение задержек, повышение безопасности и гибкости эксплуатации. На практике оптимальная модель часто комбинирует локальные и облачные ресурсы: обучение модели происходит в облаке, а инференс — локально».

Дмитрий Васильев: «Если нагрузка стабильна и предсказуема, локальное решение может окупиться за 12-18 месяцев и оказаться дешевле облака»

Дмитрий Васильев, менеджер по продуктам направления ИИ компании «Онланта», также предлагает рассматривать именно TCO в ходе обоснования локальной инфраструктуры: «Помимо прямых капитальных затрат на серверы с GPU и системы хранения, необходимо учесть значительные операционные расходы: на энергопотребление и охлаждение, на аренду площадей, техобслуживание и зарплаты узкопрофильных инженеров. К этому добавляются и косвенные риски: стоимость простоя системы, упущенная выгода из-за длительного цикла закупок и апгрейда оборудования, а также быстрое моральное устаревание специализированного “железа”. Нужно учитывать первоначальные инвестиции (CAPEX), операционные расходы (OPEX) и уровень загрузки. Если нагрузка стабильна и предсказуема, локальное решение может окупиться за 12-18 месяцев и оказаться дешевле облака. Но при переменной нагрузке, старте или экспериментальных сценариях выгоднее облако».

Евгений Свидерский: «В ходе выбора важно учитывать влияние инфраструктуры на бизнес»

С коллегами соглашается и Евгений Свидерский, директор облачного бизнеса ITGLOBAL.COM корпорации ITG: «Самостоятельный запуск требует вложений в закупку, ввод в эксплуатацию и модернизацию оборудования, а также содержания резервных компонентов и специалистов для обслуживания инфраструктуры. Задержки в поставках или сбои могут привести к простоям и финансовым потерям. Для обоснования экономических характеристик инфраструктуры локальной ИИ-модели важно учитывать, что ее обучение требует максимальной мощности, масштабируемых GPU и больших инвестиций в течение относительно короткого срока, а инференс предполагает стабильную нагрузку и оптимизацию под быструю обработку пользовательских запросов. Подход к оценке должен различаться: инфраструктура для обучения ориентирована на пиковые ресурсы и минимизацию риска сбоев, а для инференса — на энергоэффективность, SLA и выгодное соотношение затрат и полученных результатов. Облачный провайдер предлагает специализированные конфигурации как для обучения, так и для инференса больших языковых моделей, позволяя гибко адаптировать инфраструктуру к конкретным задачам клиента. Инфраструктура, предоставляемая как услуга, делает затраты более предсказуемыми, так как провайдер берет на себя риски обслуживания и гарантирует доступность в рамках SLA. В ходе выбора важно учитывать влияние инфраструктуры на бизнес: например, ускорение обработки данных позволяет сократить время анализа и увеличить количество реализованных проектов, что приводит к росту выручки. Сравнение этих выгод с затратами и рисками дает основу для взвешенного решения».

:Максим Ковтун «Кроме общих затрат владения, в экономическую оценку следует включать стоимость снятых рисков»

Максим Ковтун, директор департамента проектирования и разработки IBS, оценке снижения рисков уделяет особое внимание: «Компании, принимающие решение о локальном размещении моделей, обычно стремятся смягчить отдельные риски, например, угрозы утечки конфиденциальных или персональных данных. Кроме общих затрат владения, таких как закупка аппаратного обеспечения и лицензий, затраты на дата-центр, команду сопровождения, стоимость простоев и т.д., в экономическую оценку следует добавлять стоимость снятых рисков. Важно оценивать снимаемые риски при принятии решения об использовании локальной модели, поскольку наш анализ показывает существенную разницу между стоимостью владения локальной инфраструктурой и облачным размещением с перевесом в сторону последнего».

Необходимо оценивать выгоды и затраты на период нескольких лет

Ряд экспертов подчеркивают важность оценки на вполне определенный период, который, по разным оценкам, может составлять от двух до пяти лет.

Вера Краевская: «Учитывать стоит не только капитальные и операционные затраты, но и эффект для бизнеса»

Вера Краевская, генеральный директор компании «ВижнСервис», продолжает: «На первый взгляд, локальные модели обходятся дороже. Но если брать перспективу двух-трех лет, то они часто оказываются выгоднее облачных. Учитывать стоит не только капитальные и операционные затраты, но и эффект для бизнеса, в том числе скорость запуска ИИ-сервисов, минимизацию рисков утечки данных или юридических рисков. Ведь быстрота принятия решений — это и есть настоящее конкурентное преимущество».

Антон Прокошин: «При нерегулярных нагрузках или необходимости быстрого масштабирования выгоднее оказывается гибридная модель»

Антон Прокошин, руководитель направления «Пресейл» центра «Инфраструктура» компании «ЛАНИТ-Интеграция», предлагает рассматривать горизонт трех-пяти лет: «В расчетах нужно учитывать, во-первых, капитальные расходы (CAPEX), включая покупку серверов, GPU, сетевого оборудования, систем хранения и кондиционирования; во-вторых, операционные расходы (OPEX) — затраты на электричество, охлаждение, обслуживание, зарплаты, обновления, лицензии; в-третьих, стоимость рисков — возможных простоев, штрафов, отсутствия сертификатов безопасности. Обычно оценка проводится следующим образом. Сначала проводится сценарный анализ: моделируются разные нагрузки — обычная, пиковая, рост в два раза. Затем рассчитывается полная стоимость владения (TCO) и окупаемость (ROI). Далее проводится чувствительный анализ: что будет, если цены на электроэнергию вырастут на 20% или если GPU будут использоваться только на 50%. Наконец, на основе этих данных делается вывод: при стабильных и постоянных задачах (например, обработка данных госорганов) локальная инфраструктура экономичнее уже через два-три года. А вот при нерегулярных нагрузках или необходимости быстрого масштабирования выгоднее оказывается гибридная модель».

Авенир Воронов: «В российских реалиях акцент обычно делается на локализацию ресурсов и соответствие нормативам»

Авенир Воронов, руководитель лаборатории инноваций «ДАР» (ГК «КОРУС Консалтинг»), рекомендует готовить экономическое обоснование по этапам внедрения: «На стадии прототипов достаточно использовать доступные серверы или облачные модели — это позволит минимизировать инвестиции. После появления чувствительных данных и масштабирования нагрузки становится важным анализ затрат на бизнес-процессы и оценка окупаемости ИИ-решений. Соответственно, решение о распределении затрат между локальными серверами и облаками должно быть более обоснованным. На зрелых этапах нужно также учитывать энергопотребление, охлаждение и эксплуатационные расходы, сравнивая их с возможным переходом на гибридные модели. В российских реалиях акцент обычно делается на локализацию ресурсов и соответствие нормативам, что позволяет оптимизировать совокупную стоимость владения и увеличить надежность инфраструктуры с учетом климатических и технических особенностей регионов».

Нужно смотреть на сценарии и задачи

Есть и эксперты, которые особо рекомендуют в ходе оценки анализировать сценарии и задачи, под которые развертываются ИИ-модели или в рамках которых их планируется задействовать.

Вадим Солдатов: «Все зависит от экономического эффекта самого сценария и автоматизируемой задачи»

«Все зависит от экономического эффекта самого сценария и автоматизируемой задачи, — считает Вадим Солдатов, директор офиса ИИ-продуктов Группы Arenadata. — Если вы можете посчитать выгоду от проекта, то затраты на инфраструктуру будут такими же инвестициями, как и расходы на обслуживающий решения персонал, поддержку платформы машинного обучения и обучение специалистов. При этом важно учитывать стоимость простоев, энергоэффективность, длительность жизненного цикла оборудования и возможность его последующего использования для других задач — например, для дообучения или инференса менее ресурсоемких моделей».

Илья Маршаков: «Наша рекомендация — рассматривать проект по внедрению именно платформы для ИИ-агентов, а не конкретного агента»

Илья Маршаков, руководитель развития бизнеса Kolmogorov в компании Data Sapience, также придерживается мнения о том, что важно смотреть на сценарии использования ИИ-моделей: «Как правило, финансовая эффективность ИИ-модели достигается за счет работы нескольких ИИ-агентов, в состав которых входит ИИ-модель. Однако наша рекомендация в диалогах с заказчиками — рассматривать проект по внедрению именно платформы для ИИ-агентов, а не конкретного агента. В этом случае проект потребует больше ресурсов, но окупаемость его будет более высокой и быстрой».

Антон Юдин: «Только после понимания конечного экономического эффекта от применения ИИ-решения можно точно оценить экономические характеристики ИИ-инфраструктуры»

Антон Юдин, руководитель направления развития технологий ИИ в продуктах «Скала^р» Группы Rubytech, продолжает: «Все экономические выгоды от внедрения ИИ-моделей всегда нужно оценивать в деньгах. Руководитель процесса должен четко понимать, для чего добавляется то или иное решение. ИИ — это сложный инструмент для комплексных задач, которые ранее было сложно или невозможно автоматизировать. Обоснование его внедрения должно основываться на конкретном экономическом эффекте. Важное преимущество: ИИ работает круглосуточно без выходных и перерывов, обеспечивая стабильное качество обработки задач вне зависимости от времени суток или нагрузки, — это создает долгосрочный эффект, когда начальные инвестиции окупаются благодаря постоянному повышению эффективности процесса и накоплению данных с их последующим многократным использованием. Только после понимания конечного экономического эффекта от применения ИИ-решения можно точно оценить экономические характеристики ИИ-инфраструктуры. При этом важно учитывать возможности оптимизации через автоматизацию рабочих пайплайнов для быстрого запуска процессов разработки, тестирования гипотез и пр. Автоматизация устраняет человеческий фактор, позволяет собирать статистику и более точно масштабировать инфраструктуру, минимизируя потери при ее развитии под новые задачи. Ведь будет расти не только количество агентов — сами модели потребуют дообучения для более точного охвата новых задач своей логикой».

Александр Ефимов: «Чтобы решение о локальной ИИ-модели было обоснованным, переведите все затраты в ключевую метрику модели — стоимость за токен»

Александр Ефимов, директор практики искусственного интеллекта и машинного обучения в компании GlowByte, соглашается с коллегами: «Прежде чем считать деньги, нужно понять, что мы считаем, какие именно задачи будем решать с помощью ИИ-модели, какую выгоду и экономический эффект принесет решение задачи для компании. Как правило, компании с помощью LLM-моделей решают не одну задачу, а несколько. Более того, одна задача обычно не окупает все затраты на локальную инфраструктуру, а уже сегодня компании все меньше и меньше готовы к длительным экспериментам — им нужна отдача от технологий. На длительном горизонте времени, скажем, от двух лет капитальные затраты на собственный сервер становятся экономически выгоднее бесконечной облачной аренды. Чтобы решение о локальной ИИ-модели было обоснованным, переведите все затраты в ключевую метрику модели — стоимость за токен. Это позволит напрямую сравнивать локальную инфраструктуру с облачными API, ведь у облачных моделей цена также привязана к токенам. Посчитайте и сравните TCO на один год, на три-пять лет. Это даст вам полную картину долгосрочных затрат и обоснованный выбор в пользу облака с низким CAPEX и высоким OPEX, или, наоборот, локальной инфраструктуры с высоким CAPEX и низким OPEX. В конечном счете выбор варианта реализации зависит от бизнес-кейса и политики безопасности в компании».

Александр Подмосковный: «Важно при этом прозрачно выделять постоянные затраты и учитывать цену регуляторного риска»

Александр Подмосковный, менеджер продукта по направлению машинного обучения и ИИ в Deckhouse компании «Флант», поддерживает коллег в том, что «экономику» целесообразно считать не по «железу», а по сценариям: «Бюджет стоит привязывать к следующим бизнес-метрикам: стоимость закрытого обращения, доля корректно обработанных документов и релевантность ответов на запросы (RAG + LLM). Важно при этом прозрачно выделять постоянные затраты (CAPEX, поддержка, электроэнергия, безопасность) и учитывать цену регуляторного риска. В такой модели локальная инсталляция дает предсказуемый бюджет, снижает внешние зависимости и позволяет сохранять интеллектуальную собственность внутри компании».

Экономическую оценку и обоснование целесообразности инвестиций в инфраструктуру для ИИ проводить можно и нужно. Бизнес не любит разбрасываться деньгами и не привык верить на слово. Правильная экономическая оценка не только придаст бизнесу уверенность в пользе инвестиций в ИИ, но и повысит его доверие к тому, что предлагают ИТ-специалисты.