Опубликовано: суббота, 4 октября 2025 г.

Презентация «После моделей — продукты: платформа»

Автор

Имя
DigitalVC
Telegram
telegram

DigitalVC

1779 подписчиков

387 постов

Развиваю цифровой бизнес Ростелекома, корпоративный венчурный фонд XTech, вхожу в совет директоров ФРИИ. Официальный канал X.Теx: https://t.me/DigitalStageXTech Пишите @DReidman 🔗 Я в Макс: http://bit.ly/4unwp5X

Презентация «После моделей — продукты: почему побеждает платформа, а не следующий миллиард параметров» от Василия Ершова и Артура Самигуллина (Yandex Cloud) рассказывает о тенденциях в развитии искусственного интеллекта (ИИ) в 2023-2024 годах, смене акцентов с моделей на платформы и продукты, вызовах рынка и ключевых технологических трендах.

Основные тезисы презентации

- Рекап индустрии за год: Продолжается рост крупных моделей ИИ, платформ, продуктов, агентов и интеграций. Архитектура ИИ-систем меняется — появляются новые подходы, такие как Retrieval-Augmented Generation (RAG, генерация с дополнением за счет поиска) и промт-инжиниринг (создание эффективных запросов к моделям). - Рост затрат на генеративный ИИ: Затраты на обучение моделей, развёртывание и инфраструктуру значительно увеличились с 2023 по 2024 год. Вертикальный ИИ на уровне департаментов и горизонтальный ИИ набирают популярность. - Рост интереса к AI-агентам: Растет количество научных публикаций, репозиториев, вакансий и поисковых запросов по AI-агентам. Агент — это программа, выполняющая задачи пользователя с автономией и возможностью взаимодействовать с разными сервисами. - Коммодитизация больших языковых моделей (LLM, large language models): Производительность открытых и проприетарных LLM становится все более сопоставимой. Примеры: GPT-4, Claude, Llama, Gemini и другие. - Гонка смещается к платформам и продуктам: Наиболее важным становится создание платформ, продукта и бизнес-применения, а не только масштабирование параметров моделей. - Типы технологий и платформ для AI: - Оркестраторы и Agent Runtimes для управления цепочками агентов и логикой. - Продуктовые оболочки над агентами, акцентированные на пользовательский опыт (UX). - Low-code платформы для быстрого создания AI-продуктов с минимальным кодированием. - Технологические вызовы: Высокая стоимость GPU (графических процессоров), дефицит специалистов, сложность обучения и внедрения ML-моделей, обеспечение безопасности данных и соответствия законодательству РФ. - Прогресс в открытых моделях vs проприетарных: Открытые веса и модели приближаются по качеству к проприетарным, что уменьшает зависимость от крупных владельцев данных и кода. - Архитектура моделей как мульти-арендного сервиса (multi-tenant service) с динамическим распределением ресурсов GPU, кешированием и устойчивостью к сбоям. - Контекст и качество моделей: Важную роль играют системы предварительной обработки данных (ETL — Extract, Transform, Load) и гибридный поиск для выдачи релевантного контекста. Необходим контроль качества через A/B тесты, трейсинг и аналитику. - Безопасность ИИ: Нужны sandbox-среды, аудит логов, политика управления секретами, изоляция выполнения кода для предотвращения нарушений и обеспечения безопасности по российским стандартам. - AI Studio Yandex Cloud решает основные сложности: совместное использование ресурсов (коммунальный инференс), low-code интеграции, мониторинг качества, безопасная среда исполнения.

Обсудить в Telegram

DigitalVC

1779 подписчиков

387 постов