- Опубликовано
Презентация «После моделей — продукты: платформа»
- Автор
- Имя
- Reidman Digital VC
- Telegram
- Reidman Digital VC845 подписчиков190 постовПро венчур, ИИ, стартапы. О себе: руковожу подразделением по развитию цифрового бизнеса Ростелкома, корпоративным венчурным фондом XTech, вхожу в совет директоров ФРИИ. Пишите @DReidman
Презентация «После моделей — продукты: почему побеждает платформа, а не следующий миллиард параметров» от Василия Ершова и Артура Самигуллина (Yandex Cloud) рассказывает о тенденциях в развитии искусственного интеллекта (ИИ) в 2023-2024 годах, смене акцентов с моделей на платформы и продукты, вызовах рынка и ключевых технологических трендах.
Основные тезисы презентации
- Рекап индустрии за год: Продолжается рост крупных моделей ИИ, платформ, продуктов, агентов и интеграций. Архитектура ИИ-систем меняется — появляются новые подходы, такие как Retrieval-Augmented Generation (RAG, генерация с дополнением за счет поиска) и промт-инжиниринг (создание эффективных запросов к моделям).
- Рост затрат на генеративный ИИ: Затраты на обучение моделей, развёртывание и инфраструктуру значительно увеличились с 2023 по 2024 год. Вертикальный ИИ на уровне департаментов и горизонтальный ИИ набирают популярность.
- Рост интереса к AI-агентам: Растет количество научных публикаций, репозиториев, вакансий и поисковых запросов по AI-агентам. Агент — это программа, выполняющая задачи пользователя с автономией и возможностью взаимодействовать с разными сервисами.
- Коммодитизация больших языковых моделей (LLM, large language models): Производительность открытых и проприетарных LLM становится все более сопоставимой. Примеры: GPT-4, Claude, Llama, Gemini и другие.
- Гонка смещается к платформам и продуктам: Наиболее важным становится создание платформ, продукта и бизнес-применения, а не только масштабирование параметров моделей.
- Типы технологий и платформ для AI:
- Оркестраторы и Agent Runtimes для управления цепочками агентов и логикой.
- Продуктовые оболочки над агентами, акцентированные на пользовательский опыт (UX).
- Low-code платформы для быстрого создания AI-продуктов с минимальным кодированием.
- Технологические вызовы: Высокая стоимость GPU (графических процессоров), дефицит специалистов, сложность обучения и внедрения ML-моделей, обеспечение безопасности данных и соответствия законодательству РФ.
- Прогресс в открытых моделях vs проприетарных: Открытые веса и модели приближаются по качеству к проприетарным, что уменьшает зависимость от крупных владельцев данных и кода.
- Архитектура моделей как мульти-арендного сервиса (multi-tenant service) с динамическим распределением ресурсов GPU, кешированием и устойчивостью к сбоям.
- Контекст и качество моделей: Важную роль играют системы предварительной обработки данных (ETL — Extract, Transform, Load) и гибридный поиск для выдачи релевантного контекста. Необходим контроль качества через A/B тесты, трейсинг и аналитику.
- Безопасность ИИ: Нужны sandbox-среды, аудит логов, политика управления секретами, изоляция выполнения кода для предотвращения нарушений и обеспечения безопасности по российским стандартам.
- AI Studio Yandex Cloud решает основные сложности: совместное использование ресурсов (коммунальный инференс), low-code интеграции, мониторинг качества, безопасная среда исполнения.
Из подборки #ai
- Опубликовано
PERPLEXITY COMPUTER: 19 МОДЕЛЕЙ В ОДНОЙ СИСТЕМЕ
- Опубликовано
Рекламный ролик набрал 7 миллионов просмотров)
- Опубликовано
Ещё один кадр с панельной дискуссии Кибербезфорума
- Опубликовано
⏳
- Опубликовано
⏳
- Опубликовано
⏳
Свежие посты
- Опубликовано
PERPLEXITY COMPUTER: 19 МОДЕЛЕЙ В ОДНОЙ СИСТЕМЕ
- Опубликовано
Рекламный ролик набрал 7 миллионов просмотров)
- Опубликовано
КРИПТА + СТРАХОВАНИЕ: новые возможности рынка
- Опубликовано
🚀 ИЩЕМ РУКОВОДИТЕЛЯ ФИНТЕХ-НАПРАВЛЕНИЯ
- Опубликовано
30 ФИНТЕХ ТРЕНДОВ В 2026
- Опубликовано
30 ТРЕНДОВ, КОТОРЫЕ ПЕРЕКРОЯТ ФИНТЕХ В 2026
- Опубликовано
Ещё один кадр с панельной дискуссии Кибербезфорума
- Опубликовано









