— Российский рынок компьютерного зрения к 2030 году удвоится до 45 млрд рублей и будет расти на 14% в год. Это много или мало?
— Это органический рост. Мы в компании «Биорг» уверены, что он может быть еще выше, но мешает отсутствие инфраструктуры, ригидность мышления.
Поясню. На крупный проект автоматизации уходит год и более. Можно ощутимо ускорить внедрение ИИ при условии, что люди готовы, процессы настроены, ожидания соответствуют возможностям технологии.
С появлением больших языковых моделей (LLM) часть заказчиков склонны переоценивать их способности: на ИИ смотрят, как на всемогущего волшебника из лампы. В целом, для линейных задач картина похожа: написал промпт, получил результат. В случае с крупной компанией одним промптом сыт не будешь, приходится погружаться в ее комплексные бизнес-процессы, учитывать набор учетных систем и подсистем, данные, которые поступают из разных источников, не всегда цифровых.
И только после аудита можно разработать и внедрить шаблон автоматизации. В таком контексте генеративный ИИ — только небольшая часть решения большой задачи, причем зачастую не самая принципиальная.
Недостаточно просто сказать: вот, мы разработали ПО — забирайте. Клиенты ценят понимание процессов на уровне «как есть» и экспертное предложение конкретных шагов по необходимым изменениям, которые приведут к целевому результату. Для ИТ-партнера важно изначально суметь увидеть полную картину. Рост рынка будет связан с подобными экспертными решениями.
Согласно исследованию Statista Market Insights, рост мирового рынка компьютерного зрения с 2024 по 2030 год составит 81%, а объем — $47 млрд. Почти половина этой суммы придется на распознавание изображений — крупнейший сегмент рынка.
По данным VisionLabs, в то же время российский рынок компьютерного зрения в 2030 году достигнет 49,61 млрд руб. По итогам 2024 года более половины российского рынка приходится на системы видеоаналитики, технологии оптического распознавания символов и интеллектуальной обработки документов и проекты безопасного города.
-
— Кто сейчас чаще заказывает проекты с компьютерным зрением, например, системой оцифровки документов, — бизнес, государство? Почему это важно для обычных граждан?
— Распознавание документов и изображений — межотраслевая потребность. Финсектор занимает примерно 32% рынка интеллектуальной обработки документов, но государство — основной драйвер и инвестор цифровизации, остальное делят госсектор, здравоохранение, логистика, производство. В каждой из перечисленных сфер работают наши технологии, которые ускоряют взаимодействие между людьми. Автоматизация рутины высвобождает человеческие ресурсы для творчества и решения сложных задач.
Для простых граждан это возможность, например, получить данные из архива или другого ведомства в 5-7 раз быстрее, для ведомств — реагировать на запросы граждан и предоставлять услуги в электронном виде, без очередей.
Технологии компьютерного зрения (computer vision, CV) — область искусственного интеллекта, связанная с анализом изображений и видео, в которой используют технологии машинного обучения для исследования множества данных. Задача — идентификация объектов, их классификация и принятие бизнес-решений на основе полученных данных.
-
— Какие выгоды бизнесу приносит внедрение решений для распознавания данных, какой эффект это дает для экономики?
— С нами партнеры развивают и инвестируют в свой собственный актив — данные. Получают не сырой массив, распознанный «как есть», а нормализованную информацию для принятия решений.
Мы освобождаем бизнес от рутины и «ручного» контроля. Остается больше времени на стратегическое планирование, взвешенные управленческие инициативы.
Следующий шаг — нам делегируют не только собственно «видение» и аналитику, но и часть решений. Например, доверят оценку добропорядочности нового пользователя.
Для банков нам удалось ускорить процесс скоринга в 20 раз и повысить конверсию заявок. Для предприятий — автоматизировать массовое трудоустройство — мы оформляем тысячу человек за день и не замечаем этой нагрузки. Для промышленности — можем «достать» из системы данные по эффективности транспортных ресурсов прямо в реальном времени. Для цифрового госуправления и госсервисов переводим аналоговые архивы в электронный вид — оцифровываем рукописи, документы со старыми шрифтами и чертежи для межведомственного обмена. Все вместе это дает добавленную стоимость данным, возможность создавать новые сервисы и рабочие места.
— На ваш взгляд, какие сегменты рынка распознавания покажут наибольший рост и какие решения будут наиболее востребованы?
— Удаленная идентификация физических лиц — технологии KYC (know your customer — знай своего клиента — прим. РБК) — набирает популярность из-за требований регулятора. Финансовые организация обязаны соблюдать требования ФЗ-115, им нужны системы, которые оперативно и четко распознают данные и проверят документы и изображения на фальсификацию. Растет роль «машинной» аналитики на производстве, таможне, в логистике.
Тренд на роботизацию даст импульс рынку компьютерного зрения. Машины, беспилотные системы, производственные роботы должны видеть, как человек: препятствия, местность, смещение шаблона. Роботам нужно уметь вовремя принять решения в условиях меняющихся внешних обстоятельств.
— Недавно «Биорг» выпустил новый KYC-продукт для удаленной идентификации пользователей, а также «коробочную» версию решения для распознавания документов, удостоверяющих личность. Что такое KYC-продукты и какие задачи они решают?
— KYC решение — когда нового пользователя сайта или приложения просят подтвердить, что он — тот, за кого себя выдает. Мы начинали с распознавания паспортов при удаленном оформлении банковских карт. Потом нас попросили сверять фото в паспорте с селфи человека, затем — проверять документы на фейк. С 2025 года мы предоставляем в России полноценный KYC-сервис с комплексными технологическими проверками, сверкой по базам и спискам.
Технология облегчает клиентский путь, повышает лояльность, помогает срезать косты на ручные проверки. С нами — пользователь загрузил документ и селфи, подождал пару минут, и все — задача идентификации решена. Это снимает желание закрыть приложение, бросить регистрацию, где надо вручную вводить много данных. Бизнес на технологическом уровне получает гарантии подлинности регистраций.
«Коробочная» версия ПО «Биорг» — это готовый модуль для извлечения данных из документов. Купил лицензию, развернул на своем сервере, и обрабатываешь документы, данные не передаются в облако. Это соответствует требованиям многих служб безопасности, а с установкой ПО справится системный администратор, не надо команды техспециалистов.
Мы всегда предлагаем клиенту выбор: SaaS-сервис — если нужен быстрый старт и масштабирование. Второй вариант — локальное ПО — для работы в закрытом контуре. Такая альтернатива дает гибкий подход к сценариям бизнеса и оптимальное соотношение цена-качество.
— Ваша умная система для нефтесервисной компании «ТНГ-Групп» была признана лучшим ИИ-проектом в нефтегазовой отрасли. Какие эффекты проект «Биорг» дал заказчику?
— Разработка для «ТНГ-Групп» — эталонный кейс анализа данных, которые ранее требовалось собирать по разным источникам вручную. Мы назвали систему «Умный транспорт», она помогает сэкономить 20 — 30% транспортных ресурсов по году.
Технология помогает отследить цепочку движения топлива от закупки до конкретной единицы техники, контролировать инциденты, оценить нагрузку на парк и на основе данных планировать закупку ресурсов. Аналитика представлена в формате дашборда, при необходимости перейти в более глубокий срез. Разработка уже приносит заказчику прямую прибыль — в виде экономии на ГСМ, — и косвенную — в виде удобства планирования ресурсов, подготовки отчетности за день, а не за неделю.
На этом примере видим, что простые услуги распознавания данных — это общее место. Больше ценят ИИ-решения, которые помогают извлечь информацию из данных, оптимизировать расходы.
— Насколько рынок распознавания монополизирован, какие решения предлагают разработчики? В чем уникальность технологического подхода «Биорг»?
— На рынке достаточно отечественных игроков, они предлагают решения на базе нейросетей на разных архитектурах, в основном, для стандартных документов вроде паспорта, водительского удостоверения, квитанции. Когда речь идет о распознавании сложных, рукописных или технических документов, наш подход — предложить сервис под ключ, что особенно ценят клиенты и партнеры.
«Биорг» умеет выдавать нормализованные и полноценные данные с качеством 99%+. Где сложность слишком высока, выводы ИИ сравниваются с результатами специалиста по верификации или даже нескольких. Так мы без ошибок переводим в цифровой вид сложные слабоструктурированные данные, рукописные книги.
Ошибки в такой истории недопустимы — представьте, что на потоке из десятков тысяч документов в день в МФЦ или банке одна ошибка на сто документов провоцирует тысячи перепроверок. Технология должна помогать, а не вредить.
— Несколько лет назад вы презентовали модель распознавания, сочетающую нейросети и краудсорсинговый сервис с 50 тыс. операторами по всей России. Изменилась ли концепция этой модели со временем?
— Основная идея этого проекта в непрерывном обучении ИИ на данных, которые в реальности часто неоднозначны, вызывают проблемы распознавания. Мы использовали собственную краудсорсинговую платформу.
Оператор исправлял ошибку алгоритма и создавал набор данных для переобучения. Через неделю система сама справлялась с тем, что раньше требовало перепроверки. Это замкнутый цикл непрерывного улучшения. Такую методику применяют крупнейшие компании мира, которые обучают собственные модели нейросети понимать различные вариации данных.
С 2018 года качество нашей технологии улучшилось в 50 раз. Сейчас на платформе работает около 1000 человек. Значительная часть уже не на процессах «Биорг», а на разметке данных для клиентов: разработчики нашли на платформе надежного партнера с проверенным инструментом для подготовки датасетов в целях обучения ИИ.
— Недавно вы анонсировали собственную платформу разметки данных для обучения ИИ, предоставили условно бесплатную модель ее использования для российских разработчиков и стартапов. Зачем нужен этот новый продукт и что он может принести компании?
— Разметка данных — когда человек или машина ставит метки на изображениях, текстах, видео для обучения нейросети. Оператор рисует рамку вокруг лица, автомобиля, светофора. Нейросеть видит тысячи таких примеров и учится узнавать объекты сама.
Без реальных данных нельзя качественно обучить ИИ и это по-прежнему одна из основных проблем отрасли. Если обучать на синтетических, сгенерированных массивах, модель будет галлюцинировать.
Платформа «Биорг.Разметка» позволяет создавать структурированные наборы данных под задачи в медицине, промышленности, беспилотном транспорте, финансах, нефтегазе, цифровом госуправлении.
Фримиум-модель (условно бесплатная) доступна для каждого: стартап в области компьютерного зрения без лишних расходов может построить первый прототип ИИ-приложения и показать его инвесторам. У нас разметку можно запустить всего за 10–15 минут, без инвестиций на входе.
Мы хотим, чтобы каждый разработчик в России мог легко и без барьеров начать создавать ИИ-решения. При этом делаем ставку на то, что успешный стартап вернется и купит разметку для десяти тысяч, ста тысяч, миллиона изображений. Крупные компании могут полностью делегировать разметку нам.
— Как вы финансируете новые разработки и как складывается экономика этих проектов?
— Мы вкладываемся в R&D из прибыли, без привлечения внешнего капитала.
За последние три года инвестиции в разработки растут. Это отражается на росте фонда оплаты труда, но мы убеждены, что инвестиции окупятся. Идеи для новых разработок зачастую подкидывают наши заказчики-партнеры.
По каким-то направлениям играем вдолгую — например «Биорг.Разметка» даст экономический эффект на горизонте 2-3 лет. KYC уже вырос в 15 раз и динамика будет только нарастать в последующем.
— Рынок ИИ в России достиг 170 млрд рублей в 2025 году и будет расти дальше. Где, по-вашему, проходит граница между автоматизацией рутины и теми решениями, которые должны оставаться за человеком?
— Я уверен, что если решение требует суждения, контекста, ответственности — слово всегда за человеком. Если речь о повторяющихся операциях, обработке и анализе больших объемов данных, то ИИ — великолепный помощник.
Когда ИИ делает жизнь людей проще — это верный подход. Если технология все усложняет, скажем, человек бьется с чат-ботом и не может час получить нужную информацию, хотя это минутный вопрос, или перепроверяет за системой распознавания — здесь ошибка, эксцесс исполнителя или разработчика технологии.
«Биорг» придерживается принципов прозрачности, обратной связи и иерархичности. Если ИИ ошибается, мы всегда знаем причину, и быстро даем обратную связь, дообучаем и контролируем систему, или снижаем уверенность в решении. Для критичных решений, например, в процессе сложной идентификации нового пользователя для финансовой транзакции, система иногда запрашивает финальное решение со стороны человека. Только таким образом можно применять ИИ в особо чувствительных сферах: на основании понятного свода правил и общего понятийного аппарата.
— Рынок интеллектуальной обработки документов (IDP) в мире оценили в 3 млрд долларов в 2025 году с среднегодовым прогнозом по темпу роста в 33,4%. Планируете ли выход на рынки других стран?
— Россия — это 1–2% от глобального рынка IDP. Через пару лет мы планируем выходить на рынки стран СНГ (Казахстан, Беларусь), Азии (Индия, Вьетнам), арабского мира. Не исключаю, что придет время, когда пойдем в Европу и США, хотя там работают мощные конкуренты, да и отношения у нас сейчас сложные.
Финансирование глобального расширения компании будет смешанное: часть из собственных средств, а для другой части потребуются инвестиции, которых до настоящего времени компания не привлекала. Будут ли они российскими или иностранными — посмотрим. Однако контроль за компанией, в любом случае, остается в России.
Реклама. Рекламодатель ООО «Биорг». ИНН 7724396261, erid:2SDnjdA5zQZ