Как увеличить процент распознавания в СВН
Современные продвинутые системы для видеонаблюдения (сокращенно, СВН ) имеют в своем арсенале множество детекторов, которые в режиме реального времени анализируют видеопоток с камеры. Машинное зрение может искать в видеопотоке различные объекты или события, так что логично, что критерии их поиска тоже разнятся. Кроме того, внутренние алгоритмы действия даже внешне похожих функций могут отличаться. Вот и получается, что идентичные, казалось бы, модули работают по-разному и требуют разных внешних условий для работы. Например, утилиты для распознавания объектов используют свои «знания», заранее добавленные паттерны, для поиска нужных типов объектов, а базовый детектор движения, ответственный за обнаружение вторжения, зачастую полагается на анализ изменений пикселей в картинке.
Процент успешного распознавания в СВН, таким образом, зависит от того, обеспечены ли нужные условия для работы какой-то функции. Идеальные условия зависят от того, что мы пытаемся распознать: для выше упомянутого распознавателя объектов требуется вид сбоку, а для детектора движения будет лучше, если возможно будет исключить из области детектирования «лишние» движения теней, бликов и т.п.
Итак, каковы же практические советы, как увеличить процент распознавания СВН? В основном, улучшить распознавание поможет именно устранение обстоятельств, которые мешают успешной работе нужных функций. Так, можно разделить рекомендации на 3 основные категории:
Объектив камеры — это «глаза» машинного зрения, поэтому первое, на что стоит обратить внимание, если стоит задача увеличить точность распознавания в СВН — это расположение камеры; то, как она установлена.
Как мы уже упоминали выше, многие нейросетевые модули, основанные на технологиях искусственного интеллекта, используют в своей работе образцы-паттерны, полученные во время обучения, периодически сканируя видеопоток и сравнивая объекты в кадре со своей «базой знаний». Обучение модуля обычно учитывает характеристики объекта нужного типа и то, по каким признакам эффективнее всего выделять их из общего фона. Чаще всего это означает, что условия использования должны повторять условия обучения, чтобы обеспечить наивысшую точность распознавания. Одним из таких важных условий является позиция камеры.
Так, наиболее высокоточного распознавания лиц, эмоций и лицевых масок можно добиться, направив камеру прямо в лицо идущему человеку. Разумеется, современные СВН учитывают, что человеку свойственно поворачивать и наклонять голову, и могут компенсировать небольшой угол наклона; но, как ни крути, со спины эффективно распознать лицо не получится, поэтому, если стоит вопрос, как увеличить процент распознавания, рекомендуется расположить камеру как можно прямее по отношению к лицам. Похожие требования у другого интеллектуального модуля — распознавания автономеров: здесь также угол, под которым камера «видит» регистрационную табличку, рекомендуется сделать настолько близким к 0°, насколько возможно.
А вот для «Детектора скопления людей», занимающегося подсчетом пассажиров или обнаружением очередей, лучшей позицией для камеры является потолочное крепление, так, чтобы четко были видны головы и/или фигура человека. Модули «Слежение за спортивными событиями» и «Распознаватель Объектов» показывают лучшие результаты детекции и трекинга, когда камера «смотрит» на объекты сбоку. А вот для «Детектора движения» угол наклона камеры не столько важен, сколько наличие помех и «лишнего» движения в кадре (например, ложные сработки может вызывать свет фар автомобилей, проезжающих мимо зоны детектирования).
Из этого можно заключить, что чтобы увеличить точность распознавания, перед использованием того или иного функционала СВН стоит учесть рекомендации по позиционированию камеры.
Разные функции имеют различные требования к расположению камер
|
Логично, что «Слежение за спортивными событиями» не сможет повернуть камеру для слежения за мячом или игроками, если камера не имеет функции поворота. «Распознавание лиц» не сможет помочь с распознаванием лиц, если видимость будет нулевая (например, если камера не «видит» в темноте), а если изображение поступает в интеллектуальный модуль искаженным (например, с эффектом «рыбий глаз»), то объекты в кадре могут не совпадать с образцами из базы знаний искусственного интеллекта и, соответственно, плохо распознаваться. Все эти примеры объединяет единый тезис: свойства и настройки камеры могут оказывать непосредственное влияние на точность распознавания.
Какой же из этого можно сделать вывод? Чтобы оказать положительное влияние на точность распознавания в СВН, нужно устранить недостатки в настройках или свойствах камеры, например, добавив инфракрасный прожектор для лучшего освещения или применив коррекцию панорамного изображения Fisheye — к примеру, с помощью модуля Xeoma «Коррекция панорамного изображения».
Искажения по краям у камер с эффектом «рыбий глаз» может негативно сказаться на точности распознавания в СВН
|
«Motion blur» — это размытие изображения, появляющееся в видеопотоке при повороте камеры, воспроизведении сцен движения или быстро движущихся объектов. Такое размывание серьезно вредит процессу распознавания, поэтому борьба с данным эффектом может иметь критическое значение. Если движущиеся объекты на отдельных кадрах видеопотока вашей камеры получаются нечеткими, с размытыми очертаниями, шлейфом или другими искажениями, то, скорее всего, это приведет к ухудшению уровня распознавания и детекции. Это происходит от того, что компьютерное зрение может обратиться к видеопотоку в момент размытия и получить для анализа «испорченный» кадр, на котором, естественно, не сможет распознать объекты.
Наиболее частыми причинами размытия движущихся объектов в контексте СВН являются:
1) недостаточная скорость затвора (так называемая shutter speed) камеры, или
2) недостаточный битрейт видеопотока.
Скорость затвора должна быть пропорциональна скорости движения объектов; иными словами, чем быстрее движется объект в кадре, тем быстрее должен срабатывать затвор, чтобы успеть «поймать» его. Учитывая это, одна скорость срабатывания затвора может быть достаточной, чтобы распознавать идущих пешеходов, но давать эффект motion blur для более быстрых объектов как, например, номерной знак автомобиля на трассе или летящий через поле футбольный мяч. Поэтому, в случае появления размытий, рекомендуется по максимуму увеличить скорость затвора камеры.
Размытие кадров — это серьезная помеха успешному распознаванию
|
Дополнительно вопрос, как увеличить процент распознавания, помогут решить данные сопутствующие настройки:
Недостаточный для видеопотока битрейт часто вызывает искажения картинки и, следственно, приводит к снижению процента распознавания искусственным интеллектом. К тому же, поток с непропорционально низким битрейтом будет обладать чрезвычайно низкой детализацией, не справляясь с адекватной передачей всех оттенков и нюансов кадра, что также негативно сказывается на качестве работы машинного зрения.
Подходящий для потока битрейт можно измерить по общей формуле
Битрейт камеры в битах : (Ширина кадра х Высота кадра х Частота кадров)
Если результат подсчета окажется в пределах диапазона 0,1-0,15, то битрейт в большинстве случаев может называться адекватным и не должен вызывать смазывание движений в кадре. Однако, разумеется, в зависимости от наполнения «сцены» данная генерализированная формула может подойти не для любого потока.
Устранение смазываний картинки способно оказать волшебный эффект на точность распознавания в СВН, поэтому мы рекомендуем не пренебрегать этой возможностью.
Камера, которая прекрасно работала на распознавание какого-то объекта, может показать себя с совсем другой стороны в процессе распознавания другого типа объектов или события. Поэтому если манипуляции, описанные выше, не помогают повысить точность распознавания в вашей СВН, попробуйте сменить камеру на более подходящую к ситуации (например, с лучшим разрешением изображения, большей скоростью затвора и т.п.).
Такие программы для видеонаблюдения, как Xeoma, снабжены многоуровневыми оптимизациями процессов, так что даже традиционно считающийся очень «тяжелым» в плане нагрузки искусственный интеллект не создает перегрузок и «тормозов» системы. Но всё же для функций вроде распознавания дыма, огня, двойной авторизации FaceID и тому подобных, где любые, даже секундные задержки имеют критическое значение, рекомендуется подобрать достаточно мощное оборудование для плавного произведения компьютерных расчетов в режиме реального времени.
СВН Xeoma знаменита своей гибкостью: одну и ту же задачу зачастую можно выполнить разными способами. Поэтому, в случае возникновения проблем с распознаванием, рекомендуем связаться с нашей службой поддержки — возможно, мы сможем предложить другую реализацию вашей задачи способом, который будет показывать лучшие результаты в ваших условиях, или посоветуем настройки, которые помогут в той или иной ситуации (например, недавно добавленная опция «Предварительное обнаружение автомобиля» в модуле «Распознавание автономеров» Xeoma помогает повысить точность распознавания автомобильных номеров в сложных условиях).
Также, если после всех рекомендаций вопрос, как увеличить процент распознавания, будет еще актуален, мы можем провести дополнительное обучение нейросетей Xeoma на работу именно в ваших условиях (например, распознавать каски необычного цвета или в нужном сочетании с другими элементами защиты) — так уровень успешного распознавания можно довести до рекордных показателей.
Интеллектуальные модули в современным системах видеонаблюдения вроде Xeoma порой способны решать сложные задачи по неустанному анализу видеопотока, но для этого им нужно помочь, предоставив условия для работы, в которых будет достигаться максимально точное распознавание. Для этого внимательно изучите рекомендации по лучшим позиционированию и настройке камер, а также убедитесь, что изображение в СВН поступает чёткое, без размытий, и вы можете считать вопрос, как увеличить процент распознавания, закрытым.
О Xeoma:
Xeoma — программа для видеонаблюдения и задач, связанных с компьютерным зрением: от видеобезопасности до автоматизации бизнес-процессов, от «умного дома» до анализа посетителей.
Сильные стороны Xeoma — это прежде всего понятный без обучения интерфейс с модульной структурой, гибкость настроек, доступная стоимость, квалифицированный клиентоориентированный сервис, а также мощный набор профессиональных функций: от распознавания автомобильных номеров, лиц, эмоций, пола и возраста, типов объектов и звуков, пропавших или забытых предметов, до цикличной записи, интеграции с кассово-вычислительной техникой, решений для парковок, программ типа «безопасный город» и так далее.
Бонус: у Xeoma не только бесконечная бесплатная тестовая версия, но и полностью бесплатный постоянный режим работы без рекламы, надоедливых всплывающих окон с требованием пожертвований, а также выгодные доступные цены на коммерческие редакции.
Программа идеально подходит как для частного, так и для корпоративного видеонаблюдения, в том числе в крупных распределенных системах с тысячами камер. Узнайте больше о Xeoma и получите бесплатный тестовый период на странице Xeoma!
Попробуйте Xeoma с бесплатной тестовой лицензией. Для этого введите, пожалуйста, ваш email, на который необходимо прислать демо лицензию, и ваше имя в поля ниже и нажмите на кнопку «Получить лицензии на email».
Нашу политику конфиденциальности можно прочитать здесь
9 июня, 2022
Читайте также:
Дополнительные модули Xeoma — профессиональное видеонаблюдение и искусственный интеллект
Полное руководство по Xeoma
Снижаем нагрузку на процессор: инструкция