Últimas noticias
Topic
Seleccionar todo
Corporate news
Cybersecurity
Partners
Thermal
AI
ColorVu
Events
Alarm
ESG
Access control
Traffic management
Solution
LED
Software
Deepinview cameras
8K
Audio
Sustainability
Video intercom
Video intercom
NVR 5.0
Turbo HD 8.0
EasyIP 4.0 Plus
SMB solutions
IFPD
WonderHub
Smart Collaboration
HikTech Star
Installer
General purpose servers
Year
Seleccionar todo
2025
2024
2023
2022
2021
2020
2019
2018
2017
Search news
Cancel
Topic
Seleccionar todo
Corporate news
Cybersecurity
Partners
Thermal
AI
ColorVu
Events
Alarm
ESG
Access control
Traffic management
Solution
LED
Software
Deepinview cameras
8K
Audio
Sustainability
Video intercom
Video intercom
NVR 5.0
Turbo HD 8.0
EasyIP 4.0 Plus
SMB solutions
IFPD
WonderHub
Smart Collaboration
HikTech Star
Installer
General purpose servers
Year
Seleccionar todo
2025
2024
2023
2022
2021
2020
2019
2018
2017
Reiniciar
ENVIAR

Cómo el aprendizaje profundo beneficia a la industria de la seguridad

Fuente: Tecnología Digital Hikvision

 

Los dispositivos de almacenamiento de datos en toda la industria de la seguridad se requieren rutinariamente para manejar una enorme cantidad y muchas capas de datos sin procesar. A medida que los proyectos de Safe City en diferentes tamaños se vuelven más frecuentes, la cantidad de nodos de vigilancia ha alcanzado los cientos de miles. Y debido al uso generalizado del monitoreo de alta definición, la cantidad de datos involucrados en la vigilancia de seguridad ha aumentado drásticamente en poco tiempo. La recopilación, el análisis y la aplicación eficientes de los datos y su uso inteligente se están volviendo cada vez más críticos en esta industria. Por lo tanto, mejorar la inteligencia de video parece ser un objetivo inevitable en toda la industria.

 

Los usuarios de seguridad esperan que su inversión en nuevos productos traiga aún más beneficios más allá de simplemente rastrear y rastrear a las personas de interés y la recopilación de evidencia después de un evento de seguridad. Algunos ejemplos de beneficios adicionales incluyen el uso de las últimas tecnologías para reemplazar la gran cantidad de mano de obra que anteriormente se requería para buscar imágenes de vigilancia, detectar datos anómalos y encontrar formas cada vez más eficientes de permitir que la vigilancia pase del rastreo posterior al incidente a alertas durante incidentes, o incluso alertas previas al incidente. Para satisfacer estas demandas, se requieren nuevas tecnologías. La videovigilancia inteligente ha estado disponible durante muchos años. Sin embargo, los resultados de su aplicación no han sido ideales. El surgimiento del aprendizaje profundo ha permitido que estas demandas se conviertan en realidad.

 

La insuficiencia de los algoritmos inteligentes tradicionales

La videovigilancia inteligente tradicional tiene requisitos especialmente estrictos para el fondo de una escena. La precisión del reconocimiento y análisis inteligente en escenarios comparables sigue siendo inconsistente. Esto se debe principalmente al hecho de que los algoritmos de análisis de video inteligente tradicionales aún tienen muchas fallas.

 

En un proceso de reconocimiento y análisis inteligente, como el reconocimiento facial humano, se requieren dos pasos clave: En primer lugar, se extraen las características y, en segundo lugar, se realiza el “aprendizaje de clasificación”.

 

El grado de precisión en este primer paso determina directamente la precisión del algoritmo. De hecho, la mayor parte de la carga de trabajo de cálculo y prueba del sistema se consume en esta parte. Las características de los algoritmos inteligentes tradicionales están diseñadas por humanos y siempre han sido muy subjetivas. Inevitablemente se omiten más características abstractas, aquellas que los seres humanos tienen dificultades para comprender o describir. Con ángulos e iluminación cambiantes, y especialmente cuando el tamaño de la muestra es enorme, muchas características pueden ser demasiado difíciles de detectar. Por lo tanto, si bien los algoritmos inteligentes tradicionales funcionan bien en entornos muy específicos, los cambios sutiles (calidad de la imagen, entorno, etc.) generan desafíos significativos para la precisión.

 

El segundo paso, el aprendizaje de clasificación, implica principalmente la detección de objetivos y el reconocimiento de atributos. A medida que aumenta la cantidad de categorías disponibles para la clasificación, también aumenta el nivel de dificultad.  Por lo tanto, las tecnologías de análisis inteligente tradicionales son altamente precisas en el análisis de vehículos, pero no en el análisis humano y de objetos. Por ejemplo, en la detección de vehículos, se hace una distinción entre un vehículo y un no vehículo, por lo que la clasificación es simple y el nivel de dificultad es bajo. Para reconocer los atributos del vehículo se requiere el reconocimiento de diferentes diseños de vehículos, logotipos, etc. Sin embargo, hay relativamente pocos de ellos, lo que hace que los resultados de la clasificación sean generalmente precisos. Por otro lado, si el reconocimiento se va a realizar en rostros humanos, cada persona es una clasificación propia, y las categorías correspondientes serán extremadamente numerosas, lo que naturalmente conducirá a un nivel muy alto de dificultad.

 

Los algoritmos inteligentes tradicionales generalmente utilizan modelos de aprendizaje poco profundo para manejar situaciones con grandes cantidades de datos en clasificaciones complejas. Los resultados del análisis están lejos de ser ideales. Además, estos resultados restringen directamente la amplitud y profundidad de las aplicaciones inteligentes y el desarrollo adicional. Por lo tanto, está surgiendo la necesidad de aumentar la “profundidad” de la inteligencia en big data para la industria de la seguridad.

 

Las ventajas del aprendizaje profundo y sus algoritmos

Los algoritmos inteligentes tradicionales están diseñados por humanos. El hecho de que estén bien diseñados o no depende en gran medida de la experiencia e incluso de la suerte, y este proceso requiere mucho tiempo. Entonces, ¿es posible conseguir máquinas para aprender automáticamente algunas de las características? ¡Sí! Este es en realidad el objetivo de la Inteligencia Artificial (IA).

 

La inspiración para el aprendizaje profundo proviene de las redes neuronales del cerebro humano. Nuestros cerebros pueden verse como un modelo de aprendizaje profundo muy complejo. Las redes neuronales cerebrales están compuestas por miles de millones de neuronas interconectadas; el aprendizaje profundo simula esta estructura. Estas redes multicapa pueden recopilar información y realizar las acciones correspondientes. También poseen la capacidad de abstracción y recreación de objetos.

 

El aprendizaje profundo es intrínsecamente diferente de otros algoritmos. La forma en que resuelve las insuficiencias de los algoritmos tradicionales se abarca en los siguientes aspectos.

Primero, de “poco profundo” a “profundo” 

El modeloalgorítmico para el aprendizaje profundo tiene una estructura mucho más profunda que las dos estructuras de tres capas de los algoritmos tradicionales. A veces, el número de capas puede llegar a más de cien, lo que le permite procesar grandes cantidades de datos en clasificaciones complejas. El aprendizaje profundo es muy similar al proceso de aprendizaje humano y tiene un proceso de absorción de características capa por capa. Cada capa tendrá una “ponderación” diferente, y esta ponderación refleja lo que se aprendió sobre los “componentes” de las imágenes. Cuanto mayor sea el nivel de la capa, más específicos serán los componentes.  Simulando el cerebro humano, una señal original en el aprendizaje profundo pasa a través de capas de procesamiento; a continuación, se necesita una comprensión parcial (poco profunda) a una abstracción general (profunda) donde podemos percibir el objeto.

 

Segundo, de “Características artificiales” a “Aprendizaje de características”

El aprendizaje profundo no requiere intervención manual, más bien se sirve de una computadora para que extraiga características por sí misma. De esta manera, puede extraer tantas características del objetivo como sea posible, incluidas características abstractas que son difíciles o imposibles de describir. Cuantas más características haya, más preciso será el reconocimiento y la clasificación. Algunos de los beneficios más directos que pueden aportar los algoritmos de aprendizaje profundo incluyen lograr una precisión de reconocimiento de patrones comparable o incluso mejor que la humana, sólidas capacidades antiinterferencia y la capacidad de clasificar y reconocer miles de características.

 

Factores clave del aprendizaje profundo

En total, hay tres razones principales por las que el aprendizaje profundo solo se hizo popular en los últimos años y no antes: la escala de los datos involucrados, la potencia informática y la arquitectura de red.

 

Las mejoras en el rendimiento de algoritmos basados en datos han acelerado el aprendizaje profundo en varias aplicaciones inteligentes en poco tiempo. Específicamente, con el aumento en la escala de datos, el rendimiento algorítmico también mejoró. En consecuencia, la experiencia del usuario ha mejorado y hay más usuarios involucrados, lo que facilita aún más una mayor escala de datos.

 

Los datos de videovigilancia constituyen el 60 % de los datos masivos, y la cantidad aumenta al 20 % anual. La velocidad y la escala de este logro se deben a la popularización de la videovigilancia de alta definición: la HD 1080p se está volviendo más común, y las resoluciones 4K y superiores se están aplicando gradualmente en muchas aplicaciones importantes.

 

Hikvision ha operado en la industria de la seguridad durante muchos años con sus propias capacidades de investigación y desarrollo, empleando grandes cantidades de datos reales de video e imágenes como muestras de capacitación. Con una gran cantidad de datos de buena calidad y más de cien miembros del equipo para etiquetar las imágenes de video, se han acumulado datos de muestra con millones de categorías. Con esta gran cantidad de datos de capacitación de calidad, los modelos de reconocimiento de patrones humanos, vehiculares y de objetos serán cada vez más precisos para el uso de la videovigilancia.

Además, las plataformas de hardware de alto rendimiento permiten una mayor potencia computacional. El modelo de aprendizaje profundo requiere una gran cantidad de muestras, lo que hace inevitable una gran cantidad de cálculos. En el pasado, los dispositivos de hardware eran incapaces de procesar modelos complejos de aprendizaje profundo con más de cien capas. En 2011, DeepMind de Google utilizó 1000 dispositivos con 16 000 CPU para simular una red neuronal con aproximadamente 1000 millones de neuronas. Hoy en día, solo se requieren unas pocas GPU para lograr el mismo tipo de potencia computacional con una iteración aún más rápida. El rápido desarrollo de GPU, supercomputadoras, computación en la nube y otras plataformas de hardware de alto rendimiento ha permitido que el aprendizaje profundo sea posible.

 

Finalmente, la arquitectura de red juega su propio papel en el avance del aprendizaje profundo. A través de la optimización constante de algoritmos de aprendizaje profundo, se puede lograr un mejor reconocimiento de objetivos. Para aplicaciones más complejas como el reconocimiento facial o en escenarios con diferentes luces, ángulos, posturas, expresiones, accesorios, resoluciones, etc., la arquitectura de red afectará la precisión del reconocimiento, es decir, cuantos más capas en algoritmos de aprendizaje profundo, mejor será el rendimiento. 

 

En 2016, Hikvision alcanzó el puesto número uno en la categoría de clasificación de escenas en el desafío de reconocimiento visual a gran escala ImageNet 2016. El equipo de Hikvision Research Institute utilizó redes de estilo inicial y redes residuales no tan profundas que se desempeñan mejor en un tiempo de capacitación considerablemente menor, según los experimentos de Hikvision para capacitación y pruebas. Además, la tecnología de reconocimiento óptico de caracteres (Optical Character Recognition, OCR) de Hikvision, basada en el aprendizaje profundo y dirigida por el Research Institute de la compañía, también ganó el primer precio en la competencia de lectura robusta ICDAR 2016. El equipo de Hikvision superó sustancialmente tanto a competidores nacionales como extranjeros fuertes en tres desafíos de reconocimiento de palabras, incluidas imágenes digitales nacidas, texto de escena enfocado y texto de escena incidental, lo que demuestra que la tecnología de reconocimiento de palabras de Hikvision alcanzó el nivel más alto del mundo.

 

Aplicación de productos de aprendizaje profundo

En los últimos dos años, la tecnología de aprendizaje profundo se ha destacado en reconocimiento del habla, visión por computadora, traducción de voz y mucho más. Incluso ha superado las capacidades humanas en las áreas de verificación facial y clasificación de imágenes; por lo tanto, ha sido muy respetado en el campo de la videovigilancia para la industria de la seguridad.

 

En la aplicación del video inteligente en la detección, el seguimiento y el reconocimiento de objetivos, el surgimiento del aprendizaje profundo ha tenido una profunda influencia. Al aplicar esas tres funciones, el aprendizaje profundo potencialmente afecta todos los aspectos de la industria de la videovigilancia de seguridad: detección facial, detección de vehículos, detección de vehículos no motores, reconocimiento facial, reconocimiento de marca de vehículos, detección de peatones, detección de características del cuerpo humano, detección facial anormal, seguimiento de múltiples objetivos, etc.

 

Estos tipos de funciones inteligentes requieren una serie de cámaras de vigilancia frontal, servidores back-end y otros productos que admiten algoritmos de aprendizaje profundo. En aplicaciones a pequeña escala, las cámaras frontales pueden operar directamente la extracción estructurada de características humanas y vehiculares, y decenas de miles de imágenes faciales humanas pueden almacenarse dentro de los dispositivos frontales para implementar la comparación facial directa, a fin de reducir los costos de comunicación con un servidor. En aplicaciones a gran escala, las cámaras front-end pueden funcionar con servidores back-end. Específicamente, la tarea de video estructurado es manejada por dispositivos front-end, lo que reduce la carga de trabajo para dispositivos back-end; también mejora la eficiencia de búsqueda y coincidencia de servidores back-end.

 

Este año, Hikvision pronto presentará una serie de productos con tecnología de aprendizaje profundo, como las cámaras de la serie DeepInview, que pueden detectar, reconocer y analizar con precisión las características y el comportamiento de seres humanos, vehículos y objetos, y que pueden utilizarse ampliamente en escenarios interiores y exteriores. Otro de los productos que vale la pena mencionar es la serie DeepInmind de NVR de Hikvision, que incorpora algoritmos avanzados de aprendizaje profundo e imita pensamientos y memoria humanos. Los productos DeepInmind cuentan con un modo NVR+GPU innovador, que conserva las ventajas de los NVR tradicionales y las funciones de análisis de video estructurado adicionales, que juntos mejoran en gran medida el valor del video.

 

El aprendizaje profundo es el siguiente nivel de desarrollo de IA. Es más allá del aprendizaje automático donde la clasificación supervisada de características y patrones se establece en algoritmos. El aprendizaje profundo incorpora principios no supervisados o de “autoaprendizaje”. Hikvision está desarrollando este concepto en sus propios algoritmos analíticos. La precisión mejorada es el resultado del aprendizaje de múltiples capas. La aplicación de este algoritmo en el reconocimiento facial, el reconocimiento de vehículos, el reconocimiento humano y otras plataformas mejorará significativamente el rendimiento del análisis.

Sala de prensa

Explore las últimas noticias, historias de clientes y perspectivas de la industria de Hikvision

Hikvision.com/es-la/ utiliza cookies estrictamente necesarias y tecnologías relacionadas para permitir que el sitio web funcione. Con su consentimiento, también nos gustaría utilizar cookies para observar y analizar los niveles de tráfico y otras métricas / mostrarle publicidad dirigida / mostrarle publicidad de acuerdo con su ubicación / adaptar el contenido de nuestro sitio web. Para obtener más información sobre las prácticas de cookies, consulte nuestra política de cookies.

Contáctenos
Hik-Partner Pro close
Hik-Partner Pro
Tu herramienta aliada Lee más
Hik-Partner Pro
Scan and download the app
Hik-Partner Pro
Hik-Partner Pro

Get a better browsing experience

You are using a web browser we don’t support. Please try one of the following options to have a better experience of our web content.