¿Google o Amazon proporcionan API de reconocimiento facial que puede reconocer rostros de forma continua desde los videos en vivo?

Respuesta corta: no.

Respuesta más larga: no; si desea ver lo que ofrecen, escribí un artículo comparando todos los proveedores populares de reconocimiento facial. Incluye Amazon Rekognition y Google Vision , junto con muchos otros.

Aquí hay una comparación rápida de características:

Si no pude ver una película en el cine, ¿hay alguna forma (legítima) de verla en lugar de esperar a que salga en Netflix o DVD?
Estoy vendiendo mi televisor, ¿cómo elimino mis cuentas de Netflix y Vudu?
¿Por qué no tenemos Netflix o un sitio web similar en India?
Tengo una plataforma de transmisión de video en los Estados Unidos y quiero comenzar a vender mis servicios en Europa Occidental y Rusia. ¿Qué necesito saber?
¿Por qué Ingrid Chung (analista de Goldman Sachs) no está cambiando su calificación de "Comprar" para Netflix?

Aquí hay extractos de la comparación:

API de Google Vision

VISIÓN GENERAL

Análisis de contenido. Clasifica imágenes y videos en miles de categorías. Parte de la plataforma en la nube de Google.

CARACTERÍSTICAS PRINCIPALES

Detecta contenido inapropiado.

Análisis de sentimiento de imagen (caras).

OCR e identificación automática del idioma.

‘Video Intelligence’ – Escena, objeto y ‘entidades’.

CONSIDERACIONES

Solo informa 34 puntos de referencia faciales.

No es posible el reconocimiento facial.

Envíe imágenes solo sobre codificación Base64.

Tamaño máximo de imagen de 4 MB (menos de 2 megapíxeles).

10 solicitudes por segundo máx.

20m de imágenes por mes máx.

Solo API en la nube, sin SDK.

Clasificadores de emociones: alegría, tristeza, ira y sorpresa. Solo con ‘probabilidad’, no con intensidad.

1-1000 imágenes gratis por mes.

1001-5,000,000 imágenes $ 1.50 por 1000 imágenes.

2 millones de imágenes / mes = solo $ 3000 de detección de rostros y detección limitada de emociones, no es posible el reconocimiento facial, no es posible el análisis de video de emociones.

Si agrega funciones adicionales, como detección de logotipos o propiedades de imagen, paga $ 1.50 / 1000 * por la cantidad de funciones que solicita.

COMENTARIOS

Una pequeña parte de Google Cloud Platform, sin capacidades de reconocimiento facial. Precios complejos, limitados por características combos. Sufre de la percepción del desarrollador de que, al igual que con otros servicios de Google, la API de Cloud Vision podría suspenderse fácilmente en cualquier momento. Esta reputación deriva de que Google desprecia los numerosos servicios SaaS a lo largo de los años.

Rekognition de Amazon

VISIÓN GENERAL

Aprendizaje profundo basado en el reconocimiento de imágenes. Parte del ecosistema AWS de Amazon. Basado en su adquisición de Orbeus en 01/12/2015, y relanzado el 30/11/16.

CARACTERÍSTICAS PRINCIPALES

Análisis de objetos y escenas.

Detección de rostro.

Reconocimiento facial.

Análisis de sentimientos faciales.

CONSIDERACIONES

El número máximo de caras procesadas en una imagen es 15.

El tamaño máximo de imagen almacenado como un objeto de Amazon S3 está limitado a 15 MB. La resolución mínima de píxeles para altura y ancho es de 80 píxeles.

El tamaño máximo de las imágenes como bytes sin procesar pasados como parámetro a una API es de 5 MB.

Solo JPG y PNG: no se admiten formatos de video.

Sin análisis de emociones.

El número máximo de caras que puede almacenar en una colección de una sola cara es de 1 millón.

El máximo de coincidencias que la API de búsqueda devuelve es 4096.

COMENTARIOS

Amazon ha reubicado su adquisición de Orbeus como parte de su plataforma AWS y estas características de visión por computadora no son su enfoque principal. La plataforma está profundamente acoplada al ecosistema de AWS. Los usuarios que no sean de AWS tendrán dificultades para implementar Rekognition en sus productos.

Aquí hay un enlace al artículo completo → Reconocimiento facial: Kairos vs Microsoft vs Google vs Amazon vs OpenCV

[Descargo de responsabilidad: trabajo para Kairos]

AmazonGoogleTransmisión de contenido de video

Cómo transmitir en vivo desde cualquier cámara a mi computadora portátil con más de 100 km

¿Puedo transmitir un DVD a mi Apple TV?

¿9anime es un sitio legal de transmisión de anime?

¿Cuál es la diferencia entre un arroyo y un lago?

¿Por qué los periódicos usan inglés periodístico difícil?

¿Por qué China y Rusia están en contra de los medios de comunicación occidentales?

¡Hay tantas API de reconocimiento facial por ahí que es importante asegurarse de seleccionar la mejor para su programa! Le daré una lista más completa de API de reconocimiento facial y luego profundizaré en lo que recomendaría para su caso de uso específico. Aquí hay algunas API de reconocimiento facial con las que he tenido una buena experiencia últimamente y que recomendaría:

Trueface.ai
EmoVu
Clarifai
Kairos
Microsoft Computer Vision
Reconocimiento facial de Animetrics

Cada API de reconocimiento facial es un poco diferente y manejará ciertos casos de uso mejor que otras API. Por ejemplo:

Si está buscando identificar caras, pero necesita asegurarse de que sea una cara real y no una imagen de una cara (por seguridad), Trueface.ai será ideal para usted porque incluye detección de falsificaciones.
Clarifai le permite entrenar sus propios modelos, lo que resultará útil cuando desee identificar características específicas en una imagen.
Si su aplicación necesita no solo encontrar una cara, sino también identificar los sentimientos en una cara, entonces recomendaría la API EmoVu. Hace un gran trabajo al identificar las emociones en las imágenes.

Para su caso de uso específico, buscaría en la API EmoVu. ¡Esta API ya tiene soporte para Video y sería una gran API para ti!

Otra opción sería tomar una instantánea de la transmisión de video en un intervalo y usarla con una de las otras API de reconocimiento facial. Debido a que la transmisión de reconocimiento facial no es extremadamente común, podría valer la pena hacer este método. Todo depende de en qué se basa su proyecto para la funcionalidad.

Actualización: también acabo de escribir una publicación de blog sobre las 10 principales API de reconocimiento facial de 2017, que incluye algunas características clave o casos de uso de cada API. Con suerte , este será un gran recurso para obtener más información sobre las API de reconocimiento facial.

Trabajo para RapidAPI, un mercado de API en línea que le permite encontrar, probar y conectarse a miles de API desde un mercado centralizado. Al usar RapidAPI, puede comparar estas API diferentes, ver cuál funciona mejor para su caso de uso e implementar la API en su programa en minutos. Haga clic aquí para obtener más información: RapidAPI

Ben Virdee-Chapman

Aquí hay una demostración de reconocimiento facial y reconocimiento demográfico en un video en vivo. Creo que es bastante impresionante, ya que utiliza su cámara web para demostrar esta tecnología de visión por computadora en tiempo real: visión por computadora en tiempo real

Y aquí están los puntos finales que esta demostración utiliza como una API de reconocimiento de video en vivo

Martin Rosselle

Puede usar el servicio Aws Rekognizion en combinación con la transcodificación elástica AWS

Ben Virdee-Chapman

More Interesting

¿Cuáles son algunos otros buenos sitios de transmisión como Netflix?

¿Cómo se llama el tiempo que se tarda en reproducir un video en vivo en una pantalla?

¿Cuáles son los pasos para la configuración inalámbrica de Roku?

¿Cómo va a tirar Disney su contenido de Netflix a los servicios de transmisión?

Supongamos que un servicio de transmisión de video en tiempo real de alta calidad admite 20 usuarios concurrentes, y la compresión MPEG se utiliza para permitir que el flujo de datos en promedio sea del 10% del tamaño de datos original. ¿Hay algún problema con el uso de TDM simple con esta secuencia MPEG?

¿Por qué el video de YouTube sigue almacenando en búfer?

¿Hay alguna transmisión de video en Nueva Zelanda o Australia?