¿Google o Amazon proporcionan API de reconocimiento facial que puede reconocer rostros de forma continua desde los videos en vivo?

Respuesta corta: no.

Respuesta más larga: no; si desea ver lo que ofrecen, escribí un artículo comparando todos los proveedores populares de reconocimiento facial. Incluye Amazon Rekognition y Google Vision , junto con muchos otros.

Aquí hay una comparación rápida de características:

Aquí hay extractos de la comparación:

API de Google Vision

VISIÓN GENERAL

Análisis de contenido. Clasifica imágenes y videos en miles de categorías. Parte de la plataforma en la nube de Google.

CARACTERÍSTICAS PRINCIPALES

  • Detecta contenido inapropiado.
  • Análisis de sentimiento de imagen (caras).
  • OCR e identificación automática del idioma.
  • ‘Video Intelligence’ – Escena, objeto y ‘entidades’.

CONSIDERACIONES

  • Solo informa 34 puntos de referencia faciales.
  • No es posible el reconocimiento facial.
  • Envíe imágenes solo sobre codificación Base64.
  • Tamaño máximo de imagen de 4 MB (menos de 2 megapíxeles).
  • 10 solicitudes por segundo máx.
  • 20m de imágenes por mes máx.
  • Solo API en la nube, sin SDK.
  • Clasificadores de emociones: alegría, tristeza, ira y sorpresa. Solo con ‘probabilidad’, no con intensidad.
  • 1-1000 imágenes gratis por mes.
  • 1001-5,000,000 imágenes $ 1.50 por 1000 imágenes.
  • 2 millones de imágenes / mes = solo $ 3000 de detección de rostros y detección limitada de emociones, no es posible el reconocimiento facial, no es posible el análisis de video de emociones.
  • Si agrega funciones adicionales, como detección de logotipos o propiedades de imagen, paga $ 1.50 / 1000 * por la cantidad de funciones que solicita.

COMENTARIOS

Una pequeña parte de Google Cloud Platform, sin capacidades de reconocimiento facial. Precios complejos, limitados por características combos. Sufre de la percepción del desarrollador de que, al igual que con otros servicios de Google, la API de Cloud Vision podría suspenderse fácilmente en cualquier momento. Esta reputación deriva de que Google desprecia los numerosos servicios SaaS a lo largo de los años.

Rekognition de Amazon

VISIÓN GENERAL

Aprendizaje profundo basado en el reconocimiento de imágenes. Parte del ecosistema AWS de Amazon. Basado en su adquisición de Orbeus en 01/12/2015, y relanzado el 30/11/16.

CARACTERÍSTICAS PRINCIPALES

  • Análisis de objetos y escenas.
  • Detección de rostro.
  • Reconocimiento facial.
  • Análisis de sentimientos faciales.

CONSIDERACIONES

  • El número máximo de caras procesadas en una imagen es 15.
  • El tamaño máximo de imagen almacenado como un objeto de Amazon S3 está limitado a 15 MB. La resolución mínima de píxeles para altura y ancho es de 80 píxeles.
  • El tamaño máximo de las imágenes como bytes sin procesar pasados ​​como parámetro a una API es de 5 MB.
  • Solo JPG y PNG: no se admiten formatos de video.
  • Sin análisis de emociones.
  • El número máximo de caras que puede almacenar en una colección de una sola cara es de 1 millón.
  • El máximo de coincidencias que la API de búsqueda devuelve es 4096.

COMENTARIOS

Amazon ha reubicado su adquisición de Orbeus como parte de su plataforma AWS y estas características de visión por computadora no son su enfoque principal. La plataforma está profundamente acoplada al ecosistema de AWS. Los usuarios que no sean de AWS tendrán dificultades para implementar Rekognition en sus productos.

Aquí hay un enlace al artículo completo → Reconocimiento facial: Kairos vs Microsoft vs Google vs Amazon vs OpenCV

[Descargo de responsabilidad: trabajo para Kairos]

¡Hay tantas API de reconocimiento facial por ahí que es importante asegurarse de seleccionar la mejor para su programa! Le daré una lista más completa de API de reconocimiento facial y luego profundizaré en lo que recomendaría para su caso de uso específico. Aquí hay algunas API de reconocimiento facial con las que he tenido una buena experiencia últimamente y que recomendaría:

  • Trueface.ai
  • EmoVu
  • Clarifai
  • Kairos
  • Microsoft Computer Vision
  • Reconocimiento facial de Animetrics

Cada API de reconocimiento facial es un poco diferente y manejará ciertos casos de uso mejor que otras API. Por ejemplo:

  • Si está buscando identificar caras, pero necesita asegurarse de que sea una cara real y no una imagen de una cara (por seguridad), Trueface.ai será ideal para usted porque incluye detección de falsificaciones.
  • Clarifai le permite entrenar sus propios modelos, lo que resultará útil cuando desee identificar características específicas en una imagen.
  • Si su aplicación necesita no solo encontrar una cara, sino también identificar los sentimientos en una cara, entonces recomendaría la API EmoVu. Hace un gran trabajo al identificar las emociones en las imágenes.

Para su caso de uso específico, buscaría en la API EmoVu. ¡Esta API ya tiene soporte para Video y sería una gran API para ti!

Otra opción sería tomar una instantánea de la transmisión de video en un intervalo y usarla con una de las otras API de reconocimiento facial. Debido a que la transmisión de reconocimiento facial no es extremadamente común, podría valer la pena hacer este método. Todo depende de en qué se basa su proyecto para la funcionalidad.

Actualización: también acabo de escribir una publicación de blog sobre las 10 principales API de reconocimiento facial de 2017, que incluye algunas características clave o casos de uso de cada API. Con suerte , este será un gran recurso para obtener más información sobre las API de reconocimiento facial.


Trabajo para RapidAPI, un mercado de API en línea que le permite encontrar, probar y conectarse a miles de API desde un mercado centralizado. Al usar RapidAPI, puede comparar estas API diferentes, ver cuál funciona mejor para su caso de uso e implementar la API en su programa en minutos. Haga clic aquí para obtener más información: RapidAPI

Aquí hay una demostración de reconocimiento facial y reconocimiento demográfico en un video en vivo. Creo que es bastante impresionante, ya que utiliza su cámara web para demostrar esta tecnología de visión por computadora en tiempo real: visión por computadora en tiempo real

Y aquí están los puntos finales que esta demostración utiliza como una API de reconocimiento de video en vivo

Puede usar el servicio Aws Rekognizion en combinación con la transcodificación elástica AWS