Cómo hacer la detección de objetos en un video en vivo usando Python

Los pasos básicos para esto (usando cualquier biblioteca) y problemas similares pueden ser los siguientes:

  1. Capture el fotograma del video
  2. Convierta la imagen en el espacio de color o la escala de grises necesarios
  3. Segmente el objeto y obtenga su imagen binaria.
  4. marca el contorno del objeto

Las técnicas de segmentación varían desde el color hasta las características de Haar y SVM.

El procesamiento de imágenes en python se puede hacer con cualquiera de OpenCV, Scikit y Scipy. Me gustaría mencionar sobre Adrian Rosebrock (Ph.D en Computer Science) aquí. Comenzó con los blogs y ahora ejecuta una startup llamada pyimagesearch. Sus tutoriales son más que útiles en todo tipo de proyectos para principiantes en visión artificial usando Python.

Aquí hay un enlace para una aplicación similar para detectar y rastrear el movimiento de la pelota de tenis.

Espero que esto ayude. Gracias por A2A!

Use OpenCV o dlib para la detección y el seguimiento de objetos. Aunque recomiendo dlib para el seguimiento, que tiene un excelente rastreador llamado rastreador de correlación. Intente usar cascadas de haar o clasificadores HOG para la detección de objetos. Estos son bastante básicos, aunque son bastante buenos pero no robustos trabajo. Si tiene tiempo intente entrenar su red neuronal para detectar objetos. No es difícil como piensas. Consulta los cursos de Coursera y Uudacity. Dan una idea bastante buena sobre qué es el aprendizaje automático y el aprendizaje profundo. En cuanto al marco, recomiendo tensorflow, aunque muchos en mi círculo de pares usan caffe. Esa es tu llamada.

Y la próxima vez sea específico sobre lo que significan los “objetos”. Debe ser muy específico al hablar sobre la visión por computadora.

Conozco dos métodos, y son muy utilizados, incluso puedes encontrar toneladas de trabajos de investigación sobre ellos.

Primer método: histograma de gradientes (HOG)

2do método – Cascadas Haar

OpenCV tiene módulos listos para estos métodos, tanto para Python como para C ++. Todo lo que tiene que hacer es entrenar al clasificador con el objeto que desea detectar. El proceso completo se puede encontrar en el sitio oficial de documentación de OpenCV.

Además, puede descargar el código de GitHub para ambos.

Nota: Otro método son los patrones binarios locales, pero no es tan bueno para la detección de objetos, aunque es bueno para la detección de rostros.

Puede usar la biblioteca openCV. Tiene API de Python.
También estoy trabajando en lo mismo. Debe consultar la documentación de openCV una vez.
http://opencv.org/

Busca un algoritmo RCNN rápido en github.