16 Aug 2016, 08:13

Información general

Lugar y horarios:

Martes y Jueves de 17 a 20hs
Lab 30 (martes) y Aula 27 (jueves), FaMAF

Foro:

https://groups.google.com/forum/#!forum/aavc16

Contacto:

Jorge A. Sánchez
jsanchez@famaf.unc.edu.ar
+54 351 4334051 (int 415)

25 Aug 2016, 15:20

Clases

00. Introducción (pdf)

  • P. Cavanagh (1995) Vision is getting easier every day (pdf)

01. Introducción al procesamiento de imágenes (pdf)

  • Ejemplos en OpenCV+Python (.py)
  • Guías de instalación de OpenCV+Python en Ubuntu (link)

02. Detectores (pdf)

03. Descriptores (pdf)

  • Código para lectura de imágenes desde una cámara y cómputo/visualizazión de ORB (.py)
  • Tutorial sobre SIFT y sus etapas de procesamiento (link)

04. Matching. Estimación de transformaciones (pdf)

  • Código matching + estimación de homografías (.py)

05. Estimación robusta. Reconocimiento de instancias (pdf)

06. Modelos BoVW (pdf)

07. Clasificación. k-NN. SVMs lineales (pdf)

  • E. Rosch. Principles of categorization (pdf)
  • Z. C. Lipton. The deception of supervised learning (post)(paper)

08. SVMs no lineales. Kernels. Optimización via SGD. Algoritmo Pegasos (pdf)

09. Búsqueda y recuperación de imágenes (pdf)

  • R. Arandjelović and A. Zisserman. Three things everyone should know to improve object retrieval. CVPR 2012 (pdf)

10. Búsqueda y recuperación II. PCA. Cuantificadores de producto (pdf)

  • R. Arandjelović and A. Zisserman. All About VLAD, CVPR 2013
  • J. Delhumeau et al.. Revisiting the VLAD image representation. ACM Multimedia 2013
  • H. Jégou, M. Douze, and C. Schmid. Product quantization for nearest neighbor search. IEEE TPAMI 2011.

11. Detección (pdf)

12. Clasificadores probabilísticos. Regresión logística. (pdf)

13. Perceptrón. Redes feedforward. Backpropagation. (pdf)

14. Redes convolucionales (pdf)

  • V. Dumoulin and F. Visin. A guide to convolution arithmetic for deep learning (arXiv, github)

15. Funciones de activación. Inicialización y entrenamiento (pdf)

  • Funciones de activación (link)
  • An explanation of Xavier initialization (link)

16. Intro frameworks DL para visión (pdf)

  • Ejemplos LR y LeNet (zip)

** Visualización. Detección. Segmentación** (pdf)

25 Aug 2016, 15:20

Laboratorios

LAB 1: Clasificación de imágenes empleando modelos BoVW (py)

  • 03-OCT: BUGFIX en el .py

  • Slides con algunos temas que habían quedado pendientes (pdf)

  • Dataset: Fifteen Scenes Categories (zip).
    Svetlana Lazebnik, Cordelia Schmid, and Jean Ponce. (2006) Beyond Bags of Features: Spatial Pyramid Matching for Recognizing Natural Scene Categories. In: CVPR

  • Entregable: reporte con discusión de resultados y criterios de ajuste de parámetros (gráficas)

  • Fecha de entrega: 3-Octubre. Las entregas posteriores a esa fecha y hasta el 17-Octubre: -2 puntos. Después de esa fecha: -inf puntos.

  • Evaluación: Los ejercicios 0-4 son obligatorios (calificación máxima: 8). Los ejercicios marcados con * son opcionales. Haciendo 1 (2), le agrega 1 (2) punto(s) extra a la calificación. Haciendo >2 hay premio (TBD).

LAB 2: Recuperación y búsqueda (zip)

  • DEADLINE: 21-NOV

  • 17-NOV: Versión con tf-idf corregido++ (lab2_tfidf_v0.1.py)

  • 03-NOV: BUGFIX en el .py (índice en idf2)

  • 25-OCT: Código + enunciado

  • Ejemplo: cómputo de transformación afín entre dos imágenes (py)

  • Dataset: UKBench (link).
    Nister, D., & Stewenius, H. (2006). Scalable recognition with a vocabulary tree. In: CVPR

  • Entregable: reporte con discusión de resultados y criterios de ajuste de parámetros

  • Fecha de entrega: 8-Noviembre. Las entregas posteriores a esa fecha y hasta el 15-Nov: -2 puntos. Después de esa fecha: -inf puntos.

  • Evaluación: Los ejercicios 0-3 son obligatorios (calificación máxima: 9). Los ejercicios marcados con * son opcionales.

LAB 3: CNNs

  • Demo caffe en clase

18 Aug 2016, 10:13

Recursos

Libros:

  • Richard Szeliski (2010). Computer Vision: Algorithms and Applications (1st ed.). Springer. Draft disponible acá

  • Christopher M. Bishop (2006). Pattern Recognition and Machine Learning. Springer.

  • Kevin P. Murphy (2012). Machine Learning: A Probabilistic Perspective. MIT Press.

  • Christopher M. Bishop (1995). Neural networks for pattern recognition. Oxford University press.

  • Ian Goodfellow, Yoshua Bengio and Aaron Courville (2016). Deep Learning. MIT Press. Disponible acá

Papers

Listas de correo

Otros

14 Nov 2016, 08:13

Seminario (optativa Lic.)

Presentación final:

  • Fecha: Jueves 24/NOV en horario de clases

  • Modalidad: presentación de 15 minutos + 5 de preguntas

  • Preparar no más de 5 slides por presentación

  • Papers propuestos:

    • Learning to See by Moving, (2015). Agrawal et al. (Reyes)

    • Deep residual learning for image recognition (2016), K. He et al. (G. García)

    • Region-based convolutional networks for accurate object detection and segmentation (2016), R. Girshick et al. (Moresi)

    • Going deeper with convolutions (2015), C. Szegedy et al. (Piloni)

    • Fast R-CNN (2015), R. Girshick (Barotto)

    • Fully convolutional networks for semantic segmentation (2015), J. Long et al.

    • Very deep convolutional networks for large-scale image recognition (2014), K. Simonyan and A. Zisserman (Farías)

    • Visualizing and understanding convolutional networks (2014), M. Zeiler and R. Fergus (Peretti)

    • Learning a similarity metric discriminatively, with application to face verification (2005), Chopra et al. (Mazuecos)

    • cualquier otro tema/paper relacionado a machine/deep learning en visión