Lugar y horarios:
Martes y Jueves de 17 a 20hs
Lab 30 (martes) y Aula 27 (jueves), FaMAF
Foro:
Contacto:
Jorge A. Sánchez
jsanchez@famaf.unc.edu.ar
+54 351 4334051 (int 415)
Lugar y horarios:
Martes y Jueves de 17 a 20hs
Lab 30 (martes) y Aula 27 (jueves), FaMAF
Foro:
Contacto:
Jorge A. Sánchez
jsanchez@famaf.unc.edu.ar
+54 351 4334051 (int 415)
00. Introducción (pdf)
01. Introducción al procesamiento de imágenes (pdf)
02. Detectores (pdf)
03. Descriptores (pdf)
04. Matching. Estimación de transformaciones (pdf)
05. Estimación robusta. Reconocimiento de instancias (pdf)
06. Modelos BoVW (pdf)
07. Clasificación. k-NN. SVMs lineales (pdf)
08. SVMs no lineales. Kernels. Optimización via SGD. Algoritmo Pegasos (pdf)
09. Búsqueda y recuperación de imágenes (pdf)
10. Búsqueda y recuperación II. PCA. Cuantificadores de producto (pdf)
11. Detección (pdf)
12. Clasificadores probabilísticos. Regresión logística. (pdf)
13. Perceptrón. Redes feedforward. Backpropagation. (pdf)
14. Redes convolucionales (pdf)
15. Funciones de activación. Inicialización y entrenamiento (pdf)
16. Intro frameworks DL para visión (pdf)
** Visualización. Detección. Segmentación** (pdf)
LAB 1: Clasificación de imágenes empleando modelos BoVW (py)
03-OCT: BUGFIX en el .py
Slides con algunos temas que habían quedado pendientes (pdf)
Dataset: Fifteen Scenes Categories
(zip).
Svetlana Lazebnik, Cordelia Schmid, and Jean Ponce. (2006) Beyond Bags of
Features: Spatial Pyramid Matching for Recognizing Natural Scene
Categories. In: CVPR
Entregable: reporte con discusión de resultados y criterios de ajuste de parámetros (gráficas)
Fecha de entrega: 3-Octubre. Las entregas posteriores a esa fecha y hasta el 17-Octubre: -2 puntos. Después de esa fecha: -inf puntos.
Evaluación: Los ejercicios 0-4 son obligatorios (calificación máxima: 8). Los ejercicios marcados con * son opcionales. Haciendo 1 (2), le agrega 1 (2) punto(s) extra a la calificación. Haciendo >2 hay premio (TBD).
LAB 2: Recuperación y búsqueda (zip)
DEADLINE: 21-NOV
17-NOV: Versión con tf-idf corregido++ (lab2_tfidf_v0.1.py)
03-NOV: BUGFIX en el .py (índice en idf2)
25-OCT: Código + enunciado
Ejemplo: cómputo de transformación afín entre dos imágenes (py)
Dataset: UKBench (link).
Nister, D., & Stewenius, H. (2006). Scalable recognition with a vocabulary
tree. In: CVPR
Entregable: reporte con discusión de resultados y criterios de ajuste de parámetros
Fecha de entrega: 8-Noviembre. Las entregas posteriores a esa fecha y hasta el 15-Nov: -2 puntos. Después de esa fecha: -inf puntos.
Evaluación: Los ejercicios 0-3 son obligatorios (calificación máxima: 9). Los ejercicios marcados con * son opcionales.
LAB 3: CNNs
Libros:
Richard Szeliski (2010). Computer Vision: Algorithms and Applications (1st ed.). Springer. Draft disponible acá
Christopher M. Bishop (2006). Pattern Recognition and Machine Learning. Springer.
Kevin P. Murphy (2012). Machine Learning: A Probabilistic Perspective. MIT Press.
Christopher M. Bishop (1995). Neural networks for pattern recognition. Oxford University press.
Ian Goodfellow, Yoshua Bengio and Aaron Courville (2016). Deep Learning. MIT Press. Disponible acá
Papers
Listas de correo
Otros
Presentación final:
Fecha: Jueves 24/NOV en horario de clases
Modalidad: presentación de 15 minutos + 5 de preguntas
Preparar no más de 5 slides por presentación
Papers propuestos:
Learning to See by Moving, (2015). Agrawal et al. (Reyes)
Deep residual learning for image recognition (2016), K. He et al. (G. García)
Region-based convolutional networks for accurate object detection and segmentation (2016), R. Girshick et al. (Moresi)
Going deeper with convolutions (2015), C. Szegedy et al. (Piloni)
Fast R-CNN (2015), R. Girshick (Barotto)
Fully convolutional networks for semantic segmentation (2015), J. Long et al.
Very deep convolutional networks for large-scale image recognition (2014), K. Simonyan and A. Zisserman (Farías)
Visualizing and understanding convolutional networks (2014), M. Zeiler and R. Fergus (Peretti)
Learning a similarity metric discriminatively, with application to face verification (2005), Chopra et al. (Mazuecos)
cualquier otro tema/paper relacionado a machine/deep learning en visión