Deep Learning para Visión

y aplicaciones

Objetivos

El objetivo de esta formación es conocer las últimas arquitecturas de Deep Learning aplicadas a visión por computador específicamente en los ámbitos de la detección de pose, la detección de objetos, segmentación, extracción de profundidad y la generación de modelos 3D con un enfoque teórico práctico.

Programa

1. Arquitecturas Avanzadas de Deep Learning (1.5 horas)

    • Estado del arte de Deep Learning en visión (Repaso de arquitecturas populares, últimas tendencias)
    • Modelos basados en Transformers (Vision Transformer)
    • Ejemplos prácticos

2. Detección de pose (1.5 horas)

    • Aproximaciones bottom-up y top-down
    • Detección de pose en 2D
    • Detección de pose en 3D
    • Ejemplos prácticos

 3. Frameworks relevantes en el estado del arte (2 horas)

    • Detección de objetos
    • Segmentación (Segment Anything Model, SAM)
    • Extracción de profundidad y normales
    • Transfer learning y fine-tuning de modelos pre-entrenados
    • Ejemplos prácticos

 4. Reconstrucción 3D (1 hora)

    • Estado del arte en reconstrucción 3D con NeRF (Neural Radiance Fields)
    • Ejemplos prácticos

 

A quién va dirigido

Está dirigido a entornos profesionales y/o académicos con un nivel intermedio-avanzado en el campo de visión por computador y Deep Learning.

Requisitos:

    • Fundamentos de Machine Learning: Comprender los conceptos y paradigmas de aprendizaje supervisado y no supervisado, incluyendo la diferencia entre ellos y cómo se aplican en problemas de visión.
    • Fundamentos de Deep Learning aplicados a visión: Estar familiarizado con los conceptos básicos de las redes neuronales profundas y su aplicación en problemas de visión por computador, así como conocer los fundamentos de las Redes Neuronales Convolucionales (CNN) y las arquitecturas más utilizadas.
    • Procesamiento de imágenes: Conocimientos sobre el procesamiento de imágenes, incluyendo conceptos como la convolución, la operación de stride, el padding, la normalización, espacios de color, aplicación de filtros,etc.
    • Python y bibliotecas de Deep Learning: Conocimientos básicos de programación en Python y estar familiarizados con bibliotecas populares de Deep Learning, como PyTorch.
    • Cuenta de gmail
    • Ordenador propio

Profesorado

    • David Abadía – Equipo Big Data y Sistemas Cognitivos del Instituto Tecnológico de Aragón.
    • Carlos Marañés – Equipo Big Data y Sistemas Cognitivos del Instituto Tecnológico de Aragón.

Horario, fecha y lugar

    • Duración total: 6h
    • Fechas: 14 y 15 de noviembre de 2023
    • Horario: 16 a 19h
    • Lugar: Instituto Tecnológico de Aragón. C/ María de Luna, 7 (edificio blanco), 50018 Zaragoza
    • Número máximo de asistentes: 15 personas

Inscripción

Los corresponsables del tratamiento de los datos tratados en el contexto del programa ARAGÓN EDIH a los efectos de lo dispuesto en la normativa de protección de datos personales son el INSTITUTO TECNOLÓGICO DE ARAGÓN, el INSTITUTO ARAGONÉS DE FOMENTO, la UNIVERSIDAD DE ZARAGOZA, la CONFEDERACIÓN DE EMPRESARIOS DE ARAGÓN, la CONFEDERACIÓN DE LA PEQUEÑA Y MEDIANA EMPRESA ARAGONESA, CÁMARAS ARAGÓN y el  CLÚSTER DE EMPRESAS TIC, ELECTRÓNICA Y TELECOMUNICACIONES DE ARAGÓN. Dichos datos serán tratados con la finalidad de realizar las tareas de gestión de la actividad formativa que está solicitando, así como la difusión, publicación externa y justificación del programa. También, si así lo consiente mediante la marcación de la casilla, serán utilizados para hacerle llegar la newsletter del proyecto AEDIH. Se podrán ejercer los derechos de acceso, rectificación, supresión y portabilidad de datos, de limitación y oposición a su tratamiento, de conformidad con los dispuesto en el RGPD, ante el INSTITUTO TECNOLÓGICO DE ARAGÓN, en calle María de Luna 7-8, 50018, Zaragoza. Vd. puede obtener información adicional sobre protección de datos en www.aragondih.com/privacidad.

(*) Los datos marcados son obligatorios. Si no rellena alguno de ellos, no podremos gestionar su inscripción en la actividad formativa.

Estos cursos son GRATUITOS y están financiados por: