Competencies and objectives
Course context for academic year 2024-25
La asignatura está ubicada en el segundo semestre del Máster en Ciencia de Datos. Es de carácter obligatorio ya que en ella se imparten materias centrales en este Máster.
En particular, en Machine Learning se afrontará la resolución de problemas de aprendizaje complejos, que usualmente requieren de un gran volumen de datos de entrenamiento. Por ello nos centraremos en técnicas de "deep learning" (aprendizaje profundo). Un modelo profundo consiste en la optimización de una función objetivo (que mide la discrepancia entre la salida deseada y la obtenida por el modelo mientras se está entrenando). Entre la entrada de los datos y la respuesta se disponen una serie de capas conectadas por pesos cuya configuración afecta a la predicción. Por ello hablaremos de "redes neuronales" y comenzaremos viendo una arquitectura sencilla para entrar de lleno en los problemas asociados al proceso de optimización o SGD (Stochastic Gradient Descent): gestión de los datos (batches), desvanecimiento del gradiente, dropout, etc. Esto nos permitirá realizar un diagnóstico del proceso de aprendizaje de acuerdo con las métricas y estimar el nivel de sobre-aprendizaje. También veremos los retos a nivel de recursos (GPUs) que plantean estos modelos.
Estudiaremos y practicaremos después diversas arquitecturas que son propias de ciertos problemas:
* Redes convolucionales (CNNs), cuando los datos son ordenados (p.e. matriciales) y su escala es constante. Utilizadas frecuentemente en problemas de clasificación y segmentación de imágenes y videos ya que el proceso de optimización selecciona automáticamente las características que mejor van a clasificar o particionar dichas imágenes. Suelen ser modelos supervisados. Ejemplos: AlexNet, VGG, GoogleLeNet, ResNet, YOLO. Compararemos esas arquitecturas. Veremos las soluciones técnicas que se han adoptado (p.e. Tensor Flow)
* Redes para datos no-ordenados (nubes de puntos, secuencias de palabras, grafos) es decir que no se pueden codificar matricialmente con una dimensión fija y de forma que las matrices sean fácilmente comparables). Estos datos surgen en problemas de lenguaje natural o de análisis de redes y la classificación de datos 3D (nos centraremos en dos estos últimos). Ejemplos: PointNet, node2vec, RNNs, LSTMs.
* Redes no-supervisadas.Para aquellos casos en donde no se disponga dey datos de entrenamiento o bien no se requiera de ellos. En este sentido un auto-encoder sirve para extraer características, limpiar el ruido de los datos o embeber los datos en otro dominio donde sean más tratables.
* Otros modelos: redes adversarias, aprendizaje por refuerzo, siamesas. Están relacionadas con otros problemas (p.e. el matching o emparejamiento de datos) o con otras formas de optimización (aprendizaje por refuerzo).
También veremos otros aspectos del aprendizaje: semi-supervisado, transfer-learning, adaptación de dominio. Interpretación matemática de los modelos etc.
Durante la asignatura se realizarán prácticas de la asignatura: Python y librerías (Keras,Tensor Flow, scikit learn), entornos. Propondremos el test y la modificación de ciertas arquitecturas y el análisis de sus beneficios y limitaciones.
Course content (verified by ANECA in official undergraduate and Master’s degrees) for academic year 2024-25
Transversal Competences
- CT1 : Ser capaz de liderar proyectos relacionados con la Ciencia de Datos, así como dirigir equipos de trabajo
- CT2 : Mostrar competencias informáticas e informacionales en el ámbito de la ciencia de datos.
- CT3 : Reunir competencias en comunicación oral y escrita.
General Competences
- CG1 : Aplicar los conocimientos adquiridos a problemas reales relacionados con la ciencia de datos.
- CG10 : Saber utilizar técnicas de la ciencia de datos para obtener nuevas relaciones y brindar información sobre problemas de investigación o procesos organizativos y respaldar la toma de decisiones.
- CG11 : Ser capaz de utilizar los principios de ingeniería y las modernas tecnologías informáticas para investigar, diseñar, implementar nuevas aplicaciones de la ciencia de datos.
- CG12 : Ser capaz de desarrollar experimentos, procesos, instrumentos, sistemas, infraestructuras durante todo el ciclo de vida de los datos.
- CG2 : Ser capaz de desarrollar y aprender de forma auto-dirigida o autónoma temas relacionados con la ciencia de datos.
- CG5 : Saber gestionar la información y los recursos disponibles relacionados con ciencia de datos.
- CG6 : Ser capaz de adaptarse a entornos relacionados con la ciencia de datos, fomentando el trabajo en equipo, la creatividad, la capacidad crítica y el espíritu emprendedor.
- CG7 : Ser capaz de adaptarse al ambiente cambiante propio de la disciplina y de comprender y aplicar los nuevos avances técnicocientíficos relacionados con la ciencia de datos.
- CG8 : Saber proyectar, diseñar, desarrollar, implantar y mantener productos, aplicaciones y servicios relacionados con la ciencia de datos, teniendo en cuenta aspectos técnicos, económicos y de eficiencia.
Specific Competences
- CE1 : Conocer en profundidad y manejar tecnologías de aprendizaje automático (machine learning), algoritmos, y herramientas (incluido el aprendizaje supervisado, no supervisado o reforzado).
- CE13 : Diseñar y utilizar métricas y técnicas para la validación y comparación de algoritmos de aprendizaje automático.
- CE3 : Conocer en profundidad y aplicar métodos de análisis predictivo, prescriptivo, descriptivo y analítica cualitativa.
- CE6 : Determinar métricas para la evaluación y validación de análisis de datos.
Basic Competences
- CB10 : That students possess the learning skills that allow them to continue studying in a way that will be largely self-directed or autonomous.
- CB6 : Possess and understand knowledge that provides a basis or opportunity to be original in the development and/or application of ideas, often in a research context
- CB7 : That students know how to apply the knowledge acquired and their ability to solve problems in new or little-known environments within broader (or multidisciplinary) contexts related to their area of ¿¿study
- CB8 : Students are able to integrate knowledge and deal with the complexity of making judgements on the basis of incomplete or limited information, including reflections on the social and ethical responsibilities associated with information which, while incomplete or limited, includes reflections on the social and ethical responsibilities linked to the application of their knowledge and judgements.
- CB9 : Students are able to communicate their conclusions and the ultimate knowledge and rationale behind them to specialist and non-specialist audiences in a clear and unambiguous way.
Learning outcomes (Training objectives)
No data
Specific objectives stated by the academic staff for academic year 2024-25
No data
General
Code:
43457
Lecturer responsible:
ESCOLANO RUIZ, FRANCISCO JAVIER
Credits ECTS:
6,00
Theoretical credits:
1,20
Practical credits:
1,20
Distance-base hours:
3,60
Departments involved
-
Dept:
LANGUAGES AND COMPUTING SYSTEMS
Area: LANGUAGES AND COMPUTING SYSTEMS
Theoretical credits: 0
Practical credits: 0,6 -
Dept:
SCIENCE OF COMPUTING AND ARTIFICIAL INTELLIGENCE
Area: CIENCIA DE LA COMPUTACIO, INTEL·LIGENCIA ARTIFICIA
Theoretical credits: 1,2
Practical credits: 0,6
This Dept. is responsible for the course.
This Dept. is responsible for the final mark record.
Study programmes where this course is taught
-
UNIVERSITY MASTER'S DEGREE IN DATA SCIENCE
Course type: COMPULSORY (Year: 1)