Competencies and objectives
Course context for academic year 2020-21
Esta asignatura, de carácter obligatorio y que se imparte en el primer semestre del primer curso, tiene como objetivo introducir y explicar, desde un enfoque estadístico, las ideas más importantes del aprendizaje automático (supervisado y no supervisado) en la Ciencia de Datos. Tras ilustrar con ejemplos los problemas de clasificación, regresión y análisis de conglomerados se procederá a su formalización en el marco de la teoría de la decisión. Como primera aproximación a los problemas de regresión y clasificación se presentarán los modelos lineales. En el marco de los modelos lineales se presentarán aspectos importantes del análisis que incluyen: la extracción y construcción de características y la reducción de la dimensionalidad; el problema del sobreajuste y los métodos de regularización; el problema de la selección y validación del modelo. También en el marco de los modelos lineales se introducirán tres herramientas de gran utilidad en estadística y aprendizaje automático: los kernels, la validación cruzada y el bootstrap. Como extensión de la regresión lineal se presentará la regresión no paramétrica. El curso terminará con una breve introducción a la inferencia Bayesiana y los métodos de Cadenas de Markov Monte Carlo (MCMC). La exposición de la teoría se completará con clases de prácticas con ordenador. En estas últimas, el alumno aprenderá el manejo del software R para la aplicación de los métodos estudiados en teoría a problemas reales. Los conocimientos previos requeridos para cursar con éxito la asignatura son los fundamentos de probabilidad, inferencia y optimización. Es aconsejable que los estudiantes que carezcan de dichos conocimientos cursen previamente la asignatura “Ampliación de Estadística y Optimización”.
Course content (verified by ANECA in official undergraduate and Master’s degrees) for academic year 2020-21
Transversal Competences
- CT1 : Ser capaz de liderar proyectos relacionados con la Ciencia de Datos, así como dirigir equipos de trabajo
- CT2 : Mostrar competencias informáticas e informacionales en el ámbito de la ciencia de datos.
- CT3 : Reunir competencias en comunicación oral y escrita.
General Competences
- CG1 : Aplicar los conocimientos adquiridos a problemas reales relacionados con la ciencia de datos.
- CG10 : Saber utilizar técnicas de la ciencia de datos para obtener nuevas relaciones y brindar información sobre problemas de investigación o procesos organizativos y respaldar la toma de decisiones.
- CG11 : Ser capaz de utilizar los principios de ingeniería y las modernas tecnologías informáticas para investigar, diseñar, implementar nuevas aplicaciones de la ciencia de datos.
- CG2 : Ser capaz de desarrollar y aprender de forma auto-dirigida o autónoma temas relacionados con la ciencia de datos.
- CG5 : Saber gestionar la información y los recursos disponibles relacionados con ciencia de datos.
- CG6 : Ser capaz de adaptarse a entornos relacionados con la ciencia de datos, fomentando el trabajo en equipo, la creatividad, la capacidad crítica y el espíritu emprendedor.
- CG7 : Ser capaz de adaptarse al ambiente cambiante propio de la disciplina y de comprender y aplicar los nuevos avances técnicocientíficos relacionados con la ciencia de datos.
- CG8 : Saber proyectar, diseñar, desarrollar, implantar y mantener productos, aplicaciones y servicios relacionados con la ciencia de datos, teniendo en cuenta aspectos técnicos, económicos y de eficiencia.
Specific Competences
- CE1 : Conocer en profundidad y manejar tecnologías de aprendizaje automático (machine learning), algoritmos, y herramientas (incluido el aprendizaje supervisado, no supervisado o reforzado).
- CE13 : Diseñar y utilizar métricas y técnicas para la validación y comparación de algoritmos de aprendizaje automático.
- CE3 : Conocer en profundidad y aplicar métodos de análisis predictivo, prescriptivo, descriptivo y analítica cualitativa.
Basic Competences
- CB10 : That students possess the learning skills that allow them to continue studying in a way that will be largely self-directed or autonomous.
- CB6 : Possess and understand knowledge that provides a basis or opportunity to be original in the development and/or application of ideas, often in a research context
- CB7 : That students know how to apply the knowledge acquired and their ability to solve problems in new or little-known environments within broader (or multidisciplinary) contexts related to their area of ¿¿study
- CB8 : Students are able to integrate knowledge and deal with the complexity of making judgements on the basis of incomplete or limited information, including reflections on the social and ethical responsibilities associated with information which, while incomplete or limited, includes reflections on the social and ethical responsibilities linked to the application of their knowledge and judgements.
- CB9 : Students are able to communicate their conclusions and the ultimate knowledge and rationale behind them to specialist and non-specialist audiences in a clear and unambiguous way.
Learning outcomes (Training objectives)
No data
Specific objectives stated by the academic staff for academic year 2020-21
No data
General
Code:
43455
Lecturer responsible:
TROTTINI, MARIO
Credits ECTS:
6,00
Theoretical credits:
1,20
Practical credits:
1,20
Distance-base hours:
3,60
Departments involved
-
Dept:
MATHEMATICS
Area: STATISTICS AND OPERATIONS RESEARCH
Theoretical credits: 1,2
Practical credits: 1,2
This Dept. is responsible for the course.
This Dept. is responsible for the final mark record.
Study programmes where this course is taught
-
UNIVERSITY MASTER'S DEGREE IN DATA SCIENCE
Course type: COMPULSORY (Year: 1)