Competències i objectius

 

Context de l'assignatura per al curs 2024-25

La asignatura está ubicada en el segundo semestre del Máster en Ciencia de Datos. Es de carácter obligatorio ya que en ella se imparten materias centrales en este Máster.

En particular, en Machine Learning se afrontará la resolución de problemas de aprendizaje complejos, que usualmente requieren de un gran volumen de datos de entrenamiento. Por ello nos centraremos en técnicas de "deep learning" (aprendizaje profundo). Un modelo profundo consiste en la optimización de una función objetivo (que mide la discrepancia entre la salida deseada y la obtenida por el modelo mientras se está entrenando). Entre la entrada de los datos y la respuesta se disponen una serie de capas conectadas por pesos cuya configuración afecta a la predicción. Por ello hablaremos de "redes neuronales" y comenzaremos viendo una arquitectura sencilla para entrar de lleno en los problemas asociados al proceso de optimización o SGD (Stochastic Gradient Descent): gestión de los datos (batches), desvanecimiento del gradiente, dropout, etc. Esto nos permitirá realizar un diagnóstico del proceso de aprendizaje de acuerdo con las métricas y estimar el nivel de sobre-aprendizaje. También veremos los retos a nivel de recursos (GPUs) que plantean estos modelos. 

Estudiaremos y practicaremos después diversas arquitecturas que son propias de ciertos problemas: 

* Redes convolucionales (CNNs), cuando los datos son ordenados (p.e. matriciales) y su escala es constante. Utilizadas frecuentemente en problemas de clasificación y segmentación de imágenes y videos ya que el proceso de optimización selecciona automáticamente las características que mejor van a clasificar o particionar dichas imágenes. Suelen ser modelos supervisados. Ejemplos: AlexNet, VGG, GoogleLeNet, ResNet, YOLO. Compararemos esas arquitecturas. Veremos las soluciones técnicas que se han adoptado (p.e. Tensor Flow) 

* Redes para datos no-ordenados (nubes de puntos, secuencias de palabras, grafos) es decir que no se pueden codificar matricialmente con una dimensión fija y de forma que las matrices sean fácilmente comparables). Estos datos surgen en problemas de lenguaje natural o de análisis de redes y la classificación de datos 3D (nos centraremos en dos estos últimos). Ejemplos: PointNet, node2vec, RNNs, LSTMs.

* Redes no-supervisadas.Para aquellos casos en donde no se disponga dey  datos de entrenamiento o bien no se requiera de ellos. En este sentido un auto-encoder sirve para extraer características, limpiar el ruido de los datos o embeber los datos en otro dominio donde sean más tratables. 

* Otros modelos: redes adversarias, aprendizaje por refuerzo, siamesas. Están relacionadas con otros problemas (p.e. el matching o emparejamiento de datos) o con otras formas de optimización (aprendizaje por refuerzo). 

También veremos otros aspectos del aprendizaje: semi-supervisado, transfer-learning, adaptación de dominio. Interpretación matemática de los modelos etc. 

Durante la asignatura se realizarán prácticas de la asignatura: Python y librerías (Keras,Tensor Flow, scikit learn), entornos. Propondremos el test y la modificación de ciertas arquitecturas y el análisis de sus beneficios y limitaciones. 

 

 

Competències de l'assignatura (verificades per ANECA en graus i màsters oficials) per al curs 2024-25

Competències transversals

  • CT1 : Ser capaç de liderar projectes relacionats amb la Ciència de Dades, així com dirigir equips de treball
  • CT2 : Mostrar competències informàtiques i informacionals en l'àmbit de la ciència de dades.
  • CT3 : Reunir competències en comunicació oral i escrita.

 

Competències generals

  • CG1 : Aplicar els coneixements adquirits a problemes reals relacionats amb la ciència de dades.
  • CG10 : Saber utilitzar tècniques de la ciència de dades per a obtenir noves relacions i brindar informació sobre problemes d'investigació o processos organitzatius i recolzar la presa de decisions.
  • CG11 : Ser capaç d'utilitzar els principis d'enginyeria i les modernes tecnologies informàtiques per a investigar, dissenyar, implementar noves aplicacions de la ciència de dades.
  • CG12 : Ser capaç de desenvolupar experiments, processos, instruments, sistemes, infraestructures durant tot el cicle de vida de les dades.
  • CG2 : Ser capaç de desenvolupar i aprendre de forma auto-dirigida o autònoma temes relacionats amb la ciència de dades.
  • CG5 : Saber gestionar la informació i els recursos disponibles relacionats amb ciència de dades.
  • CG6 : Ser capaç d'adaptar-se a entorns relacionats amb la ciència de dades, fomentant el treball en equip, la creativitat, la capacitat crítica i l'esperit emprenedor.
  • CG7 : Ser capaç d'adaptar-se a l'ambient canviant propi de la disciplina i de comprendre i aplicar els nous avanços técnicocientíficos relacionats amb la ciència de dades.
  • CG8 : Saber projectar, dissenyar, desenvolupar, implantar i mantenir productes, aplicacions i serveis relacionats amb la ciència de dades, tenint en compte aspectes tècnics, econòmics i d'eficiència.

 

Competències Específiques

  • CE1 : Conèixer en profunditat i manejar tecnologies d'aprenentatge automàtic (machine learning), algorismes, i eines (inclòs l'aprenentatge supervisat, no supervisat o reforçat).
  • CE13 : Dissenyar i utilitzar mètriques i tècniques per a la validació i comparació d'algorismes d'aprenentatge automàtic.
  • CE3 : Conèixer en profunditat i aplicar mètodes d'anàlisi predictiva, prescriptiu, descriptiu i analítica qualitativa.
  • CE6 : Determinar mètriques per a l'avaluació i validació d'anàlisi de dades.

 

Competències bàsiques

  • CB10 : Que els estudiants posseïsquen les habilitats d'aprenentatge que els permeten continuar estudiant d'una manera que haurà de ser en gran manera autodirigido o autònom.
  • CB6 : Posseir i comprendre coneixements que aporten una base o oportunitat de ser originals en el desenvolupament i/o aplicació d'idees, sovint en un context d'investigació
  • CB7 : Que els estudiants sàpien aplicar els coneixements adquirits i la seua capacitat de resolució de problemes en entorns nous o poc coneguts dins de contextos més amplis (o multidisciplinaris) relacionats amb la seua àrea d'estudi
  • CB8 : Que els estudiants siguen capaços d'integrar coneixements i enfrontar-se a la complexitat de formular judicis a partir d'una informació que, sent incompleta o limitada, incloga reflexions sobre les responsabilitats socials i ètiques vinculades a l'aplicació dels seus coneixements i judicis
  • CB9 : Que els estudiants sàpien comunicar les seues conclusions i els coneixements i raons últimes que les sustenten a públics especialitzats i no especialitzats d'una manera clara i sense ambigüitats

 

 

 

Resultats d'aprenentatge (Objectius formatius)

  • Maneig de les tècniques de machine learning profund (Deep Learning): classificació, regressió, clustering, segmentació.
  • Maneig de les tècniques de machine learning supervisat, no-supervisat, semi-supervisat.
  • Maneig de les tècniques per a la validació i comparació de models de machine learning.

 

 

Objectius específics indicats pel professorat per al curs 2024-25

Manejo de las técnicas de machine learning profundo (Deep Learning): clasificación, regresión, clustering, segmentación.
Manejo de las técnicas de machine learning supervisado, no-supervisado, semi-supervisado.
Manejo de las técnicas para la validación y comparación de modelos de machine learning.

 

 

Dades generals

Codi: 43457
Professor/a responsable:
ESCOLANO RUIZ, FRANCISCO JAVIER
Crèdits ECTS: 6,00
Crèdits teòrics: 1,20
Crèdits pràctics: 1,20
Càrrega no presencial: 3,60

Departaments amb docència

  • Dep.: LLENGUATGES I SISTEMES INFORMATICS
    Àrea: LLENGUATGES I SISTEMES INFORMATICS
    Crèdits teòrics: 0
    Crèdits pràctics: 0,6
  • Dep.: CIENCIA DE LA COMPUTACIO I INT. ARTIF.
    Àrea: CIENCIA DE LA COMPUTACIO, INTEL·LIGENCIA ARTIFICIA
    Crèdits teòrics: 1,2
    Crèdits pràctics: 0,6
    Aquest departament és responsable de l'assignatura.
    Aquest dep. és responsable de l'acta.

Estudis en què s'imparteix