Competencias y objetivos

 

Contexto de la asignatura para el curso 2024-25

Podemos considerar como minería de textos cualquier proceso automático cuyo fin sea extraer información relevante y no explícita de documentos escritos en lenguaje natural. La minería de textos guarda una estrecha relación con el procesamiento del lenguaje natural, disciplina casi tan antigua como la informática misma, que a su vez tiene relación con disciplinas como la lingüística, la computación o la inteligencia artificial. Esta asignatura explora tanto desde la perspectiva simbólica como del aprendizaje automático las técnicas y métodos actuales de recuperación y extracción de información a partir de grandes corpus de textos, así como algunas de sus aplicaciones más relevantes.

 

 

Competencias de la asignatura (verificadas por ANECA en grados y másteres oficiales) para el curso 2024-25

Competencias Transversales

  • CT1 : Ser capaz de liderar proyectos relacionados con la Ciencia de Datos, así como dirigir equipos de trabajo
  • CT2 : Mostrar competencias informáticas e informacionales en el ámbito de la ciencia de datos.
  • CT3 : Reunir competencias en comunicación oral y escrita.

 

Competencias Generales

  • CG1 : Aplicar los conocimientos adquiridos a problemas reales relacionados con la ciencia de datos.
  • CG10 : Saber utilizar técnicas de la ciencia de datos para obtener nuevas relaciones y brindar información sobre problemas de investigación o procesos organizativos y respaldar la toma de decisiones.
  • CG11 : Ser capaz de utilizar los principios de ingeniería y las modernas tecnologías informáticas para investigar, diseñar, implementar nuevas aplicaciones de la ciencia de datos.
  • CG12 : Ser capaz de desarrollar experimentos, procesos, instrumentos, sistemas, infraestructuras durante todo el ciclo de vida de los datos.
  • CG2 : Ser capaz de desarrollar y aprender de forma auto-dirigida o autónoma temas relacionados con la ciencia de datos.
  • CG3 : Saber desenvolverse en contextos multidisciplinares y/o internacionales aportando soluciones desde el punto de vista de la ciencia de datos.
  • CG4 : Conocer y aplicar en cada situación las responsabilidades sociales, éticas y legales vinculadas a la aplicación de los conocimientos de la ciencia de datos.
  • CG5 : Saber gestionar la información y los recursos disponibles relacionados con ciencia de datos.
  • CG6 : Ser capaz de adaptarse a entornos relacionados con la ciencia de datos, fomentando el trabajo en equipo, la creatividad, la capacidad crítica y el espíritu emprendedor.
  • CG7 : Ser capaz de adaptarse al ambiente cambiante propio de la disciplina y de comprender y aplicar los nuevos avances técnicocientíficos relacionados con la ciencia de datos.
  • CG8 : Saber proyectar, diseñar, desarrollar, implantar y mantener productos, aplicaciones y servicios relacionados con la ciencia de datos, teniendo en cuenta aspectos técnicos, económicos y de eficiencia.
  • CG9 : Saber dirigir proyectos relacionados con la ciencia de datos, cumpliendo la normativa vigente y asegurando la calidad del servicio.

 

Competencias Específicas

  • CE1 : Conocer en profundidad y manejar tecnologías de aprendizaje automático (machine learning), algoritmos, y herramientas (incluido el aprendizaje supervisado, no supervisado o reforzado).
  • CE2 : Identificar y utilizar técnicas avanzadas de minería de datos y minería de textos.
  • CE7 : Determinar y utilizar métodos efectivos de visualización y narración para crear paneles de control e informes de análisis de datos.
  • CE8 : Analizar y utilizar métodos de procesamiento de lenguaje natural.

 

Competencias Básicas

  • CB10 : Que los estudiantes posean las habilidades de aprendizaje que les permitan continuar estudiando de un modo que habrá de ser en gran medida autodirigido o autónomo.
  • CB6 : Poseer y comprender conocimientos que aporten una base u oportunidad de ser originales en el desarrollo y/o aplicación de ideas, a menudo en un contexto de investigación
  • CB7 : Que los estudiantes sepan aplicar los conocimientos adquiridos y su capacidad de resolución de problemas en entornos nuevos o poco conocidos dentro de contextos más amplios (o multidisciplinares) relacionados con su área de estudio
  • CB8 : Que los estudiantes sean capaces de integrar conocimientos y enfrentarse a la complejidad de formular juicios a partir de una información que, siendo incompleta o limitada, incluya reflexiones sobre las responsabilidades sociales y éticas vinculadas a la aplicación de sus conocimientos y juicios
  • CB9 : Que los estudiantes sepan comunicar sus conclusiones y los conocimientos y razones últimas que las sustentan a públicos especializados y no especializados de un modo claro y sin ambigüedades

 

 

 

Resultados de aprendizaje (Objetivos formativos)

 

Conocer las principales técnicas de procesamiento del lenguaje natural para el análisis automático de textos y su utilidad en tareas de minería de textos.
Saber procesar automáticamente corpus monolingües y plurilingües.
Conocer los aspectos específicos de la aplicación de técnicas supervisadas y no supervisadas al análisis automático de textos.
Saber aplicar a textos concretos diferentes modelos de recuperación de información, categorización y agrupación (clustering) de documentos, extracción
de información, minería de opiniones y sentimientos, minería de textos plurilingües y otras posibles aplicaciones de la minería de textos.
  • Conocer las principales técnicas de procesamiento del lenguaje natural para el análisis automático de textos y su utilidad en tareas de minería de textos.
  • Saber procesar automáticamente corpus monolingües y plurilingües.
  • Conocer los aspectos específicos de la aplicación de técnicas supervisadas y no supervisadas al análisis automático de textos.
  • Saber aplicar a textos concretos diferentes modelos de recuperación de información, categorización y agrupación (clustering) de documentos, extracción de información, minería de opiniones y sentimientos, minería de textos plurilingües y otras posibles aplicaciones de la minería de textos.

 

 

 

Objetivos específicos indicados por el profesorado para el curso 2024-25

- Conocer las principales técnicas de procesamiento del lenguaje natural para el análisis automático de textos y su utilidad en tareas de minería de textos.
- Saber procesar automáticamente corpus monolingües y plurilingües.
- Conocer los aspectos específicos de la aplicación de técnicas supervisadas y no supervisadas al análisis automático de textos.
- Saber aplicar a textos concretos diferentes modelos de recuperación de información, categorización y agrupación (clustering) de documentos, extracción de información, minería de opiniones y sentimientos, minería de textos plurilingües y otras posibles aplicaciones de la minería de textos.
- Determinar el enfoque más adecuado para resolver una determinada tarea que implique el procesamiento de textos monolingües o multilingües.
- Desarrollar experimentos que evalúen la calidad de diferentes técnicas de procesamiento del lenguaje natural.
- Incorporar a una caja de herramientas personal las diferentes técnicas de pre y postprocesamiento necesarias para manipular eficientemente grandes cantidades de información textual.

 

 

Datos generales

Código: 43459
Profesor/a responsable:
Pérez Ortiz, Juan Antonio
Crdts. ECTS: 6,00
Créditos teóricos: 1,20
Créditos prácticos: 1,20
Carga no presencial: 3,60

Departamentos con docencia

  • Dep.: LENGUAJES Y SISTEMAS INFORMATICOS
    Área: LENGUAJES Y SISTEMAS INFORMATICOS
    Créditos teóricos: 1,2
    Créditos prácticos: 1,2
    Este dep. es responsable de la asignatura.
    Este dep. es responsable del acta.

Estudios en los que se imparte