Competencias y objetivos
Contexto de la asignatura para el curso 2024-25
Podemos considerar como minería de textos cualquier proceso automático cuyo fin sea extraer información relevante y no explícita de documentos escritos en lenguaje natural. La minería de textos guarda una estrecha relación con el procesamiento del lenguaje natural, disciplina casi tan antigua como la informática misma, que a su vez tiene relación con disciplinas como la lingüística, la computación o la inteligencia artificial. Esta asignatura explora tanto desde la perspectiva simbólica como del aprendizaje automático las técnicas y métodos actuales de recuperación y extracción de información a partir de grandes corpus de textos, así como algunas de sus aplicaciones más relevantes.
Competencias de la asignatura (verificadas por ANECA en grados y másteres oficiales) para el curso 2024-25
Competencias Transversales
- CT1 : Ser capaz de liderar proyectos relacionados con la Ciencia de Datos, así como dirigir equipos de trabajo
- CT2 : Mostrar competencias informáticas e informacionales en el ámbito de la ciencia de datos.
- CT3 : Reunir competencias en comunicación oral y escrita.
Competencias Generales
- CG1 : Aplicar los conocimientos adquiridos a problemas reales relacionados con la ciencia de datos.
- CG10 : Saber utilizar técnicas de la ciencia de datos para obtener nuevas relaciones y brindar información sobre problemas de investigación o procesos organizativos y respaldar la toma de decisiones.
- CG11 : Ser capaz de utilizar los principios de ingeniería y las modernas tecnologías informáticas para investigar, diseñar, implementar nuevas aplicaciones de la ciencia de datos.
- CG12 : Ser capaz de desarrollar experimentos, procesos, instrumentos, sistemas, infraestructuras durante todo el ciclo de vida de los datos.
- CG2 : Ser capaz de desarrollar y aprender de forma auto-dirigida o autónoma temas relacionados con la ciencia de datos.
- CG3 : Saber desenvolverse en contextos multidisciplinares y/o internacionales aportando soluciones desde el punto de vista de la ciencia de datos.
- CG4 : Conocer y aplicar en cada situación las responsabilidades sociales, éticas y legales vinculadas a la aplicación de los conocimientos de la ciencia de datos.
- CG5 : Saber gestionar la información y los recursos disponibles relacionados con ciencia de datos.
- CG6 : Ser capaz de adaptarse a entornos relacionados con la ciencia de datos, fomentando el trabajo en equipo, la creatividad, la capacidad crítica y el espíritu emprendedor.
- CG7 : Ser capaz de adaptarse al ambiente cambiante propio de la disciplina y de comprender y aplicar los nuevos avances técnicocientíficos relacionados con la ciencia de datos.
- CG8 : Saber proyectar, diseñar, desarrollar, implantar y mantener productos, aplicaciones y servicios relacionados con la ciencia de datos, teniendo en cuenta aspectos técnicos, económicos y de eficiencia.
- CG9 : Saber dirigir proyectos relacionados con la ciencia de datos, cumpliendo la normativa vigente y asegurando la calidad del servicio.
Competencias Específicas
- CE1 : Conocer en profundidad y manejar tecnologías de aprendizaje automático (machine learning), algoritmos, y herramientas (incluido el aprendizaje supervisado, no supervisado o reforzado).
- CE2 : Identificar y utilizar técnicas avanzadas de minería de datos y minería de textos.
- CE7 : Determinar y utilizar métodos efectivos de visualización y narración para crear paneles de control e informes de análisis de datos.
- CE8 : Analizar y utilizar métodos de procesamiento de lenguaje natural.
Competencias Básicas
- CB10 : Que los estudiantes posean las habilidades de aprendizaje que les permitan continuar estudiando de un modo que habrá de ser en gran medida autodirigido o autónomo.
- CB6 : Poseer y comprender conocimientos que aporten una base u oportunidad de ser originales en el desarrollo y/o aplicación de ideas, a menudo en un contexto de investigación
- CB7 : Que los estudiantes sepan aplicar los conocimientos adquiridos y su capacidad de resolución de problemas en entornos nuevos o poco conocidos dentro de contextos más amplios (o multidisciplinares) relacionados con su área de estudio
- CB8 : Que los estudiantes sean capaces de integrar conocimientos y enfrentarse a la complejidad de formular juicios a partir de una información que, siendo incompleta o limitada, incluya reflexiones sobre las responsabilidades sociales y éticas vinculadas a la aplicación de sus conocimientos y juicios
- CB9 : Que los estudiantes sepan comunicar sus conclusiones y los conocimientos y razones últimas que las sustentan a públicos especializados y no especializados de un modo claro y sin ambigüedades
Resultados de aprendizaje (Objetivos formativos)
- Conocer las principales técnicas de procesamiento del lenguaje natural para el análisis automático de textos y su utilidad en tareas de minería de textos.
- Saber procesar automáticamente corpus monolingües y plurilingües.
- Conocer los aspectos específicos de la aplicación de técnicas supervisadas y no supervisadas al análisis automático de textos.
- Saber aplicar a textos concretos diferentes modelos de recuperación de información, categorización y agrupación (clustering) de documentos, extracción de información, minería de opiniones y sentimientos, minería de textos plurilingües y otras posibles aplicaciones de la minería de textos.
Objetivos específicos indicados por el profesorado para el curso 2024-25
- Conocer las principales técnicas de procesamiento del lenguaje natural para el análisis automático de textos y su utilidad en tareas de minería de textos.
- Saber procesar automáticamente corpus monolingües y plurilingües.
- Conocer los aspectos específicos de la aplicación de técnicas supervisadas y no supervisadas al análisis automático de textos.
- Saber aplicar a textos concretos diferentes modelos de recuperación de información, categorización y agrupación (clustering) de documentos, extracción de información, minería de opiniones y sentimientos, minería de textos plurilingües y otras posibles aplicaciones de la minería de textos.
- Determinar el enfoque más adecuado para resolver una determinada tarea que implique el procesamiento de textos monolingües o multilingües.
- Desarrollar experimentos que evalúen la calidad de diferentes técnicas de procesamiento del lenguaje natural.
- Incorporar a una caja de herramientas personal las diferentes técnicas de pre y postprocesamiento necesarias para manipular eficientemente grandes cantidades de información textual.
Datos generales
Código:
43459
Profesor/a responsable:
Pérez Ortiz, Juan Antonio
Crdts. ECTS:
6,00
Créditos teóricos:
1,20
Créditos prácticos:
1,20
Carga no presencial:
3,60
Departamentos con docencia
-
Dep.:
LENGUAJES Y SISTEMAS INFORMATICOS
Área: LENGUAJES Y SISTEMAS INFORMATICOS
Créditos teóricos: 1,2
Créditos prácticos: 1,2
Este dep. es responsable de la asignatura.
Este dep. es responsable del acta.
Estudios en los que se imparte
-
MÁSTER UNIVERSITARIO EN CIENCIA DE DATOS
Tipo de asignatura: OBLIGATORIA (Curso: 1)