Competències i objectius
Context de l'assignatura per al curs 2024-25
Podemos considerar como minería de textos cualquier proceso automático cuyo fin sea extraer información relevante y no explícita de documentos escritos en lenguaje natural. La minería de textos guarda una estrecha relación con el procesamiento del lenguaje natural, disciplina casi tan antigua como la informática misma, que a su vez tiene relación con disciplinas como la lingüística, la computación o la inteligencia artificial. Esta asignatura explora tanto desde la perspectiva simbólica como del aprendizaje automático las técnicas y métodos actuales de recuperación y extracción de información a partir de grandes corpus de textos, así como algunas de sus aplicaciones más relevantes.
Competències de l'assignatura (verificades per ANECA en graus i màsters oficials) per al curs 2024-25
Competències transversals
- CT1 : Ser capaç de liderar projectes relacionats amb la Ciència de Dades, així com dirigir equips de treball
- CT2 : Mostrar competències informàtiques i informacionals en l'àmbit de la ciència de dades.
- CT3 : Reunir competències en comunicació oral i escrita.
Competències generals
- CG1 : Aplicar els coneixements adquirits a problemes reals relacionats amb la ciència de dades.
- CG10 : Saber utilitzar tècniques de la ciència de dades per a obtenir noves relacions i brindar informació sobre problemes d'investigació o processos organitzatius i recolzar la presa de decisions.
- CG11 : Ser capaç d'utilitzar els principis d'enginyeria i les modernes tecnologies informàtiques per a investigar, dissenyar, implementar noves aplicacions de la ciència de dades.
- CG12 : Ser capaç de desenvolupar experiments, processos, instruments, sistemes, infraestructures durant tot el cicle de vida de les dades.
- CG2 : Ser capaç de desenvolupar i aprendre de forma auto-dirigida o autònoma temes relacionats amb la ciència de dades.
- CG3 : Saber desembolicar-se en contextos multidisciplinaris i/o internacionals aportant solucions des del punt de vista de la ciència de dades.
- CG4 : Conèixer i aplicar en cada situació les responsabilitats socials, ètiques i legals vinculades a l'aplicació dels coneixements de la ciència de dades.
- CG5 : Saber gestionar la informació i els recursos disponibles relacionats amb ciència de dades.
- CG6 : Ser capaç d'adaptar-se a entorns relacionats amb la ciència de dades, fomentant el treball en equip, la creativitat, la capacitat crítica i l'esperit emprenedor.
- CG7 : Ser capaç d'adaptar-se a l'ambient canviant propi de la disciplina i de comprendre i aplicar els nous avanços técnicocientíficos relacionats amb la ciència de dades.
- CG8 : Saber projectar, dissenyar, desenvolupar, implantar i mantenir productes, aplicacions i serveis relacionats amb la ciència de dades, tenint en compte aspectes tècnics, econòmics i d'eficiència.
- CG9 : Saber dirigir projectes relacionats amb la ciència de dades, complint la normativa vigent i assegurant la qualitat del servei.
Competències Específiques
- CE1 : Conèixer en profunditat i manejar tecnologies d'aprenentatge automàtic (machine learning), algorismes, i eines (inclòs l'aprenentatge supervisat, no supervisat o reforçat).
- CE2 : Identificar i utilitzar tècniques avançades de mineria de dades i mineria de textos.
- CE7 : Determinar i utilitzar mètodes efectius de visualització i narració per a crear panells de control i informes d'anàlisis de dades.
- CE8 : Analitzar i utilitzar mètodes de processament de llenguatge natural.
Competències bàsiques
- CB10 : Que els estudiants posseïsquen les habilitats d'aprenentatge que els permeten continuar estudiant d'una manera que haurà de ser en gran manera autodirigido o autònom.
- CB6 : Posseir i comprendre coneixements que aporten una base o oportunitat de ser originals en el desenvolupament i/o aplicació d'idees, sovint en un context d'investigació
- CB7 : Que els estudiants sàpien aplicar els coneixements adquirits i la seua capacitat de resolució de problemes en entorns nous o poc coneguts dins de contextos més amplis (o multidisciplinaris) relacionats amb la seua àrea d'estudi
- CB8 : Que els estudiants siguen capaços d'integrar coneixements i enfrontar-se a la complexitat de formular judicis a partir d'una informació que, sent incompleta o limitada, incloga reflexions sobre les responsabilitats socials i ètiques vinculades a l'aplicació dels seus coneixements i judicis
- CB9 : Que els estudiants sàpien comunicar les seues conclusions i els coneixements i raons últimes que les sustenten a públics especialitzats i no especialitzats d'una manera clara i sense ambigüitats
Resultats d'aprenentatge (Objectius formatius)
- Conèixer les principals tècniques de processament del llenguatge natural per a l'anàlisi automàtica de textos i la seua utilitat en tasques de mineria de textos.
- Saber processar automàticament corpus monolingües i plurilingües.
- Conèixer els aspectes específics de l'aplicació de tècniques supervisades i no supervisades a l'anàlisi automàtica de textos.
- Saber aplicar a textos concrets diferents models de recuperació d'informació, categorització i agrupació (clustering) de documents, extracció d'informació, mineria d'opinions i sentiments, mineria de textos plurilingües i altres possibles aplicacions de la mineria de textos.
Objectius específics indicats pel professorat per al curs 2024-25
- Conocer las principales técnicas de procesamiento del lenguaje natural para el análisis automático de textos y su utilidad en tareas de minería de textos.
- Saber procesar automáticamente corpus monolingües y plurilingües.
- Conocer los aspectos específicos de la aplicación de técnicas supervisadas y no supervisadas al análisis automático de textos.
- Saber aplicar a textos concretos diferentes modelos de recuperación de información, categorización y agrupación (clustering) de documentos, extracción de información, minería de opiniones y sentimientos, minería de textos plurilingües y otras posibles aplicaciones de la minería de textos.
- Determinar el enfoque más adecuado para resolver una determinada tarea que implique el procesamiento de textos monolingües o multilingües.
- Desarrollar experimentos que evalúen la calidad de diferentes técnicas de procesamiento del lenguaje natural.
- Incorporar a una caja de herramientas personal las diferentes técnicas de pre y postprocesamiento necesarias para manipular eficientemente grandes cantidades de información textual.
Dades generals
Codi:
43459
Professor/a responsable:
Pérez Ortiz, Juan Antonio
Crèdits ECTS:
6,00
Crèdits teòrics:
1,20
Crèdits pràctics:
1,20
Càrrega no presencial:
3,60
Departaments amb docència
-
Dep.:
LLENGUATGES I SISTEMES INFORMATICS
Àrea: LLENGUATGES I SISTEMES INFORMATICS
Crèdits teòrics: 1,2
Crèdits pràctics: 1,2
Aquest departament és responsable de l'assignatura.
Aquest dep. és responsable de l'acta.
Estudis en què s'imparteix
-
MÀSTER UNIVERSITARI EN CIÈNCIA DE DADES
Tipus d'assignatura: OBLIGATÒRIA (Curs: 1)