Competències i objectius

 

Context de l'assignatura per al curs 2020-21

Podemos considerar como minería de textos cualquier proceso automático cuyo fin sea extraer información relevante y no explícita de documentos escritos en lenguaje natural. La minería de textos guarda una estrecha relación con el procesamiento del lenguaje natural, disciplina casi tan antigua como la informática misma, que a su vez tiene relación con disciplinas como la lingüística, la computación o la inteligencia artificial. Esta asignatura explora tanto desde la perspectiva simbólica como del aprendizaje automático las técnicas y métodos actuales de recuperación y extracción de información a partir de grandes corpus de textos, así como algunas de sus aplicaciones más relevantes.

 

 

Competències de l'assignatura (verificades per ANECA en graus i màsters oficials)

Competències transversals

  • CT1 : Ser capaç de liderar projectes relacionats amb la Ciència de Dades, així com dirigir equips de treball
  • CT2 : Mostrar competències informàtiques i informacionals en l'àmbit de la ciència de dades.
  • CT3 : Reunir competències en comunicació oral i escrita.

 

Competències generals

  • CG1 : Aplicar els coneixements adquirits a problemes reals relacionats amb la ciència de dades.
  • CG10 : Saber utilitzar tècniques de la ciència de dades per a obtenir noves relacions i brindar informació sobre problemes d'investigació o processos organitzatius i recolzar la presa de decisions.
  • CG11 : Ser capaç d'utilitzar els principis d'enginyeria i les modernes tecnologies informàtiques per a investigar, dissenyar, implementar noves aplicacions de la ciència de dades.
  • CG12 : Ser capaç de desenvolupar experiments, processos, instruments, sistemes, infraestructures durant tot el cicle de vida de les dades.
  • CG2 : Ser capaç de desenvolupar i aprendre de forma auto-dirigida o autònoma temes relacionats amb la ciència de dades.
  • CG3 : Saber desembolicar-se en contextos multidisciplinaris i/o internacionals aportant solucions des del punt de vista de la ciència de dades.
  • CG4 : Conèixer i aplicar en cada situació les responsabilitats socials, ètiques i legals vinculades a l'aplicació dels coneixements de la ciència de dades.
  • CG5 : Saber gestionar la informació i els recursos disponibles relacionats amb ciència de dades.
  • CG6 : Ser capaç d'adaptar-se a entorns relacionats amb la ciència de dades, fomentant el treball en equip, la creativitat, la capacitat crítica i l'esperit emprenedor.
  • CG7 : Ser capaç d'adaptar-se a l'ambient canviant propi de la disciplina i de comprendre i aplicar els nous avanços técnicocientíficos relacionats amb la ciència de dades.
  • CG8 : Saber projectar, dissenyar, desenvolupar, implantar i mantenir productes, aplicacions i serveis relacionats amb la ciència de dades, tenint en compte aspectes tècnics, econòmics i d'eficiència.
  • CG9 : Saber dirigir projectes relacionats amb la ciència de dades, complint la normativa vigent i assegurant la qualitat del servei.

 

Competències Específiques

  • CE1 : Conèixer en profunditat i manejar tecnologies d'aprenentatge automàtic (machine learning), algorismes, i eines (inclòs l'aprenentatge supervisat, no supervisat o reforçat).
  • CE2 : Identificar i utilitzar tècniques avançades de mineria de dades i mineria de textos.
  • CE7 : Determinar i utilitzar mètodes efectius de visualització i narració per a crear panells de control i informes d'anàlisis de dades.
  • CE8 : Analitzar i utilitzar mètodes de processament de llenguatge natural.

 

Competències bàsiques

  • CB10 : Que els estudiants posseïsquen les habilitats d'aprenentatge que els permeten continuar estudiant d'una manera que haurà de ser en gran manera autodirigido o autònom.
  • CB6 : Posseir i comprendre coneixements que aporten una base o oportunitat de ser originals en el desenvolupament i/o aplicació d'idees, sovint en un context d'investigació
  • CB7 : Que els estudiants sàpien aplicar els coneixements adquirits i la seua capacitat de resolució de problemes en entorns nous o poc coneguts dins de contextos més amplis (o multidisciplinaris) relacionats amb la seua àrea d'estudi
  • CB8 : Que els estudiants siguen capaços d'integrar coneixements i enfrontar-se a la complexitat de formular judicis a partir d'una informació que, sent incompleta o limitada, incloga reflexions sobre les responsabilitats socials i ètiques vinculades a l'aplicació dels seus coneixements i judicis
  • CB9 : Que els estudiants sàpien comunicar les seues conclusions i els coneixements i raons últimes que les sustenten a públics especialitzats i no especialitzats d'una manera clara i sense ambigüitats

 

 

 

Resultats d'aprenentatge (Objectius formatius)

  • Conèixer les principals tècniques de processament del llenguatge natural per a l'anàlisi automàtica de textos i la seua utilitat en tasques de mineria de textos.
  • Saber processar automàticament corpus monolingües i plurilingües.
  • Conèixer els aspectes específics de l'aplicació de tècniques supervisades i no supervisades a l'anàlisi automàtica de textos.
  • Saber aplicar a textos concrets diferents models de recuperació d'informació, categorització i agrupació (clustering) de documents, extracció d'informació, mineria d'opinions i sentiments, mineria de textos plurilingües i altres possibles aplicacions de la mineria de textos.

 

 

Objectius específics indicats pel professorat per al curs 2020-21

- Conocer las principales técnicas de procesamiento del lenguaje natural para el análisis automático de textos y su utilidad en tareas de minería de textos.
- Saber procesar automáticamente corpus monolingües y plurilingües.
- Conocer los aspectos específicos de la aplicación de técnicas supervisadas y no supervisadas al análisis automático de textos.
- Saber aplicar a textos concretos diferentes modelos de recuperación de información, categorización y agrupación (clustering) de documentos, extracción de información, minería de opiniones y sentimientos, minería de textos plurilingües y otras posibles aplicaciones de la minería de textos.
- Determinar el enfoque más adecuado para resolver una determinada tarea que implique el procesamiento de textos monolingües o multilingües.
- Desarrollar experimentos que evalúen la calidad de diferentes técnicas de procesamiento del lenguaje natural.
- Incorporar a una caja de herramientas personal las diferentes técnicas de pre y postprocesamiento necesarias para manipular eficientemente grandes cantidades de información textual.

 

 

;

Dades generals

Codi: 43459
Professor/a responsable:
PEREZ ORTIZ, JUAN ANTONIO
Crèdits ECTS: 6,00
Crèdits teòrics: 1,20
Crèdits pràctics: 1,20
Càrrega no presencial: 3,60

Departaments amb docència

  • Dep.: LLENGUATGES I SISTEMES INFORMÀTICS
    Àrea: LLENGUATGES I SISTEMES INFORMÀTICS
    Crèdits teòrics: 1,2
    Crèdits pràctics: 1,2
    Aquest departament és responsable de l'assignatura.
    Aquest dep. és responsable de l'acta.

Estudis en què s'imparteix