miércoles, 24 de marzo de 2010

Material para la clase: 25/03/2010

Saludos a todos:

Ya están disponibles las láminas de la clase de hoy. Esta sesión (y otra más) estarán dedicadas al tema de la indización, enfocándonos principalmente en cómo aprovechar técnicas de PLN para hacer estar tarea.

Complementario a esto, aquí van algunas lecutras interesantes:

1. Un manual de indización escrito por James D. Anderson para la National Information Standards Organization.

2. Un artículo escrito por Isidoro Gil Leiva y José V. Rodríguez Muñoz, en donde tratan el uso de descriptores para tareas de indización.

3. Otro artículo de Gil Leiva y Rodríguez Muñoz, el cual muestra una panorámica sobre los distintos procesos de indización automática que se siguen hoy en día.

Finalmente, aquí va la referencia a un artículo en línea elaborado por
María Jesús Lamarca Lapuente, en donde ofrece una explicación muy clara sobre lo que es indización, y algunas relaciones que tiene con PLN: www.hipertexto.info/documentos/indiz_automat.htm.

Seguimos en contacto. Suerte con todo.




jueves, 18 de marzo de 2010

Material para la clase: 18/03/2010

Saludos:

Aquí están las láminas para la clase de hoy. Básicamente, se trata de un complemento a lo que vimos la sesión pasada sobre metadatos. En esta sesión, hoy trabajarán con XML.

Como material anexo, les presento las notas de un curso que dio Marti Hearst y colaboradores sobre metadados facetados, que es justo la integración de metadatos con sistemas de búsquedas que identifican facetas asociadas.

Suerte con todo.

jueves, 11 de marzo de 2010

Láminas para la clase: 11/03/2010

Saludos a todos:

Ya pueden acceder a las láminas de la clase de hoy, la cual estará dedicada a dar una panorámica general sobre metadados. Al respecto, algunas lecturas que pueden resultar interesantes son:

1. Un manual preparado por la National Information Standards Organization (NISO) de los Estados Unidos, en donde se explica qué es un metadato, y cuál su formato estandar.

2. Un artículo escrito por Eva María Méndez, de la Universidad Carlos III de Madrid, en donde plantea el uso de metadatos como un recurso para generar tesauros y otros recursos para clasificación de conocimiento.

3. Finalmente, un artículo en colaboración entre Achim Steinacker (University of Technology of Darmstadt, Alemania), Amir Gahvam (University of Ottawa, Canadá) y Ralf Steinmetz (GNRCIT, Alemania), en donde explican el uso de metadatos para crear recursos WEBs.

Nota: ¿avances con la tarea de la clase pasada? Espero ver sus propuestas.

Suerte con todo.



jueves, 4 de marzo de 2010

Láminas y lecturas para la clase: 04/03/2010

Saludos a todos:

Aquí están las láminas para la clase de hoy. Del mismo modo, las lecturas que la complementan son:

1. El capítulo 19 del manual de Jurafsky y Martin, el cual da una introducción a la semántica léxica computacional. Nota: Revisen la parte dedicada a relaciones léxicas (hiponimia, hiperonimia, meronimia, sinonimia, etc.), porque van a requerir saber estas relaciones para realizar la tarea que programamos hoy.

2. Un artículo escrito por Christiane Fellbaum (Princeton University), el cual describe a grandes rasgos qué es WordNet. El texto de Fellbaum puede darles pistas sobre cómo resolver la tarea de hoy.

3. Otro artículo, elaborado por Chris Baker, Charles Fillmore y John Lowe (Berkeley University), en donde describen de manera general el proyecto FrameNet.

4. Finalmente, un reporte elaborado por Marie-Claude L'Homme (Université de Montréal), en donde explica el Diccionario Fundamental para Informática (DiCoInfo). El texto está en francés. Otra opción es que revisen la versión en línea. La liga viene anotada en las láminas de la clase.

Suerte con todo.