jueves, 18 de febrero de 2010

Lecturas para la sexta clase

Saludos, nuevamente:

Las lecturas que pueden revisar después sobre los temas que vamos a ver hoy son:

1. Sobre corpus lingüísticos: en este texto, un lingüista computacional, Stefan Th. Gries (University of California at Santa Barbara) sostiene una conversación con un lingüista teórico,
Frederick Newmeyer (Simon Fraser University) sobre lo que es un corpus lingüístico.

2. Sobre etiquetados de corpus: Steven Bird (University of Melbourne) y Marc Liberman (University of Pennsylvania) trabajaron juntos en un proyecto sobre anotación morfo-sintáctica en corpus: el famoso PennTreeBank. En este artículo, detallan varias ideas interesantes sobre lo que es anotación sintáctica, además de buscar una propuesta "universal" (si eso es posible, claro).

3. Un capítulo de un libro del libro de Jurafsky y Martin, el cual explica cómo hacer una gramática formal para el inglés. Va mucho más allá del concepto de chunking, pero vale la pena leerlo, sobre todo porque ofrece una buena visión sobre cuál es el valor que tiene en PLN el análisis sintáctico.

Suerte con todo.

2 comentarios:

  1. Hola César, el vínculo para el artículo sobre "anotación sintáctica de Steven Bird y Marc Liberman" está roto o presenta alguna falla puesto que no logro acceder al documento.
    Gracias.

    ResponderEliminar
  2. Puedes acceder a este vínculo con Mozilla. Extrañamente algunos vínculos que no abren con Explorer se puede acceder a ellos con el navegador Mozilla.

    ResponderEliminar