Local cover image
Local cover image
Amazon cover image
Image from Amazon.com

El contenido de los documentos textuales : su análisis y representación mediante el lenguaje natural / José Antonio Moreiro González ; dirección editorial : Álvaro Díaz Huici ; producción : José Antonio Martín ; maquetación : María Álvarez Menéndez ; corrección : Silvia Sanz Bueno

By: Contributor(s): Material type: TextTextLanguage: Spanish Series: Biblioteconomía y Administración Cultural ; Número 97Publication details: Gijón, España : Trea, 2004Description: 291 p. : figurasISBN:
  • 84-9704-126-7
Subject(s): DDC classification:
  • 025.4 M838c 2004
Contents:
Introducción, 15.-- Análisis de contenido e intermediación documental, 21.-- Fases del proceso, 26.-- Texto y documento, 27.-- La organización de los textos: las macroestructuras, 28.-- Superestructura e identificación de las partes del texto, 31.-- El reconocimiento o lectura del documento, 35.-- Procesos inferenciales en la lectura, 37.-- Estrategias que seguir en la lectura de los textos, 40.-- Algunas recomendaciones para la reducción del texto, 44.-- El proceso de indización y su resultado: los índices, 47.-- Concepto de indización y su procedimiento, 47.-- Criterios y condiciones para una buena indización, 49.-- Entropía, 50.-- Procedencia de los términos, 50.-- Profundidad, 51.-- Índice de consistencia, 51.-- Otros indicadores y factores de evaluación, 52.-- Selección y asignación de términos, 54.-- Niveles de indización, 57.-- Los índices: su naturaleza y categorización, 58.-- Índices libres basados en palabras del texto, 61.-- Índices de documentos individuales, 61.-- Índices de colecciones de documentos, 64.-- Índices esquemáticos, 65.-- Índices de palabras y nombres, 67.-- Índices permutados, 68.-- Índices de unitérminos, 73.-- Índices de citas, 74.-- Índices basados en conceptos, 75.-- Índice analítico de libros, revistas y bibliografías, 75.-- Índices clasificados, 78.-- Sistemas de índices coordinados de recuperación de la información mediante operadores lógicos, 79.-- Boletines de índices sistemáticos, 85.-- Índices e Internes, 86.-- Indización con motores de búsqueda, 87.-- Recuperación por palabras clave en los motores de búsqueda, 88.-- Metadatos e indización de documentos digitales, 93.-- Hacia la recuperación conceptual en Internet, 97.-- La indización automática, 100.-- Los modelos extractivos de carácter estadístico y probabilístico, 103.-- Otras técnicas de discriminación de los términos: IDF; TPIDF; N-grams; Stemmers, 110.-- Métodos de agrupación y clasificación, 114.-- A. Métodos de agrupación basados en grafos Teóricos, 116.-- B. Métodos de agrupación basados en centros de nasas, 116.-- C. Clasificadores cienciométricos: método de Chen, 118.-- D. Representación mediante procesamiento vectorial, 119.-- E. Métodos con sistemas de aprendizaje, 120.-- Los modelos analíticos de carácter lingüístico, 122.-- Hacia el procesamiento inteligente, 127.-- Algunos programas de indización automática, 133.-- Los lenguajes que representan el contenido de los documentos, 141.-- Los lenguajes naturales, 143.-- La utilización documental del lenguaje natural, 144.-- Tipología de los lenguajes documentales, 146.-- La indización en lenguaje libre, 146.-- La indización mediante lenguajes controlados, 148.-- La información representada mediante tesauros, 151.-- Relaciones terminológicas, 152.-- Fases típicas en la construcción de un tesauro, 162.-- Superestructura del documento tesauro, 165.-- Tendencias en la construcción de tesauros, 167.-- Tesauros en línea, 170.-- Mapas conceptuales de redes semánticas, 175.-- Los topic maps, 178.-- Relación de los topic maps con otros recursos que representan el conocimiento, 188.-- Exigencias para la creación y gestión automática de tesauros: un modelo de aplicación, 194.-- Identificación y adquisición de componentes representativos de un dominio, 199.-- Filtrado de términos, 200.-- Obtención de relaciones entre componentes, 201.-- Integración de relaciones, 203.-- Dominio construido, 204.-- Hacia la generación automática de tesauros de verbos, 204.-- La representación codificada de la información, 209.-- Otros esquemas de representación de la información, 213.-- La representación del conocimiento en inteligencia artificial, 214.-- Las ontologías, 214.-- La representación según las técnicas de ingeniería de software, UML, 219.-- El resumen científico, 223.-- Naturaleza y fines del resumen científico, 223.-- Reglas básicas de la representación, 225.-- Principales modelos de resúmenes, 229.-- El paralelismo informativo según la representación macroestructural, 231.-- El resumen informativo, 232.-- El resumen indicativo, 234.-- Los resúmenes selectivos, 236.-- Resumen estadístico o tabular, 238.-- Los resúmenes críticos: las reseñas o recensiones, 238.-- Según el modo utilizado para la representación, 241.-- Transformacionales, 242.-- Exhaustivos, 242.-- Los que seleccionan, 242.-- Recopilativos, 242.-- De acuerdo con el mediador, 243.-- De mediador humano, 243.-- El resumen analítico, o de autor, 243.-- Los resúmenes de documentalista, 246.-- Resúmenes y procesamiento automático, 248.-- Los primeros métodos extractivos, 248.-- Los modelos lingüísticos y cognitivos, 255.-- La síntesis de documentos múltiples, 261.-- Los sistemas automáticos de elaboración de resúmenes y el PLN, 264.-- Proyectos y productos comerciales de resumen automático, 266.-- Criterios que evaluar en la elaboración de los resúmenes, 273.-- Grado de reutilización, 274.-- Traslado de la superestructura del original, 274.-- Calidad técnica de los resúmenes, 275.-- Tamaño de los resúmenes y densidad, 276.-- Indicadores de legibilidad de los resúmenes, 276.-- La cohesión ele los resúmenes, 277.-- Bibliografía básica, 279.
Summary: La inevitable intervención de las palabras en los procesos y resultados del análisis de contenido documental resalta la importancia que debemos dar a su estudio -bien sea desde las estructuras del lenguaje natural de partida y de la inmediata posibilidad de su uso libre-, a su estandarización como términos validados de los lenguajes controlados; ya en composición simple o sintagmática; bien como entrada aislada en un índice o formando parte de conjuntos encadenados; incluso cuando son consideradas como objetos de cuantificación probabilística y estadística, o bien analizadas mediante factores lingüísticos más propios y, desde luego, cuando figuran como elementos compositivos en los textos-resumen. Es deseable, pues, realizar acercamientos al análisis documental con una perspectiva lingüística, tanto para alcanzar sistemas de recuperación fiables, como para explicar lo sustantivo de la información documental, sin olvidarnos nunca de que esta relación entre la lingüística y la información-documentación está intermediada siempre por el fin de mejorar nuestro conocimiento sobre la organización, representación y recuperación de los contenidos presentes en los documentos, de forma muy especial en aquellos expresados mediante los textos. Se quiere así atender a la preocupación de los indizadores por establecer relaciones entre el lenguaje natural y los lenguajes documentales, y esto tanto desde la intervención humana como de la realizada con ordenadores, preocupación que vuelve a darse en el caso del resumen, cuando tienen que pasar del original a su representación moviéndose siempre dentro del lenguaje natural, aunque dentro de unas condiciones especiales derivadas de su finalidad comunicativa y de su atención a un dominio concreto.
List(s) this item appears in: Colección Archivística, Bibliotecología y Museografía
Tags from this library: No tags from this library for this title. Log in to add tags.
Star ratings
    Average rating: 0.0 (0 votes)
Holdings
Item type Current library Collection Call number Copy number Status Date due Barcode
Libros Libros Archivo General de la Nación - Departamento Hemeroteca-Biblioteca, Hemeroteca-Biblioteca Acervo general de Libros 025.4 M838c 2004 (Browse shelf(Opens below)) 1 Available 065481

Contiene: bibliografía

Introducción, 15.-- Análisis de contenido e intermediación documental, 21.-- Fases del proceso, 26.-- Texto y documento, 27.-- La organización de los textos: las macroestructuras, 28.-- Superestructura e identificación de las partes del texto, 31.-- El reconocimiento o lectura del documento, 35.-- Procesos inferenciales en la lectura, 37.-- Estrategias que seguir en la lectura de los textos, 40.-- Algunas recomendaciones para la reducción del texto, 44.-- El proceso de indización y su resultado: los índices, 47.-- Concepto de indización y su procedimiento, 47.-- Criterios y condiciones para una buena indización, 49.-- Entropía, 50.-- Procedencia de los términos, 50.-- Profundidad, 51.-- Índice de consistencia, 51.-- Otros indicadores y factores de evaluación, 52.-- Selección y asignación de términos, 54.-- Niveles de indización, 57.-- Los índices: su naturaleza y categorización, 58.-- Índices libres basados en palabras del texto, 61.-- Índices de documentos individuales, 61.-- Índices de colecciones de documentos, 64.-- Índices esquemáticos, 65.-- Índices de palabras y nombres, 67.-- Índices permutados, 68.-- Índices de unitérminos, 73.-- Índices de citas, 74.-- Índices basados en conceptos, 75.-- Índice analítico de libros, revistas y bibliografías, 75.-- Índices clasificados, 78.-- Sistemas de índices coordinados de recuperación de la información mediante operadores lógicos, 79.-- Boletines de índices sistemáticos, 85.-- Índices e Internes, 86.-- Indización con motores de búsqueda, 87.-- Recuperación por palabras clave en los motores de búsqueda, 88.-- Metadatos e indización de documentos digitales, 93.-- Hacia la recuperación conceptual en Internet, 97.-- La indización automática, 100.-- Los modelos extractivos de carácter estadístico y probabilístico, 103.-- Otras técnicas de discriminación de los términos: IDF; TPIDF; N-grams; Stemmers, 110.-- Métodos de agrupación y clasificación, 114.-- A. Métodos de agrupación basados en grafos Teóricos, 116.-- B. Métodos de agrupación basados en centros de nasas, 116.-- C. Clasificadores cienciométricos: método de Chen, 118.-- D. Representación mediante procesamiento vectorial, 119.-- E. Métodos con sistemas de aprendizaje, 120.-- Los modelos analíticos de carácter lingüístico, 122.-- Hacia el procesamiento inteligente, 127.-- Algunos programas de indización automática, 133.-- Los lenguajes que representan el contenido de los documentos, 141.-- Los lenguajes naturales, 143.-- La utilización documental del lenguaje natural, 144.-- Tipología de los lenguajes documentales, 146.-- La indización en lenguaje libre, 146.-- La indización mediante lenguajes controlados, 148.-- La información representada mediante tesauros, 151.-- Relaciones terminológicas, 152.-- Fases típicas en la construcción de un tesauro, 162.-- Superestructura del documento tesauro, 165.-- Tendencias en la construcción de tesauros, 167.-- Tesauros en línea, 170.-- Mapas conceptuales de redes semánticas, 175.-- Los topic maps, 178.-- Relación de los topic maps con otros recursos que representan el conocimiento, 188.-- Exigencias para la creación y gestión automática de tesauros: un modelo de aplicación, 194.-- Identificación y adquisición de componentes representativos de un dominio, 199.-- Filtrado de términos, 200.-- Obtención de relaciones entre componentes, 201.-- Integración de relaciones, 203.-- Dominio construido, 204.-- Hacia la generación automática de tesauros de verbos, 204.-- La representación codificada de la información, 209.-- Otros esquemas de representación de la información, 213.-- La representación del conocimiento en inteligencia artificial, 214.-- Las ontologías, 214.-- La representación según las técnicas de ingeniería de software, UML, 219.-- El resumen científico, 223.-- Naturaleza y fines del resumen científico, 223.-- Reglas básicas de la representación, 225.-- Principales modelos de resúmenes, 229.-- El paralelismo informativo según la representación macroestructural, 231.-- El resumen informativo, 232.-- El resumen indicativo, 234.-- Los resúmenes selectivos, 236.-- Resumen estadístico o tabular, 238.-- Los resúmenes críticos: las reseñas o recensiones, 238.-- Según el modo utilizado para la representación, 241.-- Transformacionales, 242.-- Exhaustivos, 242.-- Los que seleccionan, 242.-- Recopilativos, 242.-- De acuerdo con el mediador, 243.-- De mediador humano, 243.-- El resumen analítico, o de autor, 243.-- Los resúmenes de documentalista, 246.-- Resúmenes y procesamiento automático, 248.-- Los primeros métodos extractivos, 248.-- Los modelos lingüísticos y cognitivos, 255.-- La síntesis de documentos múltiples, 261.-- Los sistemas automáticos de elaboración de resúmenes y el PLN, 264.-- Proyectos y productos comerciales de resumen automático, 266.-- Criterios que evaluar en la elaboración de los resúmenes, 273.-- Grado de reutilización, 274.-- Traslado de la superestructura del original, 274.-- Calidad técnica de los resúmenes, 275.-- Tamaño de los resúmenes y densidad, 276.-- Indicadores de legibilidad de los resúmenes, 276.-- La cohesión ele los resúmenes, 277.-- Bibliografía básica, 279.

La inevitable intervención de las palabras en los procesos y resultados del análisis de contenido documental resalta la importancia que debemos dar a su estudio -bien sea desde las estructuras del lenguaje natural de partida y de la inmediata posibilidad de su uso libre-, a su estandarización como términos validados de los lenguajes controlados; ya en composición simple o sintagmática; bien como entrada aislada en un índice o formando parte de conjuntos encadenados; incluso cuando son consideradas como objetos de cuantificación probabilística y estadística, o bien analizadas mediante factores lingüísticos más propios y, desde luego, cuando figuran como elementos compositivos en los textos-resumen. Es deseable, pues, realizar acercamientos al análisis documental con una perspectiva lingüística, tanto para alcanzar sistemas de recuperación fiables, como para explicar lo sustantivo de la información documental, sin olvidarnos nunca de que esta relación entre la lingüística y la información-documentación está intermediada siempre por el fin de mejorar nuestro conocimiento sobre la organización, representación y recuperación de los contenidos presentes en los documentos, de forma muy especial en aquellos expresados mediante los textos. Se quiere así atender a la preocupación de los indizadores por establecer relaciones entre el lenguaje natural y los lenguajes documentales, y esto tanto desde la intervención humana como de la realizada con ordenadores, preocupación que vuelve a darse en el caso del resumen, cuando tienen que pasar del original a su representación moviéndose siempre dentro del lenguaje natural, aunque dentro de unas condiciones especiales derivadas de su finalidad comunicativa y de su atención a un dominio concreto.

There are no comments on this title.

to post a comment.

Click on an image to view it in the image viewer

Local cover image

Powered by Koha