Tesauro de Ingeniería Hidráulica


Resumen

El presente Tesauro de ingeniería hidráulica está dirigido a los técnicos y profesionales que deban sumergirse en los problemas que representa la localización de la información en este campo, y especialmente a los profesionales de la documentación que aborden temas de la Ingeniería hidráulica.

El Tesauro representa una herramienta documental que, gracias a su característica de normalización del lenguaje específico, permite la conversión del lenguaje técnico de un documento al propio lenguaje documentario controlado, paso imprescindible para todo usuario que accede a una base de datos buscando información y necesita preparar una estrategia para la consulta documental.

Por otra parte, el Tesauro significa una herramienta fundamental para el documentalista que debe indizar determinado documetno o aportar referencias a una base de datos. Ante la inexistencia de tesauros en lengua castellana sobre temas de Ingeniería hidráulica, la presente herramienta documental no sólo significa un importante avance para garantizar la calidad en los procesos de indización y recuperación de la información de las bases de datos, sino que representa una esperada aportación en el campo de la terminología científica en nuestra lengua.

Introducción

El presente Tesauro constituye un importante punto de partida para facilitar el trabajo a los profesionales de la documentación que aborden los temas de la ingeniería hidráulica, así como a los técnicos de este campo que deban sumergirse en los problemas que representa la localización de la información. Un tesauro se ofrece como una herramienta documental que, gracias a su característica de normalización del lenguaje específico, permite mejorar la explotación de las bases de datos a través de una doble función:

En primer lugar significa una extraordinaria herramienta para el documentalista en el momento de incorporar una referencia a una base de datos, pues le permite pasar del lenguaje técnico del documento al propio lenguaje documentario controlado, y esto se debe hacer mediante un procedimiento riguroso, de especial importancia para la futura recuperación de la información.

Por otro lado, el usuario que accede a una base de datos buscando información y debe preparar una estrategia para la consulta documental, necesita también un traductor entre su propio lenguaje y el lenguaje documental de la base de datos. La utilización de unos términos específicos, y no otros, para expresar los conceptos de su búsqueda, simplifica el proceso de interrogación. La selección de tales términos se facilita mediante la propia consulta al tesauro, cuya estructura de relaciones va propiciando la traducción al lenguaje documentario de las necesidades de los usuarios.

Cabe señalar la carencia de tesauros en lengua castellana en temas de ingeniería civil, y en temas de ingeniería hidráulica en particular, con lo cual el lenguaje del documentalista en este campo adolece de una falta de precisión y del rigor necesario para garantizar la calidad en los procesos de indización de las bases de datos y sobre todo en la recuperación de la información.

El Tesauro que aquí se presenta ha sido desarrollado en el marco de un Convenio de colaboración entre el Centro de Estudios y Experimentación de Obras Públicas (CEDEX), y la Dirección General de Obras Hidráulicas del extinto Ministerio de Obras Públicas, Transportes y Medio Ambiente, y en la actualidad Dirección General de Obras Hidráulicas y Calidad de las Aguas del Ministerio de Medio Ambiente.

El trabajo fue dirigido por Alberto Pastor, Coordinador del Programa de Información Científica y Técnica del CEDEX, y su realización ha sido posible gracias a la participación de un importante equipo constituido por personal del CEDEX, (Amparo Barbolla, Antonia Berjaga y Concepción Lallana), personal del Centro de Información y Documentación Científica (CINDOC) del CSIC, (Elena Fernández, María José Fernández, Rafael Gil y José María Sánchez Nistal) y la colaboración inestimable de Carlos Torres, actuando como consultor.

Se puede decir que este Tesauro constituye una esperada aportación en el campo de la terminología científica en español. Como todo Tesauro, y especialmente los tesauros técnicos o científicos, requieren ser actualizados permanentemente para poderse adaptar al natural nacimiento de nuevos vocablos, fruto del continuo progreso humano, incorporando los nuevos términos y relaciones que se vayan acuñando con el devenir de los tiempos. En este sentido se ruega al lector que nos sugiera cuantas observaciones o comentarios estime oportunos con objeto de mantener y mejorar esta herramienta en revisiones posteriores.

Alcance del Tesauro

Este Tesauro está orientado a los profesionales que trabajan en el campo de la ingeniería hidráulica, y su desarrollo se ha englobado dentro de un proyecto más amplio de construcción de un Tesauro de Ingeniería Civil que habrá de contemplar otras disciplinas de la ingeniería. De estas consideraciones se desprende que algunos campos auxiliares, como podrían ser los procedimientos de construcción, los materiales empleados en la obra pública, o la ingeniería ambiental, no han sido objeto del actual desarrollo, y con ese criterio se ha establecido un esquema de campos temáticos principales o familias muy específico que constituye el alcance del presente Tesauro. Dichos campos son los siguientes:

01 ABASTECIMIENTO Y DISTRIBUCIÓN DEL AGUA
02 ANÁLISIS Y CALIDAD DEL AGUA
03 CENTRALES HIDROELÉCTRICAS Y DE BOMBEO
04 CONDUCCIONES DE AGUA
05 DEPURACIÓN DE AGUAS RESIDUALES
06 GESTIÓN Y ADMINISTRACIÓN DEL AGUA
07 HIDROGEOLOGíA - CAPTACIONES SUBTERRÁNEAS
08 HIDROLOGíA E HIDROGRAFíA
09 INGENIERíA DE REGADíOS
10 INGENIERíA FLUVIAL
11 PRESAS Y EMBALSES 12 SANEAMIENTO Y ALCANTARILLADO

Estructura del Tesauro

El Tesauro como lenguaje de indización controlado, está estructurado formalmente con objeto de hacer explícitas las relaciones, a priori, entre conceptos. El Tesauro está constituido por términos organizados mediante relaciones entre ellos y provistos de notas de aplicación.

Los términos son unidades lingüísticas que pueden ser examinadas lingüística y gramaticalmente. Por su función se agrupan en términos simples, compuestos, identificadores e indicadores de función. Por su relevancia se han clasificado en descriptores, esto es, términos principales o preferentes; y no descriptores, o sea, términos equivalentes de carácter secundario o no preferente.

La selección de términos se ha realizado por el método inductivo, esto es, mediante recopilación de términos a partir de glosarios, literatura especializada y a veces consulta a especialistas muy cualificados.

Este Tesauro consta de 3.105 términos, de los cuales 2.932 son descriptores y 173 no descriptores. Los descriptores aparecen escritos con letras mayúsculas y los no descriptores en minúsculas.

El sistema de relaciones define el contenido semántico entre los términos. Se han establecido relaciones de tres tipos:

- jerárquicas, que indican un rango de mayor a menor y tienden a ordenar los términos verticalmente, (de mayor a menor los términos se ordenan de más genéricos a más específicos). En este Tesauro se ha evitado la multijerarquía, de modo que cada descriptor está asignado exclusivamente a un área temática, con lo cual cada término tiene un único término genérico con excepción de los doce términos cabeceras. Las ordenes usadas en esta relación son TG que indica el término genérico, y su inversa TE que denota un término más específico.

- asociativas, relacionan términos o ideas con carácter horizontal. Se establecen entre términos que no sean equivalentes ni puedan relacionarse jerárquicamente, pero que permiten una asociación mental entre ellos, revelando así términos alternativos que pudieran ser útiles en la indización de un documento o en la recuperación de la información. Se expresan por la orden TR que significa término relacionado.

- de equivalencia, son las que existen entre términos diferentes con el mismo significado, y se emplean para limitar el uso de sinónimos o cuasi sinónimos. Los términos no preferidos (no descriptores) son relacionados con un término preferido (descriptor) mediante la instrucción USE.

Dado que todo descriptor debe expresar un concepto preciso y sin ambigüedades, en el caso de que pueda existir alguna duda, bien porque el término tenga varios significados, bien porque se utilice con un sentido especial por exigencias del tesauro, se añade al descriptor una nota de aplicación que puede ser de definición o de utilización. Los códigos empleados para expresar estas relaciones y notas de aplicación son los siguientes:

NA- Nota de aplicación
TG-
Término genérico
TE-
Término específico
TR-
Término relacionado
USE-
El término que sigue a este código, es el término preferente.
UP-
Usado por. El término que sigue a este código es el no preferente.

Proceso de construcción del Tesauro

Previo al proceso propiamente dicho de construcción del tesauro se ha delimitado la cobertura temática del mismo, encuadrándolo dentro de un marco más general de un Tesauro de Ingeniería Civil, tal y como se indicó en el apartado segundo.

Seguidamente se procedió al proceso de recopilación de términos, partiendo del estudio de vocabularios especializados, léxicos, sistemas de clasificación, otros tesauros, y bibliografía especializada, e incluso llegando en algún caso a la consulta de muy concretos especialistas (ver el anejo 1: Bibliografía).

A partir de aquí se ha seguido un lento proceso que comenzó por su organización en familias documentales, y el establecimiento de relaciones de equivalencia entre los términos, con objeto de la eliminación de sinónimos, etc., al tiempo de distinguir entre homónimos y polisemias.

Los términos candidatos se analizaron bajo una concepción lingüística homogénea con objeto de unificar criterios de singular-plural, ortografía, puntuación, uso de unitérminos o ultítérminos, etc., de acuerdo con la Norma UNE 50-106-90, Directrices para el establecimiento y desarrollo de tesauros monolíngües.

El siguiente paso ha sido la revisión del grado de precoordinación y postcoordinación y por tanto del uso de sustantivos frente a adjetivos, el uso de preposiciones y artículos.

Seguidamente se han revisado las familias documentales para reducirlas a un similar nivel de generalidad, y a continuación se establecieron las relaciones de jerarquía y de asociación entre los términos.

Durante todo este procedimiento, las listas de términos fueron revisadas contínuamente, y se modificaron. grabaron y procesaron de una manera interactiva.

El Tesauro fue probado mediante la indización de muestras de documentos reales. El Tesauro fue aprobado mediante la indización de muestras de documentos reales, lo que permitió revisar y afianzar la asignación de relaciones de asociación y al mismo tiempo la realización de estadísticas de uso y el correspondiente ajuste del grado de especificidad.

Finalmente se procedió a su carga en el ordenador y a su tratamiento con el sistema de gestión de tesauros de BASIS PLUS que tras realizar un control de calidad automático, generó tres índices: alfabético, jerárquico y permutado.

Presentación del Tesauro

Este Tesauro de Ingeniería Hidráulica consta de tres partes diferenciadas:

RIEGO POR GOTEO 0504050

TG RIEGO LOCALIZADO

RIEGO POR GRAVEDAD 050406

TG RIEGOS
TE RIEGO EN FAJAS
RIEGO POR INUNDACIÓN
RIEGO POR SURCOS

Riego por infiltración USE RIEGO POR SURCOS

Parte jerárquica: En esta parte, el Tesauro está organizado por códigos temáticos, seguidos del nombre del descriptor. El código temático permite su localización partiendo tanto del índice alfabético como del índice permutado. El índice jerárquico permite visualizar de manera inmediata la posición del descriptor respecto a sus vecinos más genéricos o más específicos. El nivel de jerarquía máximo alcanzado es el cuarto, de manera que no habrá ningún código con más de ocho dígitos. Los dos primeros indican el nombre de la familia documental a la que pertenecen.

.........0901 CONSTRUCCIÓN DE PRESA
............090101 ATAGUíA
............09010101 ATAGUíAS DEHORMIGÓN
............09010102 ATAGUíAS DE HORMIGÓN COMPACTADO
............09010103 ATAGUiAS DE MATERIALES SUELTOS
............09010104 PROTECCIÓN DE ATAGUíAS
........... ESCOLLERA ARMADA
............ESCOLLERA CALIBRADA
.........090102 CIERRE DEL CAUCE

Índice permutado (KWIC): Contiene todos los términos del Tesauro, tanto decriptores como no descriptores, alfabetizados por todas las palabras significativas que contienen. Los términos siempre aparecen completos, de tal manera que en la columna central aparece la palabra alfabetizada. Los descriptores aparecen acompañados del código que los relaciona con la parte jerárquica, mientras que los no descriptores carecen de él.

.....................LEGISLACIÓN DE AGUAS 060301
.....................LEGISLACIÓN HIDRÁULICA 0603
....................ÁREA LEJANA(ACUíFEROS) 08020102
................... MOVIMIENTO UNIFORME EN RÉGIMEN LENTO 01010405
........................FILTROS LENTOS 07010302
........................LEPTOMITUS LACTEUS 02020403
........................LEVANTAMIENTO DE LITOCLASAS 09080103