Introduction

From DEM to DEMel

1. La historia del DEM

El Diccionario del Español Medieval electrónico se basa en el extenso archivo de datos que se recopiló en la Universidad de Heidelberg en el marco del Diccionario del Español Medieval (DEM) bajo la dirección del Prof. Dr. Bodo Müller (1924-2013). Del amplio equipo editorial, hay que mencionar a tres editores principales: Dra. Mechthild Crombach, Peter Michael Pitzer, M.A. y Priv.-Doz. Dra. Eva-Maria Güida, responsable de la supervisión científica del proyecto de Heidelberg desde 1994 hasta su finalización. Los trabajos de este proyecto comenzaron en 1971, inicialmente con el apoyo financiero de la Fundación Alemana para la Investigación Científica (DFG, 1971-1984). En 1984, el DEM fue transferido como proyecto a largo plazo al Akademie-Programm der Bund-Länder-Kommission y se desarrolló en una institución de investigación independiente de la universidad bajo los auspicios de la Academia de Ciencias de Heidelberg, y a partir de 2005 en cooperación con el Instituto de Estudios Medievales y Renacentistas (IEMYR) de la Universidad de La Laguna (Tenerife/España). En el acuerdo de cooperación estaba previsto que el proyecto del diccionario fuera asumido por el socio español a partir de 2008, pero finalmente, esto no se produjo por razones financieras. Tras una financiación de dos años (2005-2007), la Academia de Ciencias y Humanidades de Heidelberg suspendió el DEM el 31 de diciembre de 2007. El cierre del proyecto a finales de 2007 amenazó con la pérdida de este destacado archivo y de las décadas de actividad investigadora. Gracias a los esfuerzos de Jutta Langenbacher-Liebgott y Rafael Arnold, que ya habían trabajado en el DEM, y a la financiación para la digitalización por parte de la DFG, los valiosos datos del archivo del DEM, único en su género y que se encuentra en la Biblioteca de la Universidad de Rostock, fueron rescatados en el marco del proyecto DEMel y ahora están disponibles para la comunidad científica en su totalidad con acceso abierto, gratuito y sin restricciones.

Heidelberger Akademie der Wissenschaften

2. El diccionario

Beispielartikel aus dem DEM — Ejemplo de un artículo del DEM (cf. DEM I, 1994, 185)

En 1987 comenzó la publicación del DEM en la editorial universitaria de Heidelberg Winter en forma de fascículos. Hasta 2005, se publicaron 2 volúmenes con 10 fascículos cada uno y un tercer volumen con otros 6 fascículos. Debido a la interrupción del proyecto DEM en 2007, sólo se publicó una pequeña parte de los lemas (a-almohatac), mientras que el archivo de datos contiene más de 32 000 lemas de la A a la Z junto con las documentaciones (Fichero DEM nuclear) y, además, material de datos adicional, por ejemplo, bibliográfico o etimológico (Ficheros DEM auxiliares) (véase 3. Archivo de datos: el Fichero).
El DEM se basa en gran medida en el análisis de documentos de textos españoles del siglo X a principios del siglo XV, que se recogieron en gavetas en el centro de investigación del DEM en Heidelberg entre 1971 y 2005. En el DEM, el vocabulario español se describe en toda su amplitud con todas las acepciones del período mencionado. Según Bodo Müller (2003, 148), "[l]a marca del límite superior [...] está determinada por las pruebas textuales más antiguas del español [...]. Debe adelantarse hasta 100 años en el caso de las formas únicas de fonación inequívocamente española procedentes de fuentes latinas que pueden fecharse con anterioridad. Asimismo, se supera el límite inferior de la regla de aproximadamente 1400 si el redondeo de la documentación o el valor de rareza de una palabra / uso de la palabra lo sugieren" [la traducción es nuestra]. Para los artículos del diccionario DEM, el material lematizado se estructuró de la siguiente manera: ordenación alfabética de los lemas, ordenación cronológico-semántica de las documentaciones en su respectivo contexto de uso con indicación de la fuente y su datación, complementada, por un lado, con información lexicográfica adicional procedente de los diccionarios españoles más antiguos (práctica que tuvo que abandonarse a partir del fascículo 12, 1995, cf. DEM II, 1995, V) y, por otro lado, mediante comentarios etimológico-históricos al final del respectivo artículo del diccionario (procedimiento que, lamentablemente, sólo pudo mantenerse hasta el lema alben, cf. DEM III, 2001, VIII). Numerosas reseñas han subrayado la riqueza documental, la calidad filológica y la importancia profesional del DEM. En la tercera fase del proyecto DEMel, los tres volúmenes se digitalizaron y ahora están disponibles gratuitamente en la sección DEM del portal DEMel.

3. El archivo de datos: el Fichero

El Fichero del DEM consta de unas 865 000 fichas en 487 gavetas. Los lemas y las documentaciones asociadas procedentes de fuentes primarias y secundarias forman conjuntamente el Fichero DEM nuclear con 386 gavetas. Comprende, ordenados alfabéticamente y en parte por familias de palabras, un total de aproximadamente unas 700 000 documentaciones para más de 32 000 lemas. Además de la ordenación alfabética inicial no muy estricta de los lemas en el Fichero DEM nuclear - en contraste con el diccionario impreso - hay que señalar que la estructura de acceso alfabético del Fichero DEM nuclear físico se basa en las siguientes 27 letras o dígrafos: a, b, c, ch, d, e, f, g, h, i, j, k, l, ll, m, n, o, p, q, r, s, t, u, v, x, y, z. Un lemario provisional (letras b, d, f, g) con las correspondientes documentaciones iniciales (y en algunos casos también con otras documentaciones) se publicó en línea con el nombre de "Tesoro DEM Informatizado" (DEMi) hacia el final del proyecto DEM. Además, unas 160 000 fichas en 101 gavetas conforman los Ficheros DEM auxiliares. Se trata de material adicional con información etimológica, material de vocabularios y glosarios, una colección de onomástica, vocabulario temático especializado y material bibliográfico. En la base de datos DEMel es posible realizar búsquedas por lemas y documentaciones en el Fichero DEM nuclear; mientras que, en el Fichero digitalizado, el Fichero DEM nuclear y los Ficheros DEM auxiliares pueden verse en su totalidad.

DEM-Kästen

4. Tipos de fichas

En el curso de la evaluación léxica de las fuentes primarias y secundarias, se crearon varios tipos de fichas que cumplen diferentes funciones. En el Fichero digitalizado se pueden ver todas estas fichas en su totalidad. El tratamiento de los diferentes tipos durante el registro de datos en el proyecto DEMel está documentado en la Metodología de registro. Los tipos más comunes, tal y como se utilizan en el inventario nuclear del archivo de datos, son:

En la parte más importante del fichero, el Fichero DEM nuclear I, las fichas están ordenadas de la siguiente manera, con algunas excepciones: al principio de cada sección hay una ficha rosa de lema en la que se ha anotado el lema o los lemas de la sección correspondiente. A continuación, se incluyen las fichas de las documentaciones asociadas, así como las remisiones y los marcadores de posición para las fichas sobredimensionales, si las hay. Las propias fichas sobredimensionales, así como los protocolos de búsqueda que contienen, se encuentran en el Fichero DEM nuclear IIb.

Fichas de lema

Para aclarar las relaciones formales entre los lemas individuales y simplificar la redacción de los artículos del diccionario, el material de palabras recogido del Fichero DEM nuclear se ordenó en gran medida según las familias de palabras, aunque esta disposición no era coherente: así, muy a menudo, por ejemplo, el verbo o el sustantivo y las correspondientes derivaciones sufijales se encuentran en una sección, mientras que las correspondientes formaciones prefijales se ordenan en el lugar correspondiente del alfabeto. El lema o los lemas de una familia de palabras en el sentido restringido que acabamos de describir se anotan en una ficha de lema (normalmente rosa). Además de la forma del lema respectivo, también se indican las variantes gráficas relevantes de este lema, así como otra información, por ejemplo, remisiones a otros lemas. Las fichas de lema no aparecen en la base de datos, pero, por supuesto, pueden verse en el Fichero digitalizado.

Lema
Variante gráfica
Remisión

Fichas de documentaciones

Las documentaciones pueden dividirse a grandes rasgos en dos tipos básicos: documentaciones primarias y secundarias. Mientras que las documentaciones primarias son el resultado de la evaluación de las fuentes primarias y, por tanto, de los documentos textuales españoles del siglo X hasta principios del siglo XV, las documentaciones secundarias son el producto de la consulta de fuentes secundarias eruditas como glosarios, vocabularios, concordancias o artículos especializados. Las fichas contienen fragmentos de estas obras secundarias y, por tanto, representan una prueba indirecta de las documentaciones del español medieval. Todas las documentaciones se recopilaron y documentaron entre 1971 y 2005 en el marco del DEM.

Documentaciones primarias

Las documentaciones primarias anotadas en las fichas se asignan a un lema, que suele indicarse en la parte superior izquierda de la ficha. El lema y la forma documentada, generalmente señalada en su respectivo contexto de uso, suelen resaltarse visualmente (por ejemplo, mediante el subrayado o el marcado en color). Estas fichas también proporcionan información en forma de siglas - generalmente en la esquina superior derecha - sobre la fuente, indicando la ubicación de la documentación, y la datación de la fuente de la que se extrae. La fuente está indexada por la Bibliografía DEMel. Además de la información ya mencionada, muchas fichas contienen también definiciones provisionales, así como información etimológica y remisiones a otros lemas.

Lema
Forma documentada
Contexto
Sigla
Datación
Ubicación
Significado

Las fichas de la base de datos DEM tienen una estructura diferente. Al principio de la documentación, se anotan la fecha, la sigla y la ubicación. En el siguiente contexto, la forma documentada se destaca con un subrayado previo y a veces con una marca de color:

Ficha mit Primärbeleg aus der DEM-Datenbank

Datación
Sigla
Ubicación
Contexto
Forma documentada

Documentaciones secundarias

Al igual que las documentaciones primarias, las documentaciones secundarias se asignan a un lema, que suele anotarse en la parte superior izquierda. En la esquina superior derecha se suele anotar la sigla junto con la datación. La información indicada difiere en función de la estructura y el objetivo de la obra secundaria evaluada.

Lema
Sigla
Datación
Extracto de la fuente secundaria
(en el ejemplo: ubicaciones con la indicación de los manuscritos entre paréntesis y con formas documentadas entre corchetes)

Remisiones

Como es habitual en las obras lexicográficas y las bases de datos, el Fichero DEM utiliza una estructura de remisión correspondiente. La más común es la remisión a lemas, que se encuentra en las fichas de documentaciones. La remisión, generalmente introducida por un símbolo de remisión como "véase", "v. tb." o una flecha "→", establece así una relación entre el lema anotado en la ficha y un objetivo de remisión, por ejemplo, otro lema o una o varias documentaciones asignadas a este lema. Si el lema de origen de la remisión forma parte de una unidad pluriverbal, suele resaltarse en la ficha con un doble subrayado, y el lema al que se hace referencia con un simple o doble subrayado. En la esquina superior derecha, como en los demás tipos de documentaciones, se anota la sigla de la fuente con la datación y la ubicación.

Lema con unidad pluriverbal
Remisión
Sigla
Datación
Ubicación

Fichas sobredimensionales y sus marcadores de posición

A los lemas se les suele asignar no solo todas las documentaciones, sino también material adicional en formato DIN A4. Se trata, por ejemplo, de información etimológica o lexicológica o de los protocolos de búsqueda en la base de datos DEM, es decir, un comprobante de búsqueda de palabras para la preparación y creación de artículos de diccionario. En parte, también se incluyen borradores (anotados) de artículos de diccionario. El material DIN A4 se mantuvo doblado en formato DIN A6 con las documentaciones asociadas. Estas fichas sobredimensionales han sido extraídas y escaneadas por separado en el proyecto DEMel antes de digitalizar el Fichero DEM nuclear. En el Fichero digitalizado, ahora hay una ficha azul en cada caso como marcador de posición, en la que se ha anotado la forma documentada correspondiente o el lema asociado y el número o la designación de la gaveta en la que se archivó la documentación. Las propias fichas sobredimensionales se encuentran en el Fichero DEM nuclear IIb. Si en las fichas sobredimensionales aparecían documentaciones, también se han incluido en la base de datos. Los marcadores de posición no se muestran en dicha base de datos.

Marcador de posición para una ficha sobredimensional	Nombre de la gaveta Número de la gaveta Lema
Ficha sobredimensional del marcador de posición anterior (página 1)	Designación de la gaveta de la que se extrajo originalmente la ficha sobredimensional Número de la gaveta de la que se extrajo originalmente la ficha sobredimensional Lema
Ficha sobredimensional del marcador de posición anterior (página 2)

Protocolo de búsqueda

Un programa de búsqueda desarrollado para tal fin permitía a los editores del DEM realizar la llamada búsqueda colectiva en la base de datos del DEM, que solía hacerse al final del tratamiento de un grupo de palabras con la misma cadena de letras al principio de la palabra, por ejemplo, para los lemas alma, almacana, almacén 1, almacén 2, etc. Para ello, se buscó en la base de datos una serie de variantes gráficas esperables al principio de la palabra, además de alma-, por ejemplo, dalma-, lalma-, halma-. Los resultados de la búsqueda se procesaron en su totalidad, se lematizaron las formas documentadas o se asignaron provisionalmente los lemas existentes del Fichero DEM nuclear. En DEMel, los resultados de estas búsquedas, que proceden de la base de datos y se integraron en el Fichero DEM en versión impresa, pueden verse, por un lado, como imágenes de los denominados protocolos de búsqueda, en los que se documenta la búsqueda de las fuentes (con documentaciones), y, por otro, en forma de fichas de documentaciones.

Fecha del protocolo de búsqueda
Fuentes
Variantes gráficas buscadas
Documentación 1
Documentación 2

Separadores

Si hay varios lemas en el Fichero DEM nuclear en una ficha de lema, por ejemplo en el caso de las familias de palabras, las documentaciones respectivas están separadas por fichas amarillas, normalmente sin etiquetar. Estos separadores no aparecen en la base de datos. Sin embargo, son visibles, por supuesto, en el Fichero digitalizado.

Trenner

Dorsos de fichas

Los dorsos de fichas se han copiado por razones técnicas antes de su digitalización durante el proyecto DEMel, se han marcado con una "R" de " Rückseite" (dorso) en la esquina superior derecha y se han integrado en el Fichero DEM nuclear. Las imágenes de estos dorsos siguen inmediatamente a la imagen de la cara frontal correspondiente.

Vorderseite — Cara frontal y dorso de una ficha

Rückseite — Cara frontal y dorso de una ficha

5. Las fuentes

El archivo DEM se basa en más de 600 obras y colecciones de textos y documentos que fueron evaluados entre 1971 y 2005 en el centro de investigación DEM de Heidelberg y cuyo vocabulario está documentado en forma lematizada en el Fichero DEM nuclear. Este corpus textual incluye obras de bellas artes, así como toda una serie de textos de origen jurídico, entre los que se encuentran numerosos fueros, y traducciones de textos técnicos árabes al español (entre ellos, astronomía, mineralogía, medicina, veterinaria, farmacia, botánica y agricultura). Un segundo grupo importante de traducciones son las de los libros canónicos de la Biblia. Además de estas fuentes primarias, se copiaron fuentes secundarias como vocabularios, glosarios, concordancias (por ejemplo, Alexandre Voc., ArancelesAduanas Glos., Apolonio Conc.) o se crearon (por ejemplo, Alexandre Conc. (DEM), Berceo Conc. (DEM)) y se integraron en el Fichero DEM nuclear. Además, el Fichero DEM nuclear contiene también material de vocabulario extraído de estudios léxicos (por ejemplo, Pottier, Lexique médiéval hispanique, 1980-1984 o Alfau de Solalinde, Nomenclatura de los tejidos españoles del siglo XIII, 1969 [= Tejidos]). De acuerdo con el estado actual del desarrollo técnico, los textos fuente utilizados en el DEM están disponibles en forma de libro o fotocopia, en forma de microficha o microfilm y, por último, en versión CD-ROM.
En la preparación de los artículos del DEM, se contaba con la base de datos del DEM, además del material de las gavetas, a partir de mediados de los años noventa. Esta base de datos electrónica se creó en el Centro de Investigación DEM de Heidelberg a partir de 1992 y contiene más de 200 archivos de texto. Algunos de ellos comprenden recopilaciones considerables y significativas, como las ediciones en microfichas de Concordances and Texts of the Royal Scriptorium Manuscripts of Alfonso X, el Sabio o las ediciones en microfichas Concordances and Texts of the fourteenth-century Aragonese manuscripts of Juan Fernández de Heredia; otros consisten en manuscritos, por ejemplo, de ADMYTE, Archivo Digital de Manuscritos y Textos Españoles. Destaca la elevada proporción de literatura especializada en diversos ámbitos y de traducciones bíblicas. Todos los textos se introdujeron - siempre que fue posible - en la base de datos, de lo contrario se teclearon (es decir, se introdujeron manualmente). También se incluyeron en la base de datos ediciones de manuscritos si los textos ya habían sido evaluados léxicamente con anterioridad a partir de otra edición crítica: así, por un lado, se podrían registrar variantes de otro manuscrito y, por otro, se podrían cerrar las posibles lagunas de vocabulario existentes en el Fichero DEM nuclear. Un ejemplo para la consideración de diferentes ediciones es el Libro de las Aves de Caza de López de Ayala (ver LpzAyala AvesCaça(Cummins), LpzAyala AvesCaça(ADMYTE 0) y LpzAyala Aves Caça).