Einführung

Vom DEM zum DEMel

1. Die Geschichte des DEM

Als Grundlage des Diccionario del Español Medieval electrónico dient das umfangreiche Datenarchiv, das in Heidelberg im Rahmen des Diccionario del Español Medieval (DEM) unter der Leitung von Prof. Dr. Bodo Müller (1924-2013) erstellt wurde. Aus dem großen Redaktionsteam seien drei leitende Redaktorinnen / Redaktoren namentlich genannt: Dr. Mechthild Crombach, Peter Michael Pitzer, M.A. und Priv.-Doz. Dr. Eva-Maria Güida, die von 1994 bis zum Ende des Heidelberger Projekts die wissenschaftliche Betreuung verantwortete. Die Arbeiten an diesem Projekt begannen 1971, zunächst mit finanzieller Unterstützung der Deutschen Forschungsgemeinschaft (1971-1984). 1984 wurde der DEM als Langzeitprojekt in das Akademie-Programm der Bund-Länder-Kommission übergeleitet und institutionell zu einer universitätsunabhängigen Forschungseinrichtung unter der Ägide der Heidelberger Akademie der Wissenschaften ausgebaut, ab 2005 in Kooperation mit dem Instituto de Estudios Medievales y Renacentistas (IEMYR) der Universidad de La Laguna (Teneriffa/Spanien). Im Kooperationsvertrag war die Übernahme des Wörterbuchprojekts durch den spanischen Partner ab 2008 geplant, sie kam jedoch aus finanziellen Gründen nicht zustande. Nach einer zweijährigen Auslauffinanzierung für die Heidelberger Forschungsstelle (2005-2007) wurde der DEM von der Heidelberger Akademie der Wissenschaften am 31. Dezember 2007 eingestellt. Mit der Schließung des Projekts Ende 2007 drohte der Verlust dieses herausragenden Archivs und der darin gebündelten jahrzehntelangen Forschungstätigkeit. Dank des Einsatzes von Jutta Langenbacher-Liebgott und Rafael Arnold, die bereits am DEM tätig gewesen waren, und dank der Förderung zur Digitalisierung durch die DFG konnten die äußerst wertvollen und in ihrem Umfang einzigartigen Daten des DEM-Archivs, das in der Universitätsbibliothek Rostock aufbewahrt wird, im Rahmen des DEMel-Projektes gerettet werden und stehen nun der Wissenschaftsgemeinschaft vollständig mit Open-Access, entgeltfrei und uneingeschränkt zur Verfügung.

DFG-Logo Heidelberger Akademie der Wissenschaften

2. Das Wörterbuch

Beispielartikel aus dem DEM
Beispielartikel aus dem DEM (cf. DEM I, 1994, 185)

Im Jahr 1987 begann die Veröffentlichung des DEM im Heidelberger Universitätsverlag Winter in Form von Faszikeln. Bis 2005 erschienen 2 Bände mit jeweils 10 Faszikeln sowie ein dritter Band mit weiteren 6 Faszikeln. Aufgrund der Einstellung des DEM-Projekts im Jahr 2007 wurde nur ein kleiner Teil der Lemmata publiziert (a-almohatac), während das Datenarchiv über 31.000  Lemmata von A-Z mitsamt Wortbelegen (Fichero DEM nuclear) und darüber hinaus weiteres, z. B. etymologisches, bibliografisches Datenmaterial (Ficheros DEM auxiliares) umfasst (s. 3 Das Datenarchiv: der Fichero).
Der DEM basiert zum großen Teil auf der Auswertung spanischer Textdokumente des 10. bis beginnenden 15. Jahrhunderts, die zwischen 1971 und 2005 in der Heidelberger DEM-Forschungsstelle in Zettelkästen gesammelt worden sind. Beschrieben wird im DEM der spanische Wortschatz in seiner ganzen Breite mit allen Bedeutungen für den genannten Zeitraum. Dabei wird, so Bodo Müller (2003, 148), „[d]ie obere Grenzmarke […] von den ältesten textlichen Zeugnissen des Spanischen bestimmt […]. Sie muss bei Einzelformen eindeutig spanischer Lautung aus früher datierbaren lateinischen Quellen um bis zu 100 Jahre vorverlegt werden. Ebenso wird die untere Regelgrenze von ca. 1400 überschritten, wenn die Abrundung der Dokumentation oder der Seltenheitswert eines Wortes / einer Wortverwendung dies nahe legen“. Für die Wörterbuchartikel des DEM wurde das lemmatisierte Wortmaterial folgendermaßen strukturiert: Alphabetische Anordnung der Lemmata, chronologisch-semantische Gliederung der Wortbelege, die in ihrem jeweiligen Verwendungskontext mit Angabe der Quelle und deren Datierung dokumentiert sind, einerseits ergänzt durch zusätzliche lexikografische Informationen aus den ältesten spanischen Wörterbüchern (eine Praxis, die ab Faszikel 12, 1995 aufgegeben werden musste, cf. DEM II, 1995, V) und andererseits durch etymologisch-historische Kommentare am Ende des jeweiligen Wörterbuchartikels (ein Verfahren, das leider nur bis zum Lemma alben aufrechterhalten werden konnte, cf. DEM III, 2001, VIII). Zahlreiche Rezensionen unterstreichen Dokumentationsfülle, philologische Qualität und fachliche Bedeutsamkeit des DEM.

3. Das Datenarchiv: der Fichero

Der Fichero des DEM besteht aus rund 865.000 Karteikarten in 487 Kästen und setzt sich aus verschiedenen Bestandteilen zusammen. Die Lemmata und die zugehörigen Belege aus Primär- und Sekundärquellen bilden zusammen den Fichero DEM nuclear mit 386 Kästen. Dieser umfasst, alphabetisch gereiht und z. T. nach Wortfamilien geordnet, insgesamt ca. 650.000 Belege zu über 31.000 Lemmata. Neben der somit nicht ganz strikt initialalphabetischen Sortierung der Lemmata im Fichero DEM nuclear – dies im Unterschied zum gedruckten Wörterbuch – gilt es zu beachten, dass die alphabetische Zugriffsstruktur des physischen Fichero DEM nuclear folgende 27 Buchstaben bzw. Digrafen zugrunde legt: a, b, c, ch, d, e, f, g, h, i, j, k, l, ll, m, n, o, p, q, r, s, t, u, v, x, y, z. Eine provisorische Lemmaliste (Buchstaben b, d, f, g) mit den zugehörigen Erstbelegen (und in einigen Fällen auch mit weiteren Belegen) wurde gegen Ende der Laufzeit des DEM unter dem Namen „Tesoro DEM Informatizado“ (DEMi) online veröffentlicht. Darüber hinaus bilden rund 160.000 Fichas in 101 Kästen die Ficheros DEM auxiliares. Diese umfassen zusätzliches Material mit etymologischen Informationen, das Material von Vokabularien und Glossaren, eine Sammlung von Onomastika, thematisches Fachvokabular sowie bibliografisches Material. In der Datenbank des DEMel ist der Fichero DEM nuclear nach Lemmata und Wortbelegen durchsuchbar. Im Digitalisierten Zettelkasten sind der Fichero DEM nuclear und die Ficheros DEM auxiliares vollständig einsehbar.

DEM-Kästen

4. Die Zetteltypen

Im Zuge der lexikalischen Auswertung der Primär- und Sekundärquellen wurden verschiedene Typen von Zetteln angelegt, die unterschiedliche Funktionen erfüllen. Im Digitalisierten Zettelkasten sind alle diese Fichas vollständig einsehbar. Den Umgang mit den unterschiedlichen Typen bei der Datenerfassung im Rahmen des Projektes DEMel dokumentieren die Erfassungsprinzipien. Die häufigsten Typen, wie sie im Kernbestand des Datenarchivs Verwendung finden, sind:

Im wichtigsten Teil des Zettelkastens, dem Fichero DEM nuclear I, sind die Zettel bis auf wenige Ausnahmen wie folgt angeordnet: Am Anfang jedes Abschnittes befindet sich eine rosafarbige Lemmakarte, auf der das Lemma oder die Lemmata des entsprechenden Abschnittes notiert sind. Im Anschluss folgen die zugehörigen Beleg-Fichas sowie Lemmaverweise und gegebenenfalls Platzhalter für Überformate. Die Überformate selbst sowie darin enthaltene Suchprotokolle befinden sich im Fichero DEM nuclear IIb.

Lemmakarten

Um die formalen Zusammenhänge zwischen den einzelnen Lemmata zu verdeutlichen und die Erstellung der Wörterbuchartikel zu vereinfachen, wurde das gesammelte Wortmaterial des Fichero DEM nuclear zu einem guten Teil nach Wortfamilien geordnet, wenngleich diese Anordnung nicht konsequent erfolgte: So befinden sich sehr häufig z. B. Verb oder Substantiv und entsprechende suffixale Ableitungen in einem Abschnitt, während die entsprechenden präfixalen Bildungen an entsprechender Stelle des Alphabets einsortiert sind. Das Lemma oder die Lemmata einer Wortfamilie im eben beschriebenen, eingeschränkten Sinne ist bzw. sind auf einer (meist rosafarbigen) Lemmakarte festgehalten. Neben der jeweiligen Lemmaform sind darauf z. T. auch relevante Grafievarianten einer Lemmaform vermerkt, gegebenenfalls zusätzlich andere Informationen, z. B. Verweise auf andere Lemmata. In der Datenbank werden die Lemmakarten nicht angezeigt, können aber selbstverständlich im Digitalisierten Zettelkasten eingesehen werden.

Lemmakarte
  1. Lemma
  2. Grafievariante
  3. Verweis

Beleg-Fichas

Die Belege lassen sich grob in zwei Grundtypen unterscheiden, Primär- und Sekundärbelege. Während Primärbelege das Ergebnis der Auswertung von Primärquellen und damit spanischer Textdokumente des in der Regel 10. bis beginnenden 15. Jahrhunderts sind, sind Sekundärbelege das Produkt der Exzerption bzw. Verzettelung von wissenschaftlichen Sekundärquellen wie z. B. Glossaren, Vokabularien, Konkordanzen oder Fachartikeln. Die Fichas enthalten Auszüge aus diesen Sekundärwerken und stellen somit indirekte Belege für die Wortformen des mittelalterlichen Spanischen dar. Alle Belege wurden zwischen 1971 und 2005 im Rahmen des DEM erarbeitet und dokumentiert.

Primärbelege

Die auf den Fichas festgehaltenen Primärbelege sind einem Lemma zugeordnet, das in der Regel auf der Ficha oben links vermerkt ist. Das Lemma und die belegte Form, die häufig in ihrem jeweiligen Verwendungskontext notiert ist, sind normalerweise optisch hervorgehoben (z. B. durch Unterstreichung oder farbliche Markierung). Diese Fichas informieren außerdem in Form von Siglen – meist oben rechts – über die Quelle mit Angabe der Textstelle, an der sich der Beleg befindet, und über die Datierung der Quelle, der der Beleg entnommen ist. Die Quelle wird durch die Bibliografie des DEMel erschlossen. Neben den bereits erwähnten Informationen befinden sich auf vielen Fichas vorläufige Bedeutungsangaben bzw. Definitionen, z. T. auch Angaben zur Etymologie, Verweise auf andere Lemmata oder weitere Sachinformationen.

Ficha mit Primärbeleg
  1. Lemma
  2. Belegte Form
  3. Kontext
  4. Sigle
  5. Datierung
  6. Stellenangabe
  7. Bedeutung

Fichas aus der DEM-Datenbank haben eine andere Struktur. Zu Beginn des Belegs sind die Datierung, die Sigle sowie die entsprechende Stellenangabe des Belegs vermerkt. Im darauffolgenden Kontext wird die belegte Form durch einen vorausgehenden Unterstrich und z. T. durch eine farbliche Markierung hervorgehoben:

Ficha mit Primärbeleg aus der DEM-Datenbank
  1. Datierung
  2. Sigle
  3. Stellenangabe
  4. Kontext
  5. Belegte Form
Sekundärbelege

Wie die Primärbelege sind Sekundärbelege einem Lemma zugeordnet, das in der Regel oben links notiert ist. Die Sigle zur Aufschlüsselung der Quellenangabe ist zusammen mit der Datierung meist oben rechts vermerkt. Die aufgeführten Informationen unterscheiden sich je nach Aufbau und Zielsetzung des ausgewerteten Sekundärwerks.

Ficha mit Sekundärbeleg
  1. Lemma
  2. Sigle
  3. Datierung
  4. Auszug aus Sekundärwerk (im Beispiel: Textstellenangaben, ergänzt durch die Angabe des/der Manuskripte in runden Klammern sowie durch Wortformen in eckigen Klammern)

Lemmaverweise

Wie in lexikographischen Werken / Datenbanken üblich, bedient sich der Fichero DEM einer entsprechenden Verweisstruktur. Am häufigsten treten dabei die Lemmaverweise auf, die sich auf Beleg-Fichas befinden. Der Verweis, in der Regel eingeleitet durch ein Verweissymbol wie z. B. „véase“, „v. tb.“ oder einen Pfeil „→“, stellt somit eine Beziehung zwischen dem auf der Beleg-Ficha notierten Lemma und einem Verweisziel her, z. B. einem anderen Lemma oder einem oder mehreren diesem Lemma zugeordneten Beleg(en). Ist das Lemma des Verweisursprungs Bestandteil eines Mehrwortlexems, wird es auf der Ficha in der Regel durch doppelte Unterstreichung hervorgehoben, das Lemma, auf das verwiesen wird, durch einfache oder doppelte Unterstreichung. Oben rechts ist wie bei den übrigen Belegtypen die Sigle zur Aufschlüsselung der Quelle mit Datierung und Textstellenangabe des Belegs vermerkt.

Ficha mit Lemmaverweis
  1. Lemma mit Mehrwortlexem
  2. Verweis
  3. Sigle
  4. Datierung
  5. Stellenangabe

Überformate und Platzhalter für Überformate

Den Lemmata ist normalerweise nicht nur das gesamte Belegmaterial zugeordnet, sondern z. T. auch zusätzliches Material im Format DIN A4. Dazu gehören z. B. etymologische oder lexikologische Informationen oder auch sogenannte Laufzettel bzw. Ergebnisse von Suchanfragen in der DEM-Datenbank, d. h. Nachweise von Wortrecherchen zur Vorbereitung und Erstellung der Wörterbuchartikel. Zum Teil sind auch (kommentierte) Entwürfe von Wörterbuchartikeln enthalten. Das DIN A4-Material wurde im Format DIN A6 gefaltet beim zugehörigen Belegmaterial aufbewahrt. Diese Überformate wurden im Rahmen des DEMel-Projekts vor der Digitalisierung des Fichero DEM nuclear entnommen und gesondert gescannt. Im Digitalisierten Zettelkasten findet sich jetzt als Platzhalter jeweils ein blauer Hinweiszettel, auf dem die entsprechende Wortform bzw. das zugehörige Lemma und die Nummer oder die Bezeichnung des Zettelkastens notiert wurden, in den der Beleg eingeordnet war. Die Überformate selbst befinden sich im Fichero DEM nuclear IIb. Sofern auf den Überformaten Belege dargestellt waren, wurden sie zudem in die Datenbank aufgenommen. Die Platzhalter werden in der Datenbank nicht angezeigt.

 

Platzhalter für ein Überformat
Platzhalter für ein Überformat
  1. Bezeichnung des Zettelkastens
  2. Nummer des Zettelkastens
  3. Lemma
Überformat zum vorangehenden Platzhalter
Überformat zum vorangehenden Platzhalter (Seite 1)
  1. Bezeichnung des Zettelkastens, dem das Überformat ursprünglich entnommen wurde
  2. Nummer des Zettelkastens, dem das Überformat ursprünglich entnommen wurde
  3. Lemma
Überformat zum vorangehenden Platzhalter 2
Überformat zum vorangehenden Platzhalter (Seite 2)
 

Suchprotokolle

Ein speziell entwickeltes Rechercheprogramm ermöglichte der DEM-Redaktion die Durchführung eines sog. Sammelsuchlaufs in der DEM-Datenbank, der in der Regel jeweils am Ende der Bearbeitung einer Wortgruppe mit gleicher Buchstabenfolge am Wortanfang gemacht wurde, also z. B. zu den Lemmata alma, almacana, almacén 1, almacén 2 etc. Zur Kontrolle einer solchen Lemmastrecke wurde eine Serie erwartbarer Schreibvarianten am Wortanfang, neben alma- z. B. dalma-, lalma-, halma-, in der Datenbank gesucht. Die Ergebnisse des Suchlaufs wurden komplett bearbeitet, die Wortformen lemmatisiert bzw. vorhandenen Lemmata des Fichero DEM nuclear vorläufig zugeordnet. Im DEMel sind die Ergebnisse solcher Suchläufe, die aus der Datenbank stammen und in ausgedruckter Version in den Fichero DEM integriert wurden, einerseits als Images sogenannter Suchprotokolle, auf denen die Absuche aufgelisteter Quellen (mit Belegen) dokumentiert ist, zu sehen, andererseits in Form von Beleg-Fichas.

Suchprotokoll aus der DEM-Datenbank
  1. Datum des Suchprotokolls
  2. Durchsuchte Texte
  3. Gesuchte Grafievarianten
  4. Beleg 1
  5. Beleg 2

Trenner

Befinden sich im Fichero DEM nuclear auf einer Lemmakarte mehrere Lemmata, etwa im Falle von Wortfamilien, so werden die jeweils zugehörigen Belege durch in der Regel gelbe, meist unbeschriftete Zettel abgetrennt. In der Datenbank werden diese Trenner nicht angezeigt. Im Digitalisierten Zettelkasten sind sie jedoch selbstverständlich sichtbar.

Trenner

Rückseiten von Karteikarten

Beschriftete Rückseiten von Karteikarten wurden aus technischen Gründen vor der Digitalisierung im Rahmen des Projektes DEMel kopiert, oben in der rechten Ecke mit einem „R“ für „Rückseite“ versehen und in den Fichero DEM nuclear integriert. Die Images dieser Rückseiten folgen jeweils unmittelbar auf das Image der entsprechenden Vorderseite.

Vorderseite Rückseite
Vorder- und Rückseite eines Zettels

5. Die Quellen

Materialbasis des DEM-Archivs sind weit mehr als 600 Werke bzw. Text- und Dokumentensammlungen, die zwischen 1971 und 2005 in der Heidelberger DEM-Forschungsstelle ausgewertet wurden und deren Vokabular in lemmatisierter Form im Fichero DEM nuclear dokumentiert ist. Dieses Textkorpus umfasst schöngeistige Werke sowie mittelalterliche Themenliteratur, darüber hinaus eine ganze Reihe juristischer Quellentexte, darunter viele Fueros, außerdem Übersetzungen arabischer Fachtexte ins Spanische (u. a. zur Astronomie, Mineralogie, Human- und Veterinärmedizin, Pharmazie, Botanik und Agrikultur). Eine zweite wichtige Gruppe der Übersetzungsliteratur bilden die Übertragungen der kanonischen Bücher der Bibel. Neben diesen Primärquellen wurden im Rahmen des DEM-Projekts auch Sekundärquellen wie Vokabularien, Glossare, Konkordanzen exzerpiert (z. B. Alexandre Voc., ArancelesAduanas Glos., Apolonio Conc.) bzw. selbst erstellt (z. B. Alexandre Conc. (DEM), Berceo Conc. (DEM)) und in den Fichero DEM nuclear integriert. Darüber hinaus befindet sich im Fichero DEM nuclear auch Wortschatzmaterial, das aus einschlägigen lexikalischen Studien zum älteren Spanisch (z. B. Pottier, Lexique médiéval hispanique, 1980-1984 oder Alfau de Solalinde, Nomenclatura de los tejidos españoles del siglo XIII, 1969 [= Tejidos]) extrahiert worden ist. Dem jeweiligen Stand der technischen Entwicklung entsprechend liegen die Quellentexte, mit denen im DEM gearbeitet wurde, in Buch- bzw. kopierter Form, in Form von Mikrofiche bzw. -filmen und schließlich in CD-ROM-Version vor.
Bei der Erstellung von DEM-Artikeln konnte neben dem Datenmaterial in den Zettelkästen ab Mitte der 1990er Jahre auch die DEM-Datenbank genutzt werden. Diese elektronische Datenbank war ab 1992 an der DEM-Forschungsstelle in Heidelberg aufgebaut worden und enthält weit über 200 Textdateien. Einige davon umfassen große, bedeutende Textkomplexe, darunter die Mikrofiche-Editionen Concordances and Texts of the Royal Scriptorium Manuscripts of Alfonso X, el Sabio oder die Mikrofiche-Editionen der Concordances and texts of the fourteenth-century Aragonese manuscripts of Juan Fernández de Heredia; andere bestehen aus Manuskripten, z. B. aus ADMYTE, Archivo Digital de Manuscritos y Textos Españoles. Hervorzuheben ist dabei der hohe Anteil von Fachliteratur unterschiedlicher Gebiete und Bibel-Übersetzungen. Alle Texte wurden – sofern möglich – in die Datenbank eingespielt, ansonsten abgetippt (also manuell eingegeben). Editionen von Manuskripten wurden auch dann in die Datenbank aufgenommen, wenn die Texte zuvor bereits auf der Basis einer anderen kritischen Edition lexikalisch ausgewertet worden waren: So konnten zum einen Varianten eines weiteren Manuskripts erfasst werden, zum anderen konnten möglicherweise existierende Wortschatzlücken im Fichero DEM nuclear geschlossen werden. Ein Beispiel für die Berücksichtigung verschiedener Editionen ist der Libro de las Aves de Caza von López de Ayala (s. LpzAyala AvesCaça(Cummins), LpzAyala AvesCaça(ADMYTE 0) und LpzAyala Aves Caça).