Eine webbasierte, raumorientierte Forschungsumgebung (Zitieren)

Thomas Krefeld


(1958 Wörter)

Die Raumorientierung

VerbaAlpina (VA) dokumentiert die dialektale Variation innerhalb eines ethnographisch (und weder sprachlich noch national) definierten Raums, und genau in diesem Sinne ist die Konzeption durchaus ethnolinguistisch; aus rein pragmatischen Gründen wird das Untersuchungsgebiet mit dem Geltungsbereich der so genannten Alpenkonvention gleichgesetzt.

Im Vordergrund steht das Lexikon, und der onomasiologische Rahmen für die Selektion des projektrelevanten Ausschnitts wird durch kulturelle Techniken und Lebensformen abgesteckt, die sich unter den jeweils spezifischen, auch kulturunabhängigen Umweltbedingungen konventionalisiert haben. Dergleichen Räume, die durch die Alpen in prototypischer Weise repräsentiert werden, konnten die sprachwissenschaftlichen Forschungstraditionen nicht angemessen erfassen, da sich die Teildisziplinen, die sich systematisch mit der Konstitution von Räumen beschäftigen – also die Sprachgeographie, bzw. Dialektologie oder auch Geolinguistik – beinahe ausnahmslos an vorgegebenen politischen und/oder (einzel)sprachlichen Grenzen orientieren. Der räumliche Zuschnitt zentraler und in mancher Hinsicht bis heute maßgeblicher Unternehmungen ist zwar nachzuvollziehen (vgl. etwa den AIS und das FEW) – zustimmen mag man jedoch oft nicht. Gerade die besonders faszinierenden mehrsprachigen Kulturräume, also z.B. die Pyrenäen, Korsika und Sardinien im Verbund oder aber das Gebiet zwischen der montenegrinisch-albanischen Adriaküste und der Donau, fallen daher durch das Raster der etablierten, durch nationalphilologische  Voreinstellungen gesteuerten Forschung. Der ambitioniert geplante Atlante linguistico mediterraneo hätte ein richtungweisendes Großprojekt werden können; er ist jedoch über Ansätze niemals hinausgekommen.
VerbaAlpina zielt auf den Alpenraum;  das Projekt will aber weder Sprach- noch Dialektgrenzen herausarbeiten (vgl. Auer 2004) und keineswegs das Mosaik gegeneinander abgegrenzter Varietäten (Dialekte) abbilden. Vielmehr wird eine Interlinguale Geolinguistik entwickelt, die untersucht, inwieweit spezifische Varianten, nämlich die für den alpinen Kulturraum charakteristischen Bezeichnungstypen, gerade den Dialekten gemeinsam sind und sie womöglich über die Grenzen der Sprachfamilien hinaus verbinden. Die relative Ähnlichkeit der lokalen Dialekte ergibt sich induktiv aus den Daten selbst. Die einzige vorgegebene Gliederung des Alpenraums, die der Kartographie von vornherein unterlegt wird, betrifft die aktuellen Grenzen zwischen den drei großen Sprachfamilien (Germanisch, Romanisch, Slawisch).

Perspektive

Die Verteilung der Varianten in diesen dialektalen Großräumen impliziert vielfältige, mehr oder weniger weit zurückliegende Kontaktbeziehungen; daher kann die übergreifende Perspektive des Projekts nur eine historische sein. Im Blick auf den skizzierten Untersuchungsraum versteht sich VerbaAlpina allerdings nicht als Beitrag zur nationalen Sprachgeschichtsschreibung der involvierten Sprachen, sondern als Versuch, die Stratigraphie eines mehrsprachigen kommunikativen Raums exemplarisch zu rekonstruieren.

Dabei wird ausschließlich bottom up verfahren, das heißt auf Grundlage von Daten, die lokal georeferenzierbar sind. Die minimale und by default geltende Referenzeinheit ist die politische Gemeinde, genauer gesagt ein Geopunkt, der die Gemeinde als ganze repräsentiert, oder aber die gesamte Gemeindefläche. Im Bedarfsfall kann die Georeferenzierung jedoch bis auf wenige Meter präzisiert werden.

Eine webbasierte Forschungsumgebung

VerbaAlpina kann als eine webbasierte Forschungsumgebung beschrieben werden, die in den digital humanities angesiedelt ist. Dieses Format wird bestimmt durch die aktuellen Rahmenbedingungen, die sich ganz erheblich von der traditionellen Wissenschaftskommunikation unterscheiden.  So eröffnen sich in ganz selbstverständlicher Weise unterschiedliche, aber eng miteinander verflochtene Funktionsbereiche.

Funktionsbereich (1): Dokumentation

Den Zugang zur Dokumentation vermitteln zunächst unterschiedliche Filter. Sie erlauben es dem Nutzer, aus den verfügbaren Daten eine gezielte Auswahl zu treffen und kartographisch darzustellen.

In der Kartographie sind mehrere interaktive Optionen vorgesehen, die bislang über die Symbole der Punktsymbolkarten gesteuert werden. Die interaktiven Symbolkarten markieren einen substanziellen Fortschritt der linguistischen und humanwissenschaftlichen Raumdarstellung, da sie es gestatten stark abstrahierte ('synthetische') Repräsentationen mit ganz konkreten, lokalen Informationen ('analytisch') anzureichern. So zeigt die folgende Karte die Verbreitung der Bezeichnungstypen des Konzepts BUTTER im Überblick:
Invalid map id

 

Linguistische Datenaufbereitung

Bei Aktivierung ('Klick') eines Punktsymbols auf der Karte öffnet sich ein Fenster mit den jeweils für den Ort verfügbaren sprachlichen Daten. Alle Daten werden quellentreu wiedergegeben (als phonetisch transkribierter Einzelbeleg, wie im vorstehenden Beispiel, oder in orthographisch typisierter Form) und allgemeineren Typen zugeordnet; die abstrakteste Kategorie wird durch den etymologisch definierten Basistyp vertreten. Außerdem wird auf Referenzwörterbücher verlinkt, die – wenn möglich – auf standardsprachliche Äquivalente verweisen (hier die Symbole C und T). Das folgende Beispiel zeigt die Bezeichnung des Konzepts RAHM in Bergün (Graubünden):

 

groma_AIS1204_1_Typ

Wenn standardsprachliche Entsprechungen fehlen, wird auf dialektale Referenzwörterbücher verlinkt (z.B. das Schweizerische Idiotikon) .

Nicht selten sind in den ausgewählten Kategorien bereits zahlreiche sprachliche Ausdrücke verfügbar. Es wird daher die Möglichkeit gegeben, alle relevanten Ausdrücke nach unterschiedlichen Kriterien zu gruppieren und sortieren.

Alternative Visualisierung

Komplementär zur Punktsymbolkarte wird eine interaktive Flächensymbolisierung vorbereitet, um eine gute Visualisierung quantitativer Verhältnisse zu ermöglichen. Es ist noch nicht klar, ob dabei die georeferenzierten Gemeindeflächen zu Grunde gelegt werden, oder ob anstatt dessen alle Gemeinden durch 'Waben' identischer Größe repräsentiert werden; wegen der sehr unterschiedlichen Gemeindegrößen wird die optische Wahrnehmung dadurch unwillkürlich verfälscht. Im Fall gleichgroßer Karteneinträge müsste diese Form der Visualisierung (im Unterschied zum echten Voronoi-Verfahren) allerdings auf die Georeferenzierung verzichten. Hier eine mögliche Kartierung:

VA_Polygone

Quellen

Bislang wurden einige georeferenzierbare Wörterbücher (wie etwa der ALTR),  vor allem jedoch Sprachatlanten ausgewertet. Dabei wurden im Wesentlichen drei Techniken eingesetzt:

Quellentyp (1): Gedruckte Karten

Bereits auf gedruckten Karten publiziertes Material wurde mit einem speziell entwickelten Tool neu transkribiert und in die VA-Datenbank eingelesen, so im Fall der allermeisten Atlanten (SDS, AIS, TSA usw.). Im Einzelnen sind die Prozeduren für die Digitalisierung jedoch aufwändig und kaum, wenn überhaupt, zu automatisieren. Sie setzen zunächst eine rigorose Trennung der unterschiedlichen Informationen voraus, die eine analoge Sprachkarte liefert. Diese Informationen werden von VerbaAlpina in einem Wissenshorizont strukturiert, der durch die drei Dimensionen der außersprachlichen Realität, der Konzepte und der sprachlichen Ausdrücke abgesteckt wird.

Man vergleiche etwa den allgemeinen Kommentar zum Stimulus MILCH-, KÄSEKELLER, der drei Bautypen (A, E, S) unterscheidet und sie bei den Einzelbelegen um weitere Informationen ergänzt (rote Pfeile).

AIS_Milchkeller

Alle diese Hinweise werden von VerbaAlpina in abfragbare Unterkonzepte verwandelt, wie die folgende Abbildung zeigt:

Milchkeller_Unterknzpt

So wird eine differenzierte semantische Analyse der erfassten Ausdrücke ebenso möglich wie eine onomasiologische Untersuchung der Konzeptbezeichnungen.

Die folgende Abbildung zeigt die Oberfläche, auf der gedrucktes Material transkribiert wird:

Transkript_tool

Das von VA entwickelte Transkriptionstool

Quellentyp (2): Gedruckte Karten auf Basis digitalisierter Daten

Bereits auf gedruckten Karten publiziertes Material, das jedoch im Original schon digital vorliegt, wurde so konvertiert und algorithmisch neu transkribiert, dass es in die VA-Datenbank eingelesen werden konnte. Dieses Verfahren wurde für den ALD-II und den ALTR praktiziert.

Quellentyp (3): Nicht publiziertes analoges Material

Noch nicht publiziertes Material anderer Projekte wird direkt aus deren Erhebungsbögen transkribiert bzw. digital übernommen; einen Auszug aus einem Erhebungsbogen des SAO veranschaulicht die direkte Übernahme, die mit dem selben Tool erfolgen kann, das für den Quellentyp (1) benutzt wird.

SAO_Milchkeller

Fragebuchauszug aus dem SAO – Typ: 'Milchkammer' (Graphik: Stephan Lücke)

Die Datenbankeingabe der Quellentypen (1)-(3) geschieht nun zunächst mit Hilfe eines technischen Betacodes auf der Basis von ASCII-Zeichen und in einem zweiten Schritt mit einer automatischen Umsetzung der technischen Transkription in das Internationale Phonetische Alphabet (IPA), wie zwei Beispiele aus dem AIS und dem SAO zeigen:

AIS_Milchkeller_Transkription

(Graphik: Stephan Lücke)

SAO_Milchkeller_Transkription

(Graphik: Stephan Lücke)

Die Entsprechungen von Input (Quelle), Betacode und Output (Weboberfläche) werden in einer mittlerweile umfangreichen Codepage (CODEPAGE FÜR ALLE) dokumentiert.

Bei den Materialien, die bereits in digitaler Kodierung vorliegen, kann die Umsetzung in IPA im Idealfall durch entsprechende Programmierung automatisiert werden. Das war etwa im Fall der ALD-Daten möglich.

ALD_IPA

ALD-Kodierung 'edelvais' (Graphik: Stephan Lücke)

Die Quellentypen (1)-(3) ergeben oft ein inkonsistentes und wenig ausgeglichenes Bild, da nicht alle Stimuli offenkundig mit derselben Präzision abgefragt wurden; extrem sind z.B. die Details, mit den die Bezeichnungen des ALMSTALLS in der Erhebung des AIS spezifiziert wurden. Dem übergeordneten Prinzip der Quellentreue folgend werden die unterschiedlichen Gewichtungen in der Dokumentation von VerbaAlpina erhalten (Link --> Konzept --> Gebäude --> Almstall), idealerweise können sie jedoch durch Neuerhebungen ausgeglichen oder wenigstens reduziert werden.    

Quellentyp (4): Neuerhebung über soziale Medien

Der Erhebung neuen Materials ist der 'Funktionsbereich (4)' gewidmet (s.u.).

Multidimensionalität

Für ein umfassendes Verständnis der sprachhistorischen Prozesse ist es unbedingt wünschenswert, die sprachlichen Daten um andere, historisch relevante Daten zu ergänzen; das kann VerbaAlpina nur sehr bedingt leisten; immerhin sind manche relevante Daten in der 'Interaktiven Karte' über den Filter 'Außersprachliches' abrufbar. Der folgende Kartenausschnitt zeigt in synoptischer Zusammenschau einerseits die

          • Orte mit lateinischen Inschriften in der Provinz Noricum ;
          • Orte mit lateinischen Inschriften aus Raetien ;
          • aus der so genannten Tabula Peutingeriana überlieferten römische Ortsnamen an den viae publicae .

Andererseits wurden die Reflexe von drei lateinischen, genauer: zwei lateinischen und einem latinisierten, aber mutmaßlich vorrömischen Basistypen aufgerufen:

          • Basistyp lat. casearia in der Bedeutung 'Hütte'  in Nord-, Süd- und besonders prägnant in Osttirol;
          • den Basistyp vorröm. baita in der Bedeutung 'Haus'  in Slowenien südlich von Ljubljana;
          • den Basistyp lat. cellarium in der Bedeutung 'Hütte'  in Oberösterreich.

Invalid map id

Die unübersehbare Kongruenz oder wenigstens Affinität der Distributionen dürfte kaum einem Zufall geschuldet sein.

Funktionsbereich (2): Kooperation

Die Vorstellung der Quellen hat bereits auf die wichtige Rolle der Projektkooperation aufmerksam gemacht. Ihre Umsetzung ist de facto jedoch nicht immer einfach; sie wird durch praktische, d.h. vor allem informationstechnische und damit verbundene datenrechtliche  Probleme, aber am Rande auch ein wenig durch ideologische Vorbehalte gegenüber der open source-Ausrichtung behindert. Jede Kooperation stützt sich auf eine formale Vereinbarung, die den Partnern (PVA) eine exklusiv nutzbare Datenbank zum Upload zusichert. Jede Partner-Datenbank steht allen Partnern zum Download zur Verfügung. Aber die Kooperation soll selbstverständlich nicht auf Datenaustausch beschränkt bleiben; vielmehr sind alle Partner eingeladen (und aufgefordert), alle Funktionsbereiche zu nützen.

Funktionsbereich (3): Publikation

Strenggenommen ist schon die Datendokumentation im Internet eine Form der Publikation; darüber hinaus versteht sich VerbaAlpina aber auch als Instrument zur Veröffentlichung von projektbezogenen Texten. Dafür sind im Wesentlichen drei Formate vorgesehen.

          • Theoretisch und methodologisch zentrale Begriffe und Probleme sowie Hinweise zur Funktionalität der Forschungsumgebung werden in konziser Weise unter dem Reiter Methodologie abgelegt.
          • Ausführlichere analytische Untersuchungen von Projektergebnissen oder theoretische bzw. methodologische Diskussion können unter Projektpublikationen abgelegt werden.
          • Kommentare zu einzelnen sprachlichen Typen werden in der Kartenlegende durch einen 'i'-Button geöffnet; sie können dort auch sehr leicht durch Projektmitarbeiter oder Externe eingestellt werden.
i_button

Über die Legende zugängliche Kommentarfunktion

Der Kommentar zu rom. pigna | pegna zeigt exemplarisch, welchen Beitrag VerbaAlpina zur wortgeschichtlichen Forschung leisten kann.

Funktionsbereich (4):  Crowdsourcing

Damit ist die Erhebung von Neudaten über das Internet gemeint; die Umsetzung wird im Mai 2016 durch einen Pretest vorbereitet und soll im zweiten Halbjahr 2016 aktiviert werden. Dazu wird ein umfangreiches, noch nicht öffentliches Archiv ethnographischer Fotos und Videos  eingesetzt werden.

GS_2528

Herausheben des Käsebruchs (Tannheim, Bezirk Reutte, Tirol, 1940)

Funktionsbereich (5): Forschungslabor

Es ist ferner vorgesehen, ein virtuelles Forschungslabor einzurichten, das alle interessierten Nutzer einlädt, die von VerbaAlpina entwickelten geolinguistischen Tools (verschiedene kartographische Darstellungen, Typisierungsstufen u.a.) individuell zu nutzen und neue, womöglich auch alternative Analysen und Ergebnisse zu präsentieren. Selbstverständlich können auch die Tools selbst weiterentwickelt werden.


Bibliographie

  • AIS = Jaberg, Karl / Jud, Jakob (1928-1940): Sprach- und Sachatlas Italiens und der Südschweiz, Zofingen, vol. 1-7
  • ALD-II = Goebl, Hans (2012): Atlant linguistich dl ladin dolomitich y di dialec vejins, 2a pert, vol. 1-5, Editions de Linguistique et de Philologie. Link
  • ALTR = Cordin, Patrizia (2005): L'Archivio lessicale dei dialetti trentini. Link
  • Auer 2004 = Auer, Peter (2004): Sprache, Grenze, Raum, in: Zeitschrift für Sprachwissenschaft, vol. 23, 149-179. Link
  • FEW = Wartburg, Walter (1922-1967): Französisches etymologisches Wörterbuch. Eine Darstellung des galloromanischen Sprachschatzes , Basel, vol. 20, Zbinden. Link
  • SAO = Adalbert-Stifter-Institut des Landes Oberösterreich (Hrsg.) (1998ff.): Sprachatlas von Oberösterreich
  • SDS = Baumgartner, Heinrich/ Handschuh, Doris/ Hotzenköcherle, Rudolf (1962-2003): Sprachatlas der Deutschen Schweiz, Bern, vol. 1-9, Francke
  • TSA = Klein, Karl Kurt/ Kühebacher, Egon/ Schmitt, Ludwig Erich (1965, 1969, 1971): Tirolischer Sprachatlas, vol. 1-3, Innsbruck, Tyrolia-Verl. [u.a.]