VerbaAlpina – un progetto di geolinguistica plurilingue




(3167 Wörter)

Questo contributo è stato concepito e scritto per il
Convegno internazionale di studio,  Sappada / Plodn (UD), 3-7 luglio 2018.
Ringrazio Alessia Brancatelli  per la revisione del mio italiano.

Linguistica alpina: continuità dialettale e strati storici

Tre famiglie linguistiche in contatto

Nella zona alpina, le tre grandi famiglie linguistiche europee – il romanzo, il germanico e lo slavo – sono a stretto contatto tra loro (cf. la carta).1 Sono costituite ognuna da numerosi idiomi locali in continuità spaziale. Tuttavia i confini tra queste macroregioni non sono ermetici; essi sono attraversati da numerose isoglosse lessicali che segnano aree di diffusione plurilingui. È chiaro che una linguistica di stampo nazionale (ad es. 'linguistica italiana') o filologico in senso della tradizione tedescofona (ad es. 'Romanische Philologie') non si interessino di queste realtà. Il lessico di cui si tratta non è solo italiano, né romanzo, ma regionale, cioè proprio alpino in senso di VerbaAlpina. Il nome del progetto, che signifca ‘voci alpine’ in latino, è stato scelto perché è probabilmente maggiormente comprensibile per parlanti di diverse lingue della zona di riferimento, rispetto ad uno formulato in una di queste lingue particolari.

L’espressione VerbaAlpina accenna volutamente alla categoria delle cosiddette 'Alpenwörter’ ossia ‘voci delle Alpi’ in tedesco2. Questo concetto è utile per una ricerca sul plurilinguismo in quanto identifica delle unità lessicali ibride che contraddistinguono in sincronia non solo una particolare lingua, ma uno spazio culturale indipendentemente dalle lingue ivi parlate. Per rendere al meglio la categoria operazionale, si esige tuttavia una specificazione nella cornice del progetto. Dal punto di vista sincronico vengono dunque considerate ‘alpine’ le forme lessicali che hanno, nei dati disponibili a VerbaAlpina, ovvie corrispondenze in più di una sola delle tre famiglie linguistiche tradizionalmente parlate nelle Alpi. Risultano quindi quattro gruppi ibridi:

voci alpine: tipologia sincronica dell'ibridismo lessicale alpino
romanzo germanico slavo
attestazioni in x x x ‘alpine’ in senso stretto
x x ‘alpine’ in senso ampio
x x
x x

Stratigrafia

La cartografia delle attestazioni e dei tipi corrispondenti delinea la loro distribuzione areale, mentre il tipo di base identifica una famiglia lessicale, a volte anche di natura plurilingue. Si apre così una prospettiva storica da cui deriva, oltre all'ibridismo sincronico, un criterio diacronico per l'individuazione delle voci alpine: quello dell'origine esogena. Per definizione, le voci endogene e non ibride non possono mai essere definite come 'alpine'; le voci non ibride in sincronia invece sì, a condizione che abbiano origine in un'altra famiglia linguistica, cioè quelle esclusivamente romanze di origine non latino-romanza, quelle esclusivamente germaniche di origine non germanica e quelle slave di origine non slava. L'origine esogena però non dà alcun indizio su quali siano le vie concrete percorse dai prestiti. Questi percorsi vanno, dunque, ricostruiti e iscritti nella stratigrafia linguistica dell'area di distribuzione. Per le voci alpine risultano le costellazioni elencate sotto:

voci alpine: tipologia diacronica dei rapporti stratigrafici
origine tipo di base rapporto stratigrafico famiglia ling. attuale
prelatino - sostrato - → romanzo
romanzo - sostrato, adstrato - → germanico
→ slavo
germanico - superstrato, adstrato - → romanzo
→ slavo
slavo - adstrato - → romanzo
- sostrato, adstrato - → germanico

 

 

 

 

 

 

 

 

Se aggiungiamo il parametro della successione storica, risulta grosso modo lo schema seguente:

AREALI ALPINI
ATTUALI
STRATO romanzo STRATO germanico (ted.) STRATO slavo (slov.)
SUPERSTRATO ted. austr.
zellenfülltextzellenfü SOSTRATO 
SUPERSTRATO ger. SOSTRATO
AREALE ALPINO
TARD. ANT.
 latino-romanzo
SOSTRATI prelatini
rosso=prelatino, grigio=latino-romanzo, blu=germanico, giallo=slavo

Si noti l’importanza fondamentale dello strato latino-romanzo:

  • esso costituisce lo strato di referenza per tutta la zona alpina, la quale faceva parte dell’impero romano nella sua totalità, sebbene con notevoli differenze rispetto al grado di romanizzazione locale;
  • lo strato latino-romanzo ha lo spessore storico più importante;
  • le tracce degli strati prelatini passano per quello latino-romanzo e sono quindi  fonologicamente e morfologicamente più o meno adattati; contatti diretti tra gli strati postlatini e prelatini non sono assolutamente esclusi, ma molto poco probabili (si veda, comunque, Hubschmied 1936 per il celtico).

Un nome alla ricerca

Coesistono diverse denominazioni per la ricerca sulla realtà linguistica locale, ovvero 'dialettologia', 'geografia linguistica' e 'geolinguistica'. Esse però non sono totalmente sinonimi né ugualmente adatte alla descrizione di aree plurilingui:

  • ’Geografia linguistica’ pone l’accento sulla geografia e non sulla lingua.
  • ‘Dialettologia' focalizza l'attenzione sullo stato sociologico che viene indagato della lingua, ovvero quello di essere ‘dialetto’ non autonomo rispetto ad una lingua; il termine non è quindi idoneo per una ricerca che risalga anche ad un periodo anteriore alla formazione dello standard e del diasistema attuale.
  • Resta la denominazione più neutra di ‘geolinguistica’ che si applica anche bene a zone come quella alpina3, che sono da lungo tempo plurilingui e nei territori delle varie lingue anche particolarmente frammentate. Si tratta quindi di una geolinguistica plurilingue che non focalizza l'attenzione sulle singole varietà dell’intero mosaico, bensì sulle varianti che queste hanno in comune.

L'idea di VerbaAlpina è quella di creare un'infrastruttura panoramica del lessico alpino, sebbene molto selettiva perché ridotta a un settore classificato come  ‘alpino’ per motivi etnolinguistici. Essa dovrebbe dare la possibilità, da un lato, di raccogliere, strutturare e analizzare i dati linguistici e dall'altro di poterli consultare in un modo facilmente accessibile.

Documentazione

Accesso onomasiologico: dalle cose alle parole

Per la consultazione del materiale documentato è stato implementato un ambiente di ricerca virtuale che propone due direzioni d’accesso, di cui una onomasiologica che si impone per l’impostazione etnolinguistica del progetto. Partendo dalle ‘cose’ è quindi possibile selezionare le unità della realtà extra-linguistica chiamate concetti (notati sempre in maiuscolo).

I concetti sono fondamentali per ogni documentazione plurilingue, perché forniscono la referenza comune delle varie versioni linguistiche; tuttavia non è sempre facile fissarli e pare necessario usare strategie diverse per farlo:

  • Per alcuni segmenti della realtá esistono nomenclature universalmente riconosciute come, ad esempio, la classificazione binomia stabilita da Carlo Linneo in lingua latina per la biologia.
  • Quando possibile, i concetti di VerbaAlpina sono anche visualizzati accompagnati da foto che appaiono quando vi si passa sopra il cursore del mouse. La foto seguente mostra un'immagine del cosiddetto torno, una sorta di grua che permette di girare la caldaia per fare il formaggio sul fuoco o via del fuoco. Ovviamente, l'idea dell’illustrazione dei concetti non è un'opzione universale, sia perché foto o immagini non sono sempre disponibili, sia perché il grado di astrazione la esclude.
  • Nonostante l’esistenza di eventuali termini di nomenclatura o foto, sono irrinunciabili le definizioni verbali formulate nella variatà standard di una delle lingue di navigazione e poi tradotte nelle altre. La definizione ha il grande vantaggio di essere direttamente comprensibile per l'utente; accentua però il rischio di un malinteso: l'utente potrebbe pensare che essa si focalizzi su una designazione particolare della lingua. Per prevenire questo equivoco è consigliato formulare i concetti in modo tecnico, ad esempio dicendo RECIPIENTE PER FARE IL FORMAGGIO anziché CALDAIA; i concetti sono inoltre trascritti in maiuscolo, e non in corsivo come le designazioni.
  • Con il plurilinguismo extraordinario di Wikipedia è emersa una base di conoscenza chiamata [Wikidata che riunisce identificatori per i contenuti trattati in varie lingue. Ad esempio, il concetto di BURRO, cui sono dedicati articoli Wikipedia in 132 lingue (e dialetti), porta l'identificatore  Q34172. Considerando l'enorme diffusione di Wikipedia, è lecito adottare Wikidata come standard onomasiologico. Naturalmente mancano numerosi identificatori per concetti specifici; esiste ad esempio un identificatore per la ZANGOLA, ma non per le sue diverse tipologie (da girare, da stampare ecc.; cf. AIS carta 1206). I progetti linguistici con una componente onomasiologica che si avvalgono delle tecnologie web dovrebbero, anzi, devono quindi contribuire ad arricchire Wikidata con nuovi identificatori.

Accesso semasiologico: dalle parole alle cose

In direzione opposta è possibile rintracciare le designazioni nella loro distribuzione areale e conoscere i concetti a cui si riferiscono. Ad esempio le forme locali in correspondenza con ita. scotta nell'ambito della produzione di formaggio significano sia la massa coagulata (FORMAGGIO, RICOTTA), sia il liquido (SIERO).

Tipizzazione

Per garantire una presentazione sintetica della variazione linguistica spesso molto dettagliata vengono simboleggiati tipi morfo-lessicali, cioè specifici gruppi di attestazioni definiti da criteri morfologici. È però sempre possibile risalire alle singole attestazioni cliccando sul simbolo che evidenzia l’esistenza locale del tipo. Ecco un esempio  che mostra un'attestazione locale del tipo morfo-lessicale fra. beurre/ita. burro.            

Molto utile per l'analisi del plurilinguismo e del contatto linguistico in particolare è la categorie storica chiamata 'tipo di base'. Contrariamente ai tipi morfo-lessicali, un tipo di base può comprendere non solo varianti di una stessa famiglia linguistica, bensì anche eventuali prestiti nelle altre famiglie, come viene schematizzo nella figura seguente:

Schema della tipizzazione

Di seguito vengono presentate  alcune costellazioni stratigrafiche esemplari.

1° Esempio: stratigrafia del tipo di base butyru(m)

Il tipo fra. beurre/ita. burro appena citato deriva da un tipo di base greco-latino, cioè da butyru(m) (cf. la cartina per la distribuzione  areale e il commento lessicologico).

Lo stesso tipo di base è anche rappresentato da molte attestazione slave e germaniche; in tedesco, le varianti corrispondono a due tipi morfo-lessicali, uno femminile, come lo standard  ted. ) e l'altro maschile dei dialetti meridionali, ted. der Butter. L'esempio mostra anche la necessità di tener conto di certi tipi fonetici, perché le attestazioni romanze continuano due varianti fonetiche già latine alla base:

  1. una forma secondaria bútyru(m) con accento iniziale; essa spiega anche le forme standard fra. beurre, ita. burro;
  2. la forma parossitona butýru(m) dalla quale deriva, tra molte altre, la variante ita. butirro.

A livello del tedesco spiccano forme fonetiche con iniziale sonora [b-] da un lato e con iniziale sorda [p-] dall'altro.

Ne risulta la seguente tipologia lessicologica:

 famiglia linguistica attestazione  tipo fon.  tipo morfo-less.  tipo di base
rom. bˈyːrĭ  

senza occl. dentale beurre/burro

 

sost. m. butyru(m)
bˈir
bˈœːrɔ
[altre 342]
bʏtˈeːr
con occl. dentale  
butirro
butˈiro
botˈer
[altre 373]
ger. p͉utr p- iniziale      sost. m. der Butter 
p͉uːt͉ɐ
 [altre 205]
p͉uːt͉ɐ sost. f. die Butter 
[altre 5]
sla. pútər puter sost. m.
 putr
[altre 17]

La iniziale sorda [p-] è assente in zona romanza e caratterizza sia i dialetti tedeschi meridionali sia lo sloveno, ma solo in tedesco corrisponde ad una regola della fonetica storica. Ne possiamo concludere che il tipo sloveno è un prestito del tedesco austriaco carta. Il tipo di base butyru(m) si presenta dunque come una costellazione stratigrafica abbastanza complessa con riflessi romanzi nello strato di origine, riflessi sostratali in ted. e superstratali in sloveno:

AREALI ALP. STRATO romanzo STRATO ger. (ted.) STRATO slavo (slov.)
ATTUALI beurre/burro (m.) butirro (m.) die Butter (f.)
puter
der Butter/Puta (m.) SUPERSTRATO TED. AUSTR. ↑
↑ SOSTRATO
var. bútyru(m) var. butȳru(m)
TARD. ANT.  latino-romanzo butyrum
grigio=latino-romanzo, blu=germanico, giallo=slavo

2° Esempio: stratigrafia del tipo di base excŏcta

Il processo fondamentale nella caseificazione è la coagulazione del latte che permette di separare le componenti liquide da quelle solide. Per fare coagulare il latte è necessario riscaldarlo e aggiungervi il caglio: sia la massa del formaggio che il siero sono dunque il prodotto di una 'cottura' e la designazione del tipo scotta (< lat. excŏcta) è perfettamente motivata per entrambi. Questa ambiguità metonimica si rispecchia ampiamente nei dati raccolti per VerbaAlpina come illustrato dalla seguente carta. Si tratta allo stesso tempo di una voce alpina prototipica: il tipo è rappresentato nelle tre famiglie linguistiche e risale in germanico e slavo, a quanto pare, direttamente al sostrato latino-romanzo. Il tipo sloveno skuta continua chiaramente il nesso consonantico iniziale [sk-], passato a [∫k-] nel friulano adiacente.

AREALI ALP. STRATO romanzo STRATO ger. (ted.) STRATO slavo (slov.)
ATTUALI scotta die Schotten skuta
↑      SOSTRATO     ↑     
TARD. ANT.  latino-romanzo excŏcta
grigio=latino-romanzo, blu=germanico, giallo=slavo

3° Esempio: stratigrafia dei tip di base camera Zimbar

Coesistono in tedesco e in sloveno due tipi morfo-lessicali oggi in gran parte sinonimi, cioè ted. ZimmerKammer e slv. cimerkamra con il significato generico di 'stanza'; essi appaiono  ad esempio sulla cartina SOFFITTA. Mentre il tipo Zimmer, antico tedesco meridionale Zimbar, è di’origine germanica4, l’altro risale chiaramente al lat. camera che era già un prestito al greco5. I riflessi tedeschi e anche sloveni sembrano essere prestiti al sostrato latino-romanzo; rispetto allo sloveno sono le  forme palatalizzate che appoggiano l'origine almeno in parte sostratica del tipo, invece del loro trasferimento indiretto dovuto al superstrato e/o adstrato tedesco. Nonostante la loro sinonimia nelle varietà recenti rappresentano due tradizioni edilizie alternative, in parte anche complementari, cioè su base di legno nel caso di Zimbar  e su base di pietra/mattone l'altra. La loro distribuzione geolinguistica riflette dunque l'espansione dell'edilizia in pietra sin dai tempi romani e, d'altra parte, la conservazione dell'edilizia in legno nella zona alpina, dove entrambi i materiali edili sono facilmente disponibli.

E si noti che anche un altro tipo di base germanico dello stesso campo onomasiologico è stato trasferito allo sloveno, antico tedesco meridionale thilla, ted. Diele 'asse per fare pavimenti; pavimento di legno'. Esattamente come il tipo di base Zimbar non pare essere trasferito al romanzo (cfcarta). Risulta quindi la seguente costellazione stratigrafica:

AREALI ALP. STRATO romanzo STRATO ger. (ted.)
STRATO slavo (slov.)
ATTUALI camera Kammer Diele , Zimmer→ → dilje, cimr kamra
SOSTRATO ↑   
SOSTRATO ↑
TARD. ANT.  latino-romanzo camera
grigio=latino-romanzo, blu=germanico, giallo=slavo

4° esempio: stratigrafia del tipo di base caseus

A prima vista, questo tipo potrebbe apparire come poco vistoso perché corrispondente alla variante standard, cioè a ted. Käse, designazione generica di qualsisiasi prodotto caseoso; la parola è bene attestata in ted. meridionale antico (cf. kâsi). In realtà, il tipo di origine latina si rivela essere molto particolare perché designa il prodotto quasi emblematico della vita alpina ad alta quota. Nella zona germanofona coesistono pochissimi geosinonimi, ma stranamente caseus non si è conservato nello strato romanzo attuale, come mostra la carta. Sono invece documentati parecchi sinonimi (vd. carta), in parte anche ben diffusi come tomaformaggio. Sembra tuttavia che il tipo di base esistesse già prima, come suggerisce l’esistenza di parecchi derivati tra cui anche il grigionese caschiel che rappresenta un diminutivo (< lat. caseolus). Ecco lo schema stratigrafico:

AREALI ALP. STRATO romanzo STRATO ger.  (ted.) STRATO slavo (slov.)
ATTUALI Kas, Käse
      SOSTRATO  ↑          
TARD. ANT.  latino-romanzo caseus
grigio=latino-romanzo, blu=germanico, giallo=slavo

Il tipo di base latino si è conservato altrove, ad esempio nel tipo cacio dell‘Italia centrale e meridionale (cf. AIS 1217, salare il formaggio  e nell‘iberoromanzo (por. queijo, spa. queso ecc.).

5° esempio: stratigrafia dei tipi di base *toma e forma/formaticum

Il fatto che questo tipo sia stato sostituito nelle regioni abitate dalle popolazioni celtiche (Italia sett., Francia, Alpi) fa pensare a uno sviluppo avanzato delle tecniche di caseificazione negli ambienti culturali correspondenti. Si noti anche che si tratta in parte di tipi sostratici, (ad es. toma), magari collegati a tecniche assunte dai romani, e in parte di tipi innovativi, come ad esempio il tipo di base forma, appena menzionato, cui appartengono fra. fromage, ita. formaggio ecc.

AREALI ALPINI   STRATO romanzo
STRATO ger.
STRATO sla.
ATTUALI tomme/toma
fourme, fromage/formaggio
   
MEDIEV.   ted.mer.ant. formizzi  
   
TARD. ANT.  latino-romanzo forma(m), [caseum] formaticum
 celt. *toma - SOSTRATO prelatino
rosso=prelatino, grigio=latino-romanzo, blu=germanico, giallo=slavo

Il caso merita un commento. Il tipo fra. tomme / ita. toma è piuttosto generico e semanticamente non motivato in sincronia; il significato largamente predominante è quello di 'formaggio', qua e là anche 'cagliata' o 'formaggio freschissimo', cioè la massa solida dopo il riscaldamento e la coagulazione del latte (cf. carta). Al contrario, il tipo forma/formaticum è ben motivato: esso significava originariamente 'massa caseosa messa in forma e indurita'. È anche attestato in tedesco meridionale antico nella variante formizzi.

Si noti poi che il volume della massa è ridotto quando essa viene messa e premuta in uno stampo dove rimane per stagionare. È dunque anche ben motivato il diminutivo romancio caschiel, oggi generico ma forse originariamente usato per la massa messa in forma e ridotta di volume. È inoltre chiaro che il prodotto messo in forma e indurito risulta molto più prezioso e pregiato rispetto alla massa caseosa fresca, perché esso si conserva a lungo. Non sorprende, quindi, che la designazione sia stata tanto generalizzata al punto tale che fra. fromage / ita. formaggio significano oggi qualsiasi prodotto caseario.


  1. Sulle implicazioni storiche si veda Štich 2014

  2. si vedano a proposito i ben noti lavori di Jud 1911aJud 1911b, Jud 1924, Stampa 1937, Hubschmid 1950 e Hubschmid 1951 

  3. nel concreto, la zona indagata da VerbaAlpina coincide con il cosiddetto perimetro della Convenzione delle Alpi 

  4. Cf. Kluge 2012,  online o.S.: "Zimmer, Sn std. (8. Jh.), mhd. zimber, zim(m)er m./n.ahd. zimbar, as. timbar ‛Wohnraum, Wohnung, Holzbau, Bauholz’.
    Aus g. *temra- n. ‛Bauholz, Gezimmertes’, auch in ­anord. timbr, ae. afr. timber; gt. in tim(b)rjan ‛zimmern’ (wie ­anord. timbra, ae. timbr(i)an, afr. timbria, timmeria, as. timbronahd. zimb(a)rōn, mhd. zimbren, zimmern, nhd. zimmern). [...]". 

  5. Kluge 2012 (online, o.S.):
    "Kammer Sf erw. obs. (8. Jh.), mhd. kamer(e)ahd. chamara, as. kamara Früh entlehnt aus l. camera ‛gewölbte Decke’, dann ‛Zimmer mit gewölbter Decke, Wölbung’, das seinerseits aus gr. kamára ‛Gewölbe, gewölbte Kammer’ entlehnt ist. [...] Ebenso nndl. kamer, ne. chamber, nfrz. chambre, nschw. kammare, nnorw. kammer".
    La lessicologia greca conferma la posizione di Kluge; cf. LSJ, s.v. κᾰμάρ-α, Ion. κᾰμάρ-η [μᾰ], ἡ). 


Bibliographie

  • Hubschmid 1950 = Hubschmid, Johannes (1950): Vorindogermanische und jüngere Wort­schichten in den romanischen Mundarten der Ostalpen, Tübingen, in: Zeitschrift für romanische Philologie, vol. 66, Niemeyer, 1-94. Link
  • Hubschmid 1951 = Hubschmid, Johannes (1951): Alpenwörter romanischen und vorromanischen Ursprungs, Bern, Francke
  • Hubschmied 1936 = Hubschmied, Johannes (1936): Ausdrücke der Milchwirtschaft gallischen Ursprungs: dt. "senn, ziger," lomb. "mascarpa, maoka, matü", Bern, in: Vox Romanica, vol. 1, Francke, 88-105. Link
  • Jud 1911a = Jud, Jakob (1911): Dalla storia delle parole lombardo-ladine, Cöthen, Anhalt, in: Bulletin de dialectologie romane (BDR) 3, 1-18, Schulze, 63-86
  • Jud 1911b = Jud, Jakob (1911): Parole oscure del territorio alpino
  • Jud 1924 = Jud, Jakob (1924): Zu einigen vorromanischen Ausdrücken der Sennesprache, Berlin, in: Zeitschrift für Deutsche Mundarten, vol. 19, Allgem. Dt. Sprachverein, 199-209. Link
  • Stampa 1937 = Stampa, Renato Agostino (1937): Contributo al lessico preromanzo dei dialetri lombardo-alpini e romanci, Zürich; Leipzig, Niehans
  • Štich 2014 = Štich, Peter (2014): Begegnung, Akkulturation und Integration am Berührungspunkt der romanischen, germanischen und slawischen Welt, Ostfildern, Thorbecke, Härtel, Reinhard, Akkulturation im Mittelalter

VerbaAlpina – oder: der Transfer der Geolinguistik in die digital humanities


Schlagwörter: Alpendialekte , Digitale Geisteswissenschaften , DH , Digital Humanities , Dokumentation , Geolinguistik , Sprachatlas

(4483 Wörter)

Dieser Beitrag wurde anlässlich eines Vortrags am 29.5.2018 in der Sächsischen Akademie der Wissenschaften verfasst1; alles ist vor dem Hintergrund der eher informationstechnisch  ausgerichteten Ausführungen von Stephan Lücke zu sehen.

1. Die Sprachwissenschaft auf dem Weg in die digital humanities

Seit ca. 15 Jahren, d.h. seit der zügigen Durchsetzung interaktiver und kollaborativer Strukturen im Internet Web 2.0  durchlaufen zahlreiche wissenschaftliche Disziplinen einen Prozess tiefgreifenden Wandels, denn im Gefolge der medialen Revolution haben sich die Rahmenbedingungen der Wissenschaftskommunikation substantiell verändert; symptomatisch ist  die oben auf dieser Seite angebrachte Einladung Schreibe eine Antwort. In den Disziplinen, die sich mit kulturellen Techniken und ihrer geschichtlichen Entwicklung befassen, kann dieser Wandel mit dem Schlagwort der digital humanities identifiziert werden. Es ist dennoch nicht überraschend, dass die Wissenschaftler unterschiedlich auf diese Situation reagieren, nämlich teils mit

  • offensiver Ablehnung (Motto: "Das bedeutet den Ausverkauf der akademischen Fächer"),
  • nonchalanter Indifferenz (Motto: "Der kindische Unfug lässt mich kalt"),
  • konstruktiver Akzeptanz (Motto: "Endlich wird möglich, was ich immer schon wollte").

Nicht im Sinn eines missionarischen Eifers, sondern aus rein forschungspraktischer Überzeugung sei festgestellt, dass für datenorientierte Disziplinen, wie zum Beispiel für diejenigen Bereiche der Sprachwissenschaft, die sich mit Variation und historischen Prozessen befassen, eigentlich nurmehr die dritte Haltung in Frage kommt. Wenn man die mediale Herausforderung jedoch in diesem Sinn annimmt, ändert sich methodologisch fast Alles.

2. Geolinguistik

Die Geolinguistik2 ist in geradezu idealer Weise geeignet, um die Notwendigkeit des skizzierten Transfers zu illustrieren. Zunächst ist diese Subdisziplin von Anfang an mit dem Anspruch entstanden, gesprochene Sprache zu dokumentieren; sie stand, mit anderen Worten, zu Beginn nicht in der text- und editionsorientierten Tradition der Philologie (vgl. Krefeld 2007).  Ausserdem entwickelte sich die Geolinguistik vor allem dank der teils monumentalen Sprachatlanten  zu einer Art Korpuslinguistik avant la lettre. Der AIS3, den man als den gattungsprägenden romanischen Vertreter der Tradition ansehen darf, versammelt in 1681 Karten, 20 Konjugationstabellen und zahlreichen ergänzenden Listen Belege aus 416 Aufnahmeorten (vgl. die Beschreibung in Krefeld 2017c); das entspricht mindestens einer Million Tokens. Immerhin wurde das gesamte Material 20 Jahre später Jahre durch einen gedruckten Index aufgeschlüsselt (vgl. Jaberg/Jud 1960), der sich selbst als Ein propädeutisches etymologisches Wörterbuch der italienischen Mundarten bezeichnet.4 Auf geradezu selbstverständliche Art wurden daher Autoren von Sprachatlanten zu Pionieren der sprachwissenschaftlichen Digitalisierung (vgl. dazu Hans Goebls Bemerkungen in Goebl 2018). 

Das zweite Forschungsinstrument der traditionellen Geolinguistik, das in repräsentativen Fällen ebenfalls monumentale Ausmaße annimmt,  ist das Wörterbuch; seine herausragenden Vertreter operieren ebenfalls in der Logik von Atlanten, d.h. auf der Basis eines mehr oder weniger engmaschigen Netzes von Aufnahmeorten. So sind u.a. die exhaustiv intendierten Lexika der Schweizer Landessprachen (vgl. DRG, GPSRIdiotikonVSI) und das Wörterbuch der bairischen Mundarten in Oesterreich WBOE angelegt (vgl. die Kartierung der Ortsnetze dieser alpinen Dialektwörterbücher in der Darstellung durch VerbaAlpina). Vor dem Hintergrund der digital humanities erscheint es nun nicht nur realistisch sondern geradezu geboten, diese unterschiedlichen Datenquellen zusammenzuführen und in ein Gesamtkorpus zu verwandeln. Diesen Versuch unternimmt in onomasiologisch definierten Ausschnitten des Wortschatzes das Projekt VerbaAlpina, das als virtuelle, webbasierte Forschungsumgebung beschrieben werden kann.

3. VerbaAlpina als Beispiel einer Forschungsumgebung

Genauer gesagt ist die Korpuserstellung Gegenstand eines als ‘Dokumentation’ bezeichneteten Funktionsbereichs, der in enger Verflechtung mit vier anderen Funktionalitäten zu sehen ist:

  • Dokumentation,
  • Kooperation,
  • Datenerhebung durch Crowdsourcing,
  • Forschungslaboratorium,
  • Publikation.

Alle genannten Bereiche sollen im Folgenden projektbezogen konkretisiert werden. Zum Verständnis ist jedoch vorab eine Skizze des erforschten Raums erforderlich.

3.1. Das Untersuchungsgebiet

Das Projekt VerbaAlpina, das der Verfasser dieses Beitrags gemeinsam mit Stephan Lücke von der ITG der LMU leitet, wird seit 2014 von der Deutschen Forschungsgemeinschaft (DFG) gefördert. Gegenstand ist die Mehrsprachigkeit des Alpenraums5, in dem sich die drei großen europäischen Sprachfamilien, Germanisch, Romanisch und Slawisch getroffen haben und seit ca. 1500 Jahren neben-, mit- und unter Umständen auch gegeneinander existieren (vgl. Karte).

Die Sprachverhältnisse sind erheblich komplizierter als die Rede von den drei 'Familien' sowie die suggestive Flächigkeit ihrer kartographischen Darstellung andeutet, denn dazu gehören im Romanischen eine ganze Reihe von staatlich implementierten Sprachen mit jeweils sehr verschiedenen Dialekten; im Germanischen und Slawischen gibt es zwar jeweils nur eine Sprache (Deutsch und Slowenisch); beide sind jedoch ebenfalls durch ganz unterschiedliche, lokale Dialekte, genauer gesagt: durch Dialektkontinua6 vertreten.

Dialekt (unvollständig) Dialektgruppe Sprache Sprachfamilie
Valdostano / Valdôtain  Valdostano / Valdôtain  rom
Occitan  Okzitanisch
Francoprovençal  Frankoprovenzalisch
Piemontese Italienisch
Lombardo
Bregagliotto
 Veneto
Puter Bündnerromanisch
Surmiran
Sursilvan
Sutsilvan
Vallader
Jauer
Badiot Dolomitenladinisch
Maréo
Gherdëina
Fascian
Anpezan
Fodom
Furlan  Friaulisch
Alemannisch Alemannisch Deutsch ger
Walserisch
Vorarlbergerisch
Schwäbisch
Bairisch Bairisch
Allgäuerisch
Zimbrisch
Tirolerisch
Steirisch
Kärntnerisch
Salzburgisch
Oberösterreichisch
Dolenjsko Slowenisch sla
Koroško
Štajersko
Gorenjsko
Rovtarsko
Slovenščina
Rezijansko

Es ist seit geraumer Zeit bekannt, dass etliche spezifisch alpine Wörter nicht auf eine der drei Sprachfamilien beschränkt sind, sondern über deren Grenzen hinaus Verbreitung gefunden haben (vgl. die klassischen Arbeiten von Jud 1911aJud 1911b, Jud 1924, Stampa 1937, Hubschmid 1950 und Hubschmid 1951). Gerade eine sprachgrenzüberschreitende Untersuchung ist  also erforderlich und als einzige diesem Raum angemessen. Die folgende Graphik schematisiert die alpine Sprachgeschichte; konstitutiv sind die Romanisierung des gesamten Gebiets (seit 15 vor Chr.) und seine nachfolgende teilweise Germanisierung und Slawisierung. Damit ist zwar stets eine  Verdrängung der jeweils früheren Sprachen verbunden, insofern das Lateinisch-Romanische  die vorrömischen Sprachen verdrängt und  seinerseits in manchen Gebieten durch das Germanische und Slawische verdrängt wird. Aber der Verdrängung geht eine mehr oder weniger lang andauernde lokale Zweisprachigkeit voraus (in der Graphik durch Kugeln symbolisiert), die sich in Entlehnungen aus den verdrängten in die verdrängenden Sprachen niederschlägt, so dass sich die erwähnten sprachgrenzüberschreitenden Verbreitungsgebiete ergeben.


Es ist nun aber von vornherein klar, dass die Dokumentation eines so komplexen Sprachraums mit der skizzierten historischen Tiefe durch das Medium des gedruckten Buchs kaum, wenn überhaupt, zu leisten ist. Ein Zugriff im Sinne der digital humanities drängt sich deshalb schon rein sachlich auf.7

3.2. Funktionsbereich Dokumentation

Die Dokumentation erfasst unabhängig von der Quellengattung und ganz im Sinne der klassischen Dialektologie, ausschließlich georeferenzierbares oder bereits georeferenziertes Material; es werden also Atlas– und (wenngleich weniger) Wörterbuchdaten erfasst. Einen maximalen Überblick über die einschlägigen Erhebungsorte (Stand 2018) zeigt diese Karte. Praktisch alle Belege sind über das Erhebungsdatum im Übrigen auch chronoreferenziert8; allerdings ist die Chronoreferenzierung derzeit (Mai 2018) noch nicht interaktiv implementiert.

Eine weitere, informationstechnisch grundlegende Bedingung des Transfers ist die Strukturierung der Daten. Materialien aus älteren Quellen werden in der Regel erst von VA im Zuge der Retrodigitalisierung, also mit  ihrer Umwandlung in Daten,  strukturiert; strenggenommen wird Retrodigitalisierung überhaupt erst dann wirklich sinnvoll, da sie nur so eine digitale Nachnutzung analogen Materials  gestattet.

Die grundlegende Herausforderung besteht darin die unterschiedlichen semiotischen Dimensionen der Quellen zu sezieren. Das ist insbesondere im Fall der Sprachatlanten nicht immer leicht, denn eine analoge Karte, wie z.B. AIS 1192a LA CASCINA DI MONTAGNA, informiert über Sprache, außersprachliche Konzepte/Kategorien und singuläre Dinge, ohne dass der Status einer Information immer ganz eindeutig wäre. So finden sich in VA (Stand vom 4.5.2018) 1169 dialektale Bezeichnungen (Tokens) des Konzepts ALMHÜTTE; sehr häufig wird die Art des Gebäudes spezifiziert, so dass etliche Unterkonzepte unterschieden werden müssen. Beispielsweise haben die Informanten des VALTS in drei Orten darauf hingewiesen, dass die Bezeichnungen des Typs Tieje/Teie(n) eine PRIMITIVE SENNHÜTTE AUF MAIENSÄSSEN bezeichnen. In anderen Orten steht derselbe Typ für andere Unterkonzepte bzw. für das taxonomisch übergeordnete, alllgemeine Konzept HÜTTE. Ob sich die Spezifizierungen jedoch wirklich auf die Wortsemantik, bzw. eine feste konzeptuelle Kategorie oder womöglich auf die Qualität eines bestimmten Referenten bezieht, die der individuelle Informant mit dem Wort assoziiert, ist unklar. Das Problem wird ganz evident, wenn singuläre außersprachliche Realitäten detailliert abgebildet werden, wie im Fall der folgenden Grundrisse einer Sennhütte aus dem engadinischen Zernez (AIS, P 19):

AIS 1192a

Handelt es sich hier um einen weit verbreiteten Bautyp im Sinne einer außersprachlichen Kategorie oder um einen idiosynkratischen Fall?

Schließlich liefern manche Quellen auch Informationen über ihre Informanten. Grundsätzlich sind bestimmte Charakteristika für die richtige Beurteilung der sprachlichen Belege wichtig; dazu zählen vor allem die Sprachkompetenz (Standard, evtuelle Kontaktsprachen), das Alter und das Mobilitätsprofil (vgl. die Fallbeispiele in Krefeld 2018). Auch in dieser Hinsicht war bereits der AIS wegweisend, denn er teilt in den Aufnahmeprotokollen relevante biographische Daten mit, allerdings ohne sie bei der Kartierung zu berücksichtigen9. Obwohl die Sprachkompetenz des Sprechers also zu den Dimensionen möglicher Variation gerechnet werden muss, wurde in der interaktiven Karte von VerbaAlpina auf die Einrichtung eines entsprechenden Filters verzichtet, denn die meisten Quellen geben keine diesbezüglichen Informationen.

Strukturierung ist Voraussetzung für die Erstellung eines Korpus im Sinne der zeitgenössischen Linguistik; sie erlaubt auch die Entwicklung einer interaktiven Oberfläche mit sehr benutzerfreundlichen Suchfiltern, wie in Gestalt der interaktiven Karte . Ein wichtiger Schritt der Dokumentation besteht in der Vereinheitlichung der Transkription; die unterschiedlichen Systeme der Quellen werden allesamt durch einen eigens definierten Betacode  in den international weit verbreiteten Standard IPA übersetzt (vgl. die vollständige Übersicht). Die Konversion der Transkription impliziert keinen Informationsverlust, denn auch die Originaltranskription (="DST QUELLE ...") wird sichtbar, sobald man mit dem Mauspfeil auf den 'Einzelbeleg' oben links im Belegfenster fährt. Das zeigt der folgende Screenshot:

VA-Transkription in IPA und Sichtbarkeit des Originals

Wenn möglich werden alle dialektalen Sprachbelege als Varianten weiter verbreiter Typen identifiziert und auf großen Referenzwörterbücher bezogen (hier L = LSI und H = HdR ). Schwieriger ist die Verknüpfung der KONZEPTE mit einem allgemein  etablierten, außersprachlichen Referenzsystem; de facto ist  etwas Derartiges mit dem umfassenden, kontinuierlich wachsenden  Wikidata-Projekt entstanden. Dort wird die gemeinsame außersprachliche Referenz der verschiedenen, oft sehr zahlreichen einzelsprachlichen Wikipedia mit einer Identifikation (ID) versehen; sie kann aus jedem Wikipidia-Eintrag über die Funktion Wikidata-Datenobjekt aufgerufen werden. Dieser Dienst beinhaltet auch bereits seit langem übliche Taxonomien, wie etwa im Bereich der Flora die auf Carl von Linné zurückgehende Nomenklatur. So kann das Konzept BUTTER , das in 132 verschiedenen Sprachversionen der Wikipedia behandelt wird über die ID Q34172 identifiziert werden.

Qualitative und quantitative Kartierung

Grundsätzlich lassen sich strukturierte Daten sowohl qualitativ als auch quantitativ (oder: metrisch) erschließen. Hier stellen sich aus geolinguistischer Sicht sehr unterschiedliche Fragen, die sowohl die statistische Modellierung als auch die Visualisierung betreffen. Eine dialektometrischer Funktion zur Bestimmung der relativen Ähnlichkeit wurde bislang noch nicht entwickelt; sie wäre vor allem für die Verbreitung von Basistypen über die Grenzen der  Sprachfamilien hinaus sehr aufschlussreich. Elementare Bezugseinheit der Georeferenzierung ist für VerbaAlpina die politische Gemeinde. Eine flächige Visualisierung auf dieser Basis von 6990 Einheiten ist jedoch nicht in jeder Hinsicht ideal, denn die Unterschiede hinsichtlich ihrer Fläche wie ihrer Bevölkerung können zu manchen Verzerrungen führen (vgl. diese Bemerkungen). Darüberhinaus kann es gelegentlich, z.B. bei der Berücksichtigung von Toponymen, wichtig werden, präziser zu georeferenzieren oder aber die Gemeinden zu größeren Einheiten zu clustern; dazu bieten sich die von der Europäischen Gemeinschaft konzipierten NUTS-3-Regionen oder gar die alpinen Sprachgebiete als ganze an; illustrativ ist die Darstellung der lateinischen Inschriften im Bezug auf NUTS-3 einerseits und die Sprachgebiete andererseits.

Von autonomen Gattungen zu verschränkten Funktionen

Ein großer Vorteil virtueller Dokumentation besteht in der Überwindung der traditionellen Gattungen, die sich im Universum der gedruckten Veröffentlichungen etabliert haben. Sprachwissenschaftlich relevante, publikationstechnisch oft eigenständige Gattungen sind zum Beispiel die Abhandlung, das Textkorpus oder die bereits genannten Sprachatlanten und Wörterbücher. Jede Gattung erfüllt einen bestimmten Zweck, der auf keinen Fall aufgegeben werden sollte. Jedoch werden diese Zwecke aus ihrer Isolierung befreit und in untereinander verknüpfte Funktionen verwandelt, so dass es möglich ist ohne weiteres zwischen ihnen hin und her zu wechseln.

Einen unmittelbaren Zugang zum dokumentierten Materials bietet der Reiter ‚Interaktive Karte‘ auf der Homeseite. Er führt zu einer kartographischen Präsentation, die über mehrere Filter gesteuert wird. Der Filter KONZEPTE erschließt sämtliche Sachen und Vorgänge, deren Bezeichnungen erfasst sind (vgl. die Hinweise zur Notation), so zum Beispiel BUTTER. Die hier zahlreich belegten Bezeichnungstypen können ebenfalls als einzelne herausgefiltert werden; falls ein Typ noch andere Konzepte bezeichnet, tauchen diese ebenfalls auf der Karte auf, wenn sie zu den relevanten Konzepten von VA gehören.  So wird die BUTTER mit Ausdrücken bezeichnet, die auf lateinisch flōrem (Akk. zu flōs), eigentlich 'Blume', zurückgehen und dem fra. fleur bzw. dem ita. fiore entsprechen. Diese Typ bezeichnet aber außer BUTTER noch RAHM und anderes mehr (vgl. diese Karte).

Weiterhin ist es möglich von der  Karte aus direkt zu den eventuell zugehörigen lexikologischen Kommentar zu gelangen; die Verfügbarkeit wird in der Legende durch einen Button mit dem Buchstaben 'i' angezeigt. Ein solcher Button findet sich in diesem Fall u.a. in der ersten Zeile der Legende hinter  'Konzept BUTTER'; er gibt enzyklopädische Informationen zur Geschichte des Produkts.  In der entgegengesetzten Verweisrichtung ist es möglich den Reiter 'Lexicon Alpinum' zu konsultieren; dort findet sich derselbe Kommentar zum Konzept Butter, der  über die Funktion 'Auf Karte visualisieren' zur genannten Karte leitet  – 'Atlas' und 'Wörterbuch' haben sich also in  systematisch verschränkte Funktionen ein und derselben Forschungsumgebung verwandelt.

Von der Philologie zu den Humanities

Zur historischen Profilierung von Sprachräumen ist es sinnvoll die Verbreitungsareale dialektaler Formen mit anderen  georeferenzierbaren Informationen zu kombinieren. Im Hinblick auf die Romanisierung des Alpenraums im Gefolge der römischen Eroberung sind vor allem antike Quellen von Bedeutung.; aus diesem Grund wurden auch die gesicherten Inschriften und römerzeitlichen Ortsnamen aufgenommen (vgl. die Karte CIL und Tabula Peutingeriana sowie die Hinweise zu den historischen Daten); vor diesem Hintergrund ist es interessant zu sehen, dass sich oft alte Bedeutungen aus der Antike bis heute gerade da erhalten haben, wo auch bereits römische Inschriften und antike Ortsnamen bezeugt sind. Ein sehr schönes Beispiel liefert der auf den ersten Blick ganz unauffällige Worttyp Keller < lat. cellarium . Er bezeichnet im Gegensatz zum Hochdeutschen im deutschsprachigen Alpenraum in der Regel keineswegs einen RAUM UNTER DEM ERDGESCHOSS, sondern – wie das Grundwort lat. cella – den VORRATS- bzw. LAGERRAUM. Hier liegt es im Hinblick auf die römerzeitlichen Zeugnisse im dialektalen Verbreitungsgebiet  an Konservation der lateinischen Bedeutung zu denken und nicht an sekundäre Rückentwicklung zur alten Bedeutung; besonders prägnant sind die drei steirischen Belege von Keller in der Bedeutung 'Almhütte'.

3.3. Funktionsbereich Kooperation

Im Sinn der digital humanities hat VerbaAlpina ein dichtes Netz von  Partnern geknüpft. Darunter sind manche – und an allererster Stelle sind ALD-I und ALD-II zu nennen -, die bereits eindeutig strukturiertes Material zur Verfügung stellen, das von VA über eine Datenschnittstelle integriert werden kann; bisweilen, wie im Fall des WBOE liegen auch rudimentäre und inkonsistente Strukturen vor, die nur mit großem Aufwand konvertiert werden können. Jedenfalls lassen sich die Partnerdaten in Verbindung mit den durch Retrodigitialisierung gewonnenen Daten zu einem umfassenden und mehrsprachigen Dialektmosaik des ganzen Alpenbogens zusammengefügen, wie die maximalistische Übersicht der prinzipiell verfügbaren VA-Informanten zeigt. Man beachte, dass die Berücksichtigung des WBOE mindestens theoretisch eine umfangreich Atlaslücke in den österreichischen Ostalpen schliesst (vgl. VA-Informanten ohne Berücksichtigung des WBOE.

Wirklich unvereinbar mit dem erstrebenswerten kollaborativen Aufbau umfassender und gut nachnutzbarer Datenbestände ist die Verwendung kommerzieller und privatwirtschaftlicher Dienste, auch , oder besser: gerade dann, wenn sie  das Etikett open access sozusagen im Stil einer feindlichen Übernahme für sich reklamieren , wie es die zunehmend monopolistisch auftretenden Verlage praktizieren (vgl. dieses Beispiel).

3.4. Funktionsbereich Datenerhebung

Crowdsourcing als Technik der Datenerhebung ist eine Option, die sich webbasierter Forschung  grundsätzlich bietet; selbstverständlich taugt das Verfahren nicht für Daten, die Expertenwissen erfordern; so kann ein Sprecher zwar Ausdrücke und Konstruktionen in geschriebener und mündlicher Realisierung liefern, jedoch keine Transkription, die den Ansprüchen der Phonetik genügt. Sehr wohl ist ein Sprecher jedoch im Stande, markante lautliche Besonderheiten (z.B. Diphthongierungen, Palatalisierungen) zu unterscheiden. Im Rahmen von VerbaAlpina wurde ein Crowdsourcing-Tool designed, mit dem interessierte Nutzer für alle politischen Gemeinden des Alpenraums (im Sinn der Alpenkonvention) Bezeichnungen der von uns vorgegebenen Konzepte schriftlich eingeben oder darüber hinaus auch neue Konzepte hinzufügen. Bislang sind seit dem 10.2.2017 immerhin 9874 (Stand vom 9. Mai 2018) Belege erhoben worden. Es wird erwogen, unter Umständen auch mit der Erhebung gesprochener Audiodaten zu beginnen; die technischen Probleme sind grundsätzlich gelöst.

Das grundlegende Problem beim Einsatz von Crowdsourcing liegt jedoch darin, dass es sich um eine mediales Verfahren handelt, das auf eine hinreichende Sichtbarkeit und Bereitwilligkeit der Mediennutzer angewiesen ist. Es muss – mit anderen Worten – für hinreichende Publizität gesorgt werden. In aller Regel sind Projekte aus den humanities keine Selbstläufer und können daher Unterstützung durch Öffentlichkeitsarbeit einschließlich nicht digitaler Medien gebrauchen. Pressemitteilungen bilden sich im positiven Fall direkt in der Nutzeraktivität ab, wie drei punktuelle Einblicke in die Statistik des VerbaAlpina-Crowdsourcings zeigen:

Öffentlichkeitsarbeit und Echo im Crowdsourcing: A – kein eindeutiges Echo: Vortrag vor Almbauern  |  B – schwaches Echo: Bericht in einer Schweizer Lokalzeitung | C – starkes Echo: Homepage des Bayerischen Rundfunks (BR 2)

Aber es scheint sehr problematisch, wenn nicht unmöglich Nutzerinteresse zu prognostizieren. Sehr schwer einzuschätzen ist insbesondere die Gewichtung des individuellen Sachinteresses auf Seiten des Nutzers und sowie der Attraktivität des Web-Auftritts. Womöglich besteht auch ein Zusammenhang beider Parameter, insofern fehlendes Sachinteresse eventuell durch eine unterhaltsame, z.B. als Spiel gestaltete Oberfläche (‚gamification‘) kompensiert werden kann. 10 Es kann jedoch auch nicht übersehen werden, dass es durchaus sehr erfolgreiche CS-Kampagnen gibt, in denen der zweite Parameter keine und der erste bestenfalls eine unklare Rolle spielt (vgl. die Übersicht der Zooniverse-Projekte).

3.5. Funktionsbereich Forschungslabor

Forschungsumgebungen im Rahmen der Digital Humanities sind in der Lage eine Option anzubieten, für die es in der Welt, die ausschließlich auf den Druck ‘fertiger’ Ergebnisse zielt, keine Entsprechung geben kann. Gemeint ist die Einrichtung eines mehr oder weniger offenen digitalen ‘Raums’, in dem registrierte Partner, Nutzer und/oder Interessenten überhaupt die Möglichkeit haben, sich mit den Inhalten und dem Quellcode des Projekts zu befassen. Diese Auseinandersetzung kann analytisch erfolgen, aber auch in Vorschlägen, das Vorhandene um Inhalt und/oder Code zu erweitern. Dazu müssen Upload-, Download- und Kommentar- bzw. Chatfunktionen eingerichtet werden. Dieser Funktionsbereich, für den sich die Bezeichnung ‘Labor’ anbietet, wurde in VerbaAlpina bislang noch nicht ausgebaut; immerhin haben registrierte Nutzer auf der ‘Interaktiven Karte’ schon die Möglichkeit, beliebige Daten, die über die Filter angezeigt werden können, gemeinsam aufzurufen und in Gestalt sogenannter  ‘Synoptischer Karten’ zu fixieren und zu kommentieren. Das jeweils Erzeugte kann über einen Share-Button weitergeleitet werden, so dass Interessentengruppen gebildet werden können.

3.6. Funktionsbereich Publikation

Eine probate Strategie zur Durchsetzung kollaborativer Forschungsumgebungen ist der parallele Aufbau von Publikationsplattformen, die denselben Anforderungen  entsprechen, an denen auch gedruckte Veröffentlichungen gemessen werden: dauerhafte Zitierfähigkeit und Recherchierbarkeit. Verlässlich zitierfähig in lwissenschaftlichem Kontex sind nur stabile Text. Für VerbaAlpina wurde eine technische  Versionierung entwickelt, die in ähnlicher Weise auch in anderen Münchner Plattformen verwandt wird. Sie beruht im Wesentlichen darauf, dass die jeweilige Version in der URL des Textes spezifiziert wird. Jede Änderung des Textes setzt die Erzeugung einer neuen Version voraus, die jedoch die vorhergehende nicht ersetzt, sondern ergänzt. Die älteren Versionen bleiben erhalten, so dass ihre eventuellen Zitate durch neuere Versionen nicht gefährdet werden. Für den oben erwähnten Kommentar zum Konzept BUTTER wird die folgende Zitierweise empfohlen, in der die Version 17/2 in der URL in Gestalt der Ziffer 172 repräsentiert wird:

  • Krefeld, T.: s.v. “BUTTER”, in: VA-de 17/2, Lexicon alpinum, https://www.verba-alpina.gwi.uni-muenchen.de/?page_id=2374&db=172#C156

Diese Zitierbarkeit wurde in den Portalen KiT und DH–Lehre entwickelt. Um in längeren versionierten Texten gezielt auf einen bestimmten Abschnitt referenzieren zu können, wurde die Textformatierung so eingestellt, dass alle Absatzes fortlaufend nummeriert werden und die jeweilige Nummer durch Klicken der URL hinzugefuegt wird. Die folgende URL:

verweist also auf den 8. Absatz eines Beitrags von Hans Goebl in der ersten Version des Sammelbandes Berichte aus der digitalen Geolinguistik : Thomas Krefeld | Stephan Lücke (2018): Berichte aus der digitalen Geolinguistik. Korpus im Text. Version 1 (12.05.2018, 10:20). url: http://www.kit.gwi.uni-muenchen.de/?p=4498&v=1]].

Die Recherchierbarkeit des Projekts VerbaAlpina als ganzem ist nicht nur in den Suchmaschinen, sondern auch im Verbundkatalog der öffentlichen bayerischen Bibliotheken (OPAC) gewährleistet; es wurde durch die UB der LMU mit einem Digital Object Identifier (doi:10.5282/verba-alpina) versehen, über das es auch jenseits der Kataloge und herkömmlichen Suchmaschinen auffindbar ist (vgl. DOI). Darüber hinaus wurde auf dem Server der Deutschen Nationalbibliothek ein sogenannter Uniform Resource Name (URN) hinterlegt, der Ähnliches wie die DOI leistet (vgl. Lücke 2017.


  1. Für die Einladung danke ich Elisabeth Burr von der Universität Leipzig. 

  2. Vgl. zur Bezeichnung die Bemerkungen  in Krefeld 2017c

  3. Vgl. die Darstellung des Unternehmens in Krefeld 2017g

  4. Dieser Ausdruck ist insofern gerechtfertigt, als ein sehr großer Teil der im Atlas veröffentlichten Formen typisiert wird, allerdings ohne diesen Typen ein konkretes Etymon zuzuweisen. Diese Verknüpfung interaktiv zu realisieren wäre eine sehr schöne Unternehmung der Digital Romance Humanities

  5. Das Gebiet wird aus rein pragmatischen Gründen über die Zugehörigkeit der politischen Gemeinden zur Interessenvereinigung der Alpenkonvention abgegrenzt. 

  6. Vgl. zu diesem Konzept aus romanistischer Sicht

  7. Aus kommunikationsräumlicher Perspektive fallen jedem Romanisten sofort zahlreiche andere faszinierende Konstellationen eine: die Romania Thyrrenica (Korsica, Elba, Sardinien, die Balearen mit den jeweils nächstgelegenenen kontinentalen Küstenstreifen), die Sprachgebiete beiderseits der Adria, das Verbreitungsgebiet der Aromunen, Meglenorumänen und Rumänen; die Gegenden Afrikas, wo auch romanische Sprachen gesprochen; der Indische Ozean, Amerika usw.). Unser aller indivuiduelle Interessenthorizonte stoßen ja ständig an die Grenzen unserer individuellen Sprachkompetenzen, so dass nur aus der Kollaboration sinnvolle und notwendige Großprojekte entstehen können. 

  8. Darüber hinaus müsste auch das Alter in die Chronoreferenzierung eingehen; im VerbaAlpina-Gebiet lagen im Fall des AIS mehr als 60 Jahre Altersunterschied zwischen den Informanten; die Sprecherin aus Lanzada (AIS 216)  war bei der Erhebung, 1921, erst 22 Jahre alt, der Sprecher aus Surrhein (AIS 11) dagegen im Jahre 1920 bereits 84; vgl. Jaberg/Jud 1928, 40, 63. 

  9. Vgl. zur Informantenmobilität Krefeld 2002 und zum Problem der nicht alphabetisierten Informanten Krefeld 2007b und Krefeld 2007c

  10. Diese Komponente tritt im Projekt VerbaAlpina fast vollkommen zurück; allenfalls ist die Nennung der aktivsten (registrierten) User, Gemeinden und der beliebtesten Begriffe in der Crowdsourcing-Funktion gefunden hat. 


Bibliographie

  • ALD-I = Goebl, Hans (1998): Atlant linguistich dl ladin dolomitich y di dialec vejins I, vol. 1-7 (sprechend: http://ald.sbg.ac.at/ald/ald-i/index.php), Wiesbaden, vol. 1-7, Reichert. Link
  • ALD-II = Goebl, Hans (2012): Atlant linguistich dl ladin dolomitich y di dialec vejins, 2a pert, vol. 1-5, Editions de Linguistique et de Philologie. Link
  • DRG = De Planta, Robert/ Melcher, Florian/ Pult, Chasper/ Giger, Felix (1938ff.): Dicziunari Rumantsch grischun, Chur, Inst. dal Dicziunari Rumantsch Grischun. Link
  • GPSR = Gauchat, Louis (Hrsg.) (1924ff.): Glossaire des patois de la Suisse romande, Genève [u.a.], Droz [u.a.]
  • Goebl 2018 = Goebl, Hans (2018): Vorstellung der beiden Teile des ALD (ALD-I und ALD-II), in: Krefeld, Thomas; Lücke, Stephan (Hrsgg): Berichte aus der digitalen Geolinguistik. Korpus im Text., vol. 6. Link
  • Hubschmid 1950 = Hubschmid, Johannes (1950): Vorindogermanische und jüngere Wort­schichten in den romanischen Mundarten der Ostalpen, Tübingen, in: Zeitschrift für romanische Philologie, vol. 66, Niemeyer, 1-94. Link
  • Hubschmid 1951 = Hubschmid, Johannes (1951): Alpenwörter romanischen und vorromanischen Ursprungs, Bern, Francke
  • Idiotikon = (1881 ff.): Schweizerisches Idiotikon. Schweizerdeutsches Wörterbuch, Basel. Link
  • Jaberg/Jud 1928 = Jaberg, Karl; Jud, Jakob (1928): Der Sprach- und Sachatlas als Forschungsinstrument. Kritische Grundlegung und Einführung in den Sprach- und Sachatlas Italiens und der Südschweiz, Halle (Saale), Niemeyer
  • Jaberg/Jud 1960 = Jaberg, Karl; Jud, Jakob (1960): Index zum Sprach- und Sachatlas Italiens und der Südschweiz. Ein propädeutisches etymologisches Wörterbuch der italienischen Mundarten, Bern
  • Jud 1911a = Jud, Jakob (1911): Dalla storia delle parole lombardo-ladine, Cöthen, Anhalt, in: Bulletin de dialectologie romane (BDR) 3, 1-18, Schulze, 63-86
  • Jud 1911b = Jud, Jakob (1911): Parole oscure del territorio alpino
  • Jud 1924 = Jud, Jakob (1924): Zu einigen vorromanischen Ausdrücken der Sennesprache, Berlin, in: Zeitschrift für Deutsche Mundarten, vol. 19, Allgem. Dt. Sprachverein, 199-209. Link
  • Krefeld 2002 = Krefeld, Thomas (2002): Migration, Sprachbewusstsein und Wissenschaftsideologie - über dynamische Räume und ihre statische Beschreibung, Tübingen, in: Ehlich, Konrad (Hrsg.), Sprachen und Sprachpolitik in Europa, Stauffenburg, 145-170. Link
  • Krefeld 2007 = Krefeld, Thomas (2007): La continuità della Romània - e la storiografia delle lingue nazionali, Tübingen, in: Hafner, Jochen/ Oesterreicher, Wulf (Hrsg.): Mit Clio im Gespräch. Romanische Sprachgeschichten und Sprachgeschichtsschreibung, Narr, 63-75. Link
  • Krefeld 2007b = Krefeld, Thomas (2007): L'informante analfabeta (e la coscienza della variazione), Palermo, in: Castiglione, Marina / Rizzo, Giuliano (Hrsg.), Parole da gustare. Consuetudini alimentari e saperi linguistici (= Atlante Linguistico della Sicilia - Materiali e Ricerche 19), CSFLS. Link
  • Krefeld 2007c = Krefeld, Thomas (2007): Sprachwissenschaftler, Sprecher und die schwere Entbindung der Sprache von der Situation, Tübingen, in: Redder, Angelika (Hrsg.), Diskurs und Texte. Festschrift für Konrad Ehlich zum 65. Geburtstag, Stauffenburg, 81-86. Link
  • Krefeld 2017c = Krefeld, Thomas (2017): Geolinguistik in der Perspektive der ‚digital humanities‘ (am Beispiel von Verba Alpina). Vorlesung , München, LMU. Link
  • Krefeld 2017g = (2017): Geolinguistik in der Perspektive der ‚digital humanities‘ (am Beispiel von Verba Alpina). Vorlesung dh-lehre. Version 2 (20.10.2017, 08:18)., München. Link
  • Krefeld 2018 = Krefeld, Thomas (2018): Sprache und Raum – Italien und das Italienische, München, in: Vorlesung dh-lehre, LMU. Link
  • Stampa 1937 = Stampa, Renato Agostino (1937): Contributo al lessico preromanzo dei dialetri lombardo-alpini e romanci, Zürich; Leipzig, Niehans
  • VSI = Sganzini, Silvio (1952ff): Vocabolario dei dialetti della Svizzera italiana, Lugano, Tipografia la Commerciale
  • WBOE = Bauer, Werner/ Kranzmayer, Eberhard. Institut für österreichische Dialekt- und Namenlexika (Hrsg.) (1970–): Wörterbuch der bairischen Mundarten in Österreich, Wien, Verl. der Österr. Akad. der Wiss.

VA-Projektbeschreibung für die Teilnehmer des statistischen Praktikums des Statistischen Beratungslabors des Instituts für Statistik der LMU




(898 Wörter)

Abstract

Im Alpenraum gibt es für die Bezeichnung einer Sache (= Konzept) normalerweise, verteilt auf eine große Anzahl von Sprachen und Dialekten, eine Vielzahl von verschiedenen Wörtern. Umgekehrt kann ein Wort unter Umständen mehrere unterschiedliche Konzepte bezeichnen. Dieser wechselseitige Zusammenhang variiert regional (Georeferenzierung) und über die Zeit (Chronoreferenzierung). Als weitere Variable kommen das Genus und die Herkunft eines Wortes ins Spiel. Außerdem können die Sachen zu Domänen zusammengefasst werden (z.B. Gebäude, Produkte, Werkzeuge -> vgl. oben INTERAKTIVE KARTE > KONZEPTE). Die skizzierten Zusammenhänge können statistischen Analysen unterzogen werden. Beispiel:  Welcher Zusammenhang besteht zwischen der Anzahl von Bezeichnungen für ein bestimmtes Konzept? Ist z.B. die Anzahl von Bezeichnungen pro Konzept in der Domäne "Produkte" durchschnittlich größer als in der Domäne "Gebäude"?

Im Detail

VerbaAlpina (= VA; https://www.verba-alpina.gwi.uni-muenchen.de/) ist ein seit 2014 von der DFG gefördertes Langzeitprojekt. Ziel des Projekts ist die systematische Sprach- und politische Grenzen überschreitende Sammlung von Bezeichnungen, die im Alpenraum für ausgewählte Konzepte gebräuchlich sind oder waren.

VerbaAlpina unterscheidet zwischen Bezeichnung und Konzept. Mit Konzept ist eine außersprachliche Kategorie gemeint, die auch als Begriff oder "platonische" Idee bezeichnet werden kann; zwischen Konzepten und Bezeichnungen besteht keine 1:1-Relation: für manche Konzepte gibt es in manchen Sprachen keine Bezeichnung; für andere Konzepte kann es dagegen in manchen Sprachen sehr viele, synonyme Bezeichnungen geben. Zur klaren Unterscheidung zwischen "Bezeichnung" und Konzept verwendet VerbaAlpina folgende Konvention: Ist ein Konzept gemeint, wird es in Versalien geschrieben, meint man eine Bezeichnung, wird das Wort kursiv gesetzt. Ein Beispiel: KÄSE meint das Konzept, also eine FESTE MASSE, DIE AUS MILCH DURCH DEN ZUSATZ EINES GERINNUNGSMITTELS ERZEUGT WIRD. Demgegenüber ist mit Käse das Wort gemeint, mit dem das Konzept KÄSE bezeichnet wird. Andere Bezeichnungen für KÄSE wären z.B. das italienische formaggio oder das französische fromage. VA ist jedoch weniger an den hochsprachlichen Bezeichnungen interessiert. Vielmehr geht es um die teils zahlreichen dialektalen Bezeichnungen für die von VA ausgewählten Konzepte. Für KÄSE wären dies z.B. die Bezeichnung caciolo, ciucc oder fontina, wobei es im Einzelfall immer sein kann, dass diese Bezeichnungen einen ganz bestimmten Typ von KÄSE bezeichnen.

VA ist lexikalisch ausgerichtet, d.h. phonetische Variationen ein und desselben Wortes werden jeweils zu einem sog. morpholexikalischen Typ zusammengefasst (z.B. Kaas, Chaas -> Käse). Im Rahmen der Typisierung werden den morpholexikalischen Typen nach Möglichkeit auch sog. Basistypen zugewiesen. Das sind, vereinfacht gesprochen, Vorstufen eines morpholexikalischen Typs, die häufig in älteren im Alpenraum gesprochenen Sprachen wie etwa dem Lateinischen zu suchen sind. So gehen beispielsweise die beiden morpholexikalischen Typen Formaggella und Formaggiera auf den gemeinsamen Basistyp formaticu(m) zurück. Hinsichtlich der morpholexikalischen Typen wird von VA außerdem zwischen der Sprachfamilie (romanisch, germanisch, slavisch), dem Genus (m., f., n.) und der sog. Affigierung unterschieden. Letztere meint Wortelemente wie z.B. Diminutiv-Suffixe wie im Deutschen "-chen".

Gesammelt werden ausschließlich georeferenzierte Sprachdaten. Das von VA gesammelte Material stammt bislang überwiegend aus sog. Sprachatlanten. Das sind Kartenwerke, auf denen die geographische Verbreitung von Bezeichnungen für bestimmte Konzepte markiert ist. Die Daten aus den Atlanten wurden von VA überwiegend manuell transkribiert und zusammen mit der Georeferenzierung in strukturierter Form in einer MySQL-Datenbank (VA_DB) abgelegt. Das Gesamtmaterial ist über definierte Schnittstellen abrufbar (VAP). Die Datenbank fungiert auch als Backbone der o.a. multifunktionalen Webschnittstelle (VA_WEB). Neben online-Kartographie und Dokumentation besteht dort auch ein Bereich für Projektveröffentlichungen, in dem auch die im Rahmen des statistischen Praktikums erarbeitete Studie publiziert werden soll.

Das Material aus den Sprachatlanten wird mehr oder weniger systematisch um weitere Daten ergänzt. Dazu gehören u.a. ergänzende Daten zu außersprachlichen Gegebenheiten, wie etwa die Fundorte lateinischer Inschriften im Alpenraum. Von Interesse wären auch demographische Daten, die derzeit aber noch nicht flächendeckend vorliegen. Ganz wesentlich ist der Ausgleich von Inkonsistenzen im Atlasmaterial, die sich vor allem aus Unterschieden bezüglich der von den einzelnen Atlanten abgefragten Konzepte ergibt. Zu diesem Zweck betreibt VA ein Online-Portal zum sog. Crowdsourcing: Informanten im Internet sollen dialektale Bezeichnungen der für VA relevanten Konzepte beisteuern. Nicht zuletzt auf diese Weise erhält der VA-Datenbestand eine diachrone Dimension (die jedoch in eingeschränktem Maß auch schon durch die unterschiedliche Entstehungszeit der Sprachatlanten gegeben war).

Die Daten für das statistische Praktikum können über eine MySQL-Schnittstelle zur Verfügung gestellt werden (relationales Datenformat). Aus Sicht von VA können die statistischen Analysen über folgende Variablen erfolgen:

  • Georeferenzierung (lat/lng)
  • Konzept
  • Bezeichnung
  • Basistyp
  • Sprachfamilie
  • Genus
  • Chronoreferenzierung (einfache Unterscheidung zwischen Atlasmaterial und Crowd)

Aus Sicht von VA könnte man aus statistischer Sicht vielleicht folgende Fragen stellen:

  • Verteilung von Basistypen auf Sprachgebiete, bezogen auf Konzepte
  • Verteilung von Morphtypen bezogen auf regionale Verteilung bezogen auf Konzepte
  • Variabilität von Bezeichnungen in Bezug auf Konzepte (Anzahl verschiedener Bezeichnungen pro Konzept bezogen auf Konzeptdomäne -> charkteristische Zusammenhänge, z.B. höherer Wert bei Produkten als bei Geräten oder Gebäuden)
  • Verteilung von Basistypen in Bezug auf Konzepte (breite, gleichmäßige Streuung über verschiedene Konzeptdomänen oder gebunden an spezifische?)
  • Häufung romanischer Basistypen in der Nähe von Zentren lateinischer Inschriftenfunde?
  • Häufung lateinischer Inschriften in der Umgebung von Ortschaften, die auf der Tabula Peutingeriana erscheinen

CSV-Daten (31.10.2019)

Kontakt

Thomas Krefeld (thomas.krefeld@lmu.de)

Stephan Lücke (luecke@lmu.de)

VA: Die Integration außersprachlicher Daten




(399 Wörter)

Die neuzeitliche Verteilung der Sprachfamilien im Untersuchungsgebiet lässt die Alpen als eine Barriere, gewissermaßen als gewaltigen Sperrriegel erscheinen, insofern sie grosso modo den deutschsprachigen Raum (nördlich) vom romanisch- und slawischsprachigen Raum (südlich) trennt (Link). Das über den Alpenhauptkamm hinweg deutlich nach Süden ausgreifende,  bairischsprachige Südtirol wirkt beinahe als Sonderfall.

Diese 'Ansicht' ist in historischer Perspektive irreführend. Schon die ältesten sprachlichen Zeugnisse, Inschriften aus vorrömischer Zeit, sind in einem weitestgehend identischen Alphabet verfasst:

'rätische' Schrift (https://de.wikipedia.org/wiki/R%C3%A4ter#/media/File:Venetic_and_Raetic_alphabets.png)

Ihre Verbreitung lässt sich nur vor dem Hintergrund eines die Alpen überschreitenden kulturellen Zusammenhangs verstehen. Diese meist als 'rätisch' bezeichneten, nicht entzifferten Texte reicht von den Nordalpen (Steinberg am Rofan, in der Nähe des Achensees) bis nach Padua:

rätische_inschrftn

In diesem Alphabet wurden, grosso modo, auch die uns erhalten Dokumente des Etruskischen geschrieben; es geht offensichtlich auf eine antike westgriechische Schrift zurück.

Die Römer haben dann den zentralen Alpenraum zwischen 25 und 15 v.Chr. erobert; das Tropaeum Alpium in La Turbie, oberhalb von Monaco, berichtet von 46 eroberten Stämmen, deren Namen sich teils bis heute erhalten haben:

####
CIL 05, 07817 (p 1092) = CAG-06, p 663 = ILAM 00358 = AE 1973, 00323 = AE 2002, +00899 = AE 2004, +00570 = AE 2005, 00958 (EDCS_ID: EDCS-05401067)
Imperatori Caesari divi filio Augusto / pont(ifici) max(imo) imp(eratori) XIIII trib(unicia) pot(estate) XVII / senatus populusque Romanus / quod eius ductu auspiciisque gentes Alpinae omnes quae a mari supero ad inferum pertinebant sub imperium p(opuli) R(omani) sunt redactae / gentes Alpinae devictae Trumpilini Camunni Vennonetes Vennostes Isarci Breuni Genaunes Focunates / Vindelicorum gentes quattuor Cosuanetes Rucinates Licates Catenates Ambisontes Rugusci Suanetes Calucones / Brixentes Leponti Viberi Nantuates Seduni Veragri Salassi Acitavones Medulli Ucenni Caturiges Brigiani / Sogiontii Brodionti Nemaloni Edenates (V)esubiani Veamini Gallitae Triullatti Ectini / Vergunni Egui Turi Nemeturi Oratelli Nerusi Velauni Suetri (Datenquelle: Epigraphik-Datenbank Clauss / Slaby (http://db.edcs.eu/epigr/epi_de.php))

Im Gefolge der Erorberung richten die Römer am Anschluss an die Gallia Cisalpina Provinzen ein, die entweder in den Alpen selbst angesiedelt sind (Alpes Maritimae, Alpes Cottidae, Alpes Poeniae) oder aber die Alpen nach Norden überschreiten (Raetia, Noricum):

Alpes_romanae

Alpen in der römischen Verwaltung (https://upload.wikimedia.org/wikipedia/commons/6/66/Roemischeprovinzentrajan.png)

richtend

https://de.wikipedia.org/wiki/Tropaeum_Alpium

wurd offensicht iIhre Verbreitung diesesr meist als dieser meist als 'räthttp://adolfozavaroni.tripod.com/retiche.htmtisch' bezeichneten Texte reicht von den Nordalpen (Steinberg am Rofan, in der Nähe des Achensees) bis nach Padua:

 

Rätische Inschriften

 

VerbaAlpina – eine virtuelle Forschungsumgebung


Schlagwörter: Alpendialekte , Digitale Geisteswissenschaften , DH , Digital Humanities

(1973 Wörter)

Orientierungsmodul, 15.1.2019


Vorab: Heute ist – wie sich zeigen wird – ein glücklicher Termin für das Thema dieses Vortrags, denn wir schreiben den 18. Geburtstag von Wikipedia. Dieses Ereignis markiert im Rückblick den Beginn einer neuen Epoche auf dem Weg in die Wissensgesellschaft.

(1) Der Untersuchungsraum

Gegenstand dieses Vortrags ist das Projekt VerbaAlpina, das ich gemeinsam mit Stephan Lücke von der ITG leite. Es wird seit 2014 von der Deutschen Forschungsgemeinschaft (DFG) gefördert. Gegenstand ist die Mehrsprachigkeit des Alpenraums, in dem sich die drei großen europäischen Sprachfamilien, Germanisch, Romanisch und Slawisch getroffen haben und seit ca. 1500 Jahren neben- und miteinander existieren (vgl. Karte).

Die Sprachverhältnisse sind jedoch erheblich komplizierter als die Rede von den drei 'Familien' sowie deren kartographische Darstellung andeutet, denn dazu gehören im Romanischen eine ganze Reihe von Sprachen mit jeweils sehr verschiedenen Dialekten; im Germanischen und Slawischen gibt zwar jeweils nur eine Sprache (Deutsch und Slowenisch), die jedoch ebenfalls durch ganz unterschiedliche, lokale Dialekte vertreten sind.

Dialekt (unvollständig) Dialektgruppe Sprache Sprachfamilie
Valdostano / Valdôtain  Valdostano / Valdôtain  rom
Occitan  Okzitanisch
Francoprovençal  Frankoprovenzalisch
Piemontese Italienisch
Lombardo
Bregagliotto
 Veneto
Puter Bündnerromanisch
Surmiran
Sursilvan
Sutsilvan
Vallader
Jauer
Badiot Dolomitenladinisch
Maréo
Gherdëina
Fascian
Anpezan
Fodom
Furlan  Friaulisch
Alemannisch Alemannisch Deutsch ger
Walserisch
Vorarlbergerisch
Schwäbisch
Bairisch Bairisch
Allgäuerisch
Zimbrisch
Tirolerisch
Steirisch
Kärntnerisch
Salzburgisch
Oberösterreichisch
Dolenjsko Slowenisch sla
Koroško
Štajersko
Gorenjsko
Rovtarsko
Slovenščina
Rezijansko

Im Wesentlichen haben sich in der sprachwissenschaftlichen Forschung zwei Gattungen herausgebildet, um Dialekte zu dokumentieren

  • Sprachatlanten;
  • Wörterbücher.

Beide Gattungen sind im Untersuchungsgebiet gut vertreten. Den Prototyp eines Sprachatlas verkörpert z.B. der Sprach- und Sachatlas Italiens und der Südschweiz (AIS), den man als NavigAIS im Internet konsultieren kann. Nun gibt es aber nicht nur diesen, sondern eine ganze Reihe von Sprachtlanten im Alpenraum. Analog, ja noch komplexer ist die Erschließung durch Wörterbücher. Es ist dementsprechend schwer, einen detaillierten Überblick zu gewinnen; selbst in einer der wenigen Bibliotheken, wo alle vorhanden einschlägigen Quellen vorhanden sind, ist die Recherche extrem aufwändig.

Gerade ein solcher Überblick vermittelt jedoch wichtige historische Einsichten, denn er führt uns die bemerkenswerte Situation vor Augen, dass etliche spezifisch alpine Wörter nicht auf eine der drei Sprachfamilien beschränkt sind, sondern über die Grenzen dieser Sprachfamilien hinaus Verbreitung gefunden haben. Gerade eine sprachgrenzüberschreitende Untersuchung ist  also erforderlich und als einzige dem Raum angemessen. Die folgende Graphik schematisiert die alpine Sprachgeschichte; konstitutiv sind die Romanisierung des gesamten Gebiets (seit 15 vor Chr.) und seine nachfolgende teilweise Germanisierung und Slawisierung. Damit ist zwar stets eine  Verdrängung der jeweils früheren Sprachen verbunden, insofern das Lateinisch-Romanische  die vorrömischen Sprachen verdrängt und  seinerseits in manchen Gebieten durch das Germanische und Slawische verdrängt wird. Aber der Verdrängung geht eine mehr oder weniger lang andauernde lokale Zweisprachigkeit voraus (in der Graphik durch Kugeln symbolisiert), die sich in Entlehnungen aus den verdrängten in die verdrängenden Sprachen niederschlägt, so dass sich die erwähnten sprachgrenzüberschreitenden Verbreitungsgebiete ergeben.


Es ist nun aber von vornherein klar, dass die Dokumentation eines so komplexen Sprachraum mit der skizzierten historischen Tiefe mit dem Medium des gedruckten Buchs kaum, wenn überhaupt, zu leisten ist. Dieser Vortrags situiert das Projekt in der aktuellen Forschung und skizziert seine Konzeption und Durchführung.

(2) Hintergrund: Die Sprachwissenschaft auf dem Weg in die digital humanities

Seit ca. 15 Jahren, d.h. seit der zügigen Durchsetzung interaktiver und kollaborativer Strukturen im Internet Web 2.0  durchlaufen zahlreiche wissenschaftliche Disziplinen einen Prozess tiefgreifenden Wandels, denn im Gefolge der medialen Revolution haben sich die Rahmenbedingungen der Wissenschaftskommunikation substantiell verändert (vgl. die oben auf dieser Seite angebrachte Einladung Schreibe eine Antwort). In den Disziplinen, die sich mit kulturellen Techniken und ihrer geschichtlichen Entwicklung befassen, kann dieser Wandel mit dem Schlagwort der digital humanities identifiziert werden. Es ist nicht überraschend, dass die Wissenschaftler unterschiedlich auf diese Situation reagieren, nämlich teils mit

  • offensiver Ablehnung (Motto: "Das bedeutet den Ausverkauf der akademischen Fächer"),
  • nonchalanter Indifferenz (Motto: "Der kindische Unfug lässt mich kalt"),
  • konstruktiver Akzeptanz (Motto: "Endlich wird möglich, was ich immer schon wollte").

Nicht im Sinn eines missionarischen Eifers, sondern aus rein forschungspraktischer Überzeugung kommt für datenorientierte Disziplinen wie die historische Sprachwissenschaft eigentlich nurmehr die dritte Haltung in Frage. Wenn man diese Herausforderung jedoch annimmt, ändert sich fast Alles, sogar die forschungsethischen Grundlagen, die seit wenigen Jahren mit den wichtigen FAIR-Prinzipien eine nützlich Programmatik erhalten haben; VerbaAlpina ist bemüht diese Prinzipien systematisch umzusetzen ( 🔗).

(3) Funktionsbereiche

Für die Einrichtung von Forschungsvorhaben (und womöglich angeschlossener universitärer Lehre) mit den Mitteln der Webtechnologie wurde eine neue, nützliche Bezeichnung geprägt; man spricht von einer virtuellen Lehr- und Forschungsumgebung.

Dieser Ausdruck wurde erforderlich, da Wissenschaftskommunikation unter den Bedingungen des Web 2.0, wie oben skizziert, nicht mehr den etablierten Gattungen der gedruckten Traditionen folgen kann, oder zumindestens nicht mehr unbedingt folgen muss. Sprachwssenschaftlich relevante Gattungen sind zum Beispiel die Abhandlung, das Textkorpus oder die bereits genannten Sprachatlanten und Wörterbücher. Jede Gattung erfüllt einen bestimmten Zweck, der auf keinen Fall aufgegeben werden sollte. Jedoch werden diese Zwecke aus ihrer Isolierung befreit und in untereinander verknüpfte Funktionen verwandelt, so dass es möglich ist ohne weiteres zwischen ihnen hin und her zu wechseln.

VerbaAlpina unterscheidet fünf Funktionsbereiche und mehrere Zugangsmöglichkeiten:

    • Dokumentation,
    • Kooperation,
    • Publikation,
    • Datenerhebung durch Crowdsourcing,
    • Forschungslaboratorium.

Diese Optionen sollen – von der letzten abgesehen – nun ausgehend von einem konkreten Beispiel vorgeführt werden. Einen unmittelbaren Zugang bieten die Reiter der Startseite. So eröffnet die ‚Interaktive Karte‘ eine kartographische Präsentation des dokumentierten Materials, die über mehrere Filter gesteuert wird. Der Filter KONZEPTE erschließt sämtliche Sachen und Vorgänge, deren Bezeichnungen erfasst sind (vgl. zur Notation), so zum Beispiel die BUTTER. Die belegten Bezeichnungstypen können ebenfalls herausgefiltert werden, so dass ihre jeweiligen Bedeutungen auf der Karte erscheinen.

Weiterhin ist es möglich von der  Karte aus den zugehörigen lexikologischen Kommentar abzurufen, so wie der lexikologische Kommentar in der entgegengesetzten Richtung zur kartographischen Päsentation führt – 'Atlas' und 'Wörterbuch' sind also systematisch verschränkt. Übrigens handelt es sich keineswegs um ein uninteressantes Allerweltsbeispiel, denn sowohl die Sache als auch ihre Bezeichnungen haben einen ausgeprägten Bezug zum Alpenraum. Die Nutzung des Milchfetts ist ja dort besonders nahe liegend, wo die wichtigste antike Quelle für Fett, der Olivenbaum, nicht gedeiht. Ab einer bestimmten Höhe konnten ausschließlich tierische Fette gewonnen werden, insbesondere SCHMALZ und BUTTER. Es ist daher nicht überraschend, sondern geradezu selbstverständlich, dass in einem Teil Graubündens, also in einer Gegend, wo BUTTER traditionell das Fett schlechthin darstellt, ihre Bezeichnung auf das lateinische pinguis 'fett' zurück geht. (; vgl. surs. pieun/engad. painch u.a. im Pledari grond).
Zwar war BUTTER grundsätzlich schon in der Antike bekannt, jedoch nicht als Nahrungsmittel, sondern als medizinische Salbe.

Auch die Herkunft anderer Formen ist bemerkenswert; rätoromanisch (surs.) pischada ist durch die Herstellung motiviert, denn dieser Typ geht wahrscheinlich auf das lateinische Verb *pisiare 'stampfen' zurück (vgl. s.v. pischada). BUTTER ist sehr leicht verderblich; durch Auslassen kann die Haltbarkeit ein wenig gesteigert werden. daher ist es gut verständlich, dass in manchen Gegenden die BUTTER als Schmalz bezeichnet wird (von schmelzen im Sinne von 'auslassen'; vgl. diese Karte). Dieser Bezeichnungstyp ist aus dem Germanischen auch ins Romanische übernommen worden und hat dort zu Bezeichnungen von verwandten Konzepten geführt (vgl. Basistyp butyrum sowie das folgende Entlehnungsschema:


Zur historischen Rahmung der dialektalen Verbreitungsgebiete ist es sinnvoll, sie mit anderen  georeferenzierbaren Informationen zu kombinieren. Im Hinblick auf die Romanisierung des Alpenraums im Gefolge der römischen Eroberung sind vor allem antike Quellen von Bedeutung.; aus diesem Grund wurden auch die gesicherten Inschriften und römerzeitlichen Ortsnamen aufgenommen (vgl. die Karte CIL und Tabula Peutingeriana sowie die Hinweise zu den historischen Daten); vor diesem Hintergrund ist es interessant zu sehen, dass sich oft alte Bedeutungen aus der Antike bis heute gerade da erhalten haben, wo auch bereits römische Inschriften und antike Ortsnamen bezeugt sind. So bezeichnet der Worttyp Keller < lat. cellarium im deutschsprachigen Alpenraum in der Regel keineswegs einen RAUM UNTER DEM ERDGESCHOSS, sondern – wie das Grundwort lat. cella – den VORRATS- bzw. LAGERRAUM.

Der Filter Kartographische Darstellung → Informanten zeigt, aus welchen zahlreichen sprachwissenschaftlichen Quellen sich die Dokumentation speist. Bei den meisten davon handelt es sich um gedruckte Quellen (Atlanten und Wörterbücher), die in aufwändiger Weise retrodigitalisiert wurden, so dass ihre Belege zu einem Dialektmosaik des ganzen Alpenbogens zusammengefügt werden konnten. Manche, bereits digital vorliegende Projekte haben uns auch umfangreiche Datenbestände zur Verfügung gestellt, so dass ihre daten – selbstverständlich mit Quellenangabe – auch in der verbaAlpine Kartographie erfasst werden können. Hier ist zum Beispiel ganz im Sinn breiter Kooperation der dolomitenladinische Sprachatlas (ALD) von Hans Goebl zu nennen (vgl. ALD-Informanten in VA).

Zusätzlich zur Präsentation der Daten, die bereits durch andere (meist) gedruckte Quellen publiziert wurden, nutzt VerbaAlpina seine Projektseite auch zur Neuerhebung von Daten mit einem so genannten Crowdsourcing-Verfahren. Interessierte Nutzer können für alle politischen Gemeinden des Alpenraums (im Sinn der Alpenkonvention) Bezeichnungen der von uns vorgegebenen Konzepte eingeben oder darüber hinaus auch neue Konzepte hinzufügen. Bislang sind seit dem 10.2.2017 immerhin über 11.000  Bezeichnungen geliefert worden (vgl. diese Statistik). Mit diesem einfachen Verfahren können Bezeichnungstypen zuverlässig erhoben werden – allerdings können zuverlässige phonetische Angaben nicht erwartet werden; die Phonetik tritt in VerbaAlpina daher zurück. Grundsätzlich wird jedoch erwogen, unter Umständen auch mit der Erhebung gesprochener Audiodaten zu beginnen; die technischen Probleme sind grundsätzlich gelöst.

(4) Sprachlicher Gegenstand: Der alpine Wortschatz

Bei den eben genannten Beispielen Butter und Schmalz handelt es sich aktuell nicht um spezifisch alpine Ausdrücke, denn sie gelten ja auch in der deutschen Hochsprache und darüber hinaus (vgl. z.B. eng. butter, niederl. boter). Durchaus charakteristisch für das Alpengebiet ist jedoch die herausgestellte Verbreitung der Typen über die Grenzen der Sprachfamilien hinweg, und im Hinblick auf die lange Tradition der alpinen Milchverarbeitung ist es keineswegs abwegig, sondern sogar plausibel anzunehmen, die hochsprachliche Form Butter habe sich ausgehend von den Alpen überhaupt erst verbreitet. Es wäre demnach davon auszugehen, dass sie eben in dieser Region aus dem Lateinisch-Romanischen entlehnt wurde; es scheint sich – mit anderen Worten – um ein ehemaliges Alpenwort zu handeln..

Ein gutes sprachliches Argument für diese Vermutung ist die Tatsache, dass Butter im süddeutschen, d.h. im Bairischen und gelegentlich im Alemannischen, maskulines Genus besitzt (bair. der Butter im Unterschied zu hochdeutsch die Butter) und damit noch genau dem ebenfalls maskulinen rom. Typ butirro entspricht, von dem es entlehnt wurde; die  Karte ist eindeutig, da der leere Bereich zwischen beiden Gebieten nur den fehlenden, besser: ungenauen Daten geschuldet ist, da das Genus oft nicht notiert wurde.

Wirklich konstitutiv für den alpinen Sprachraum sind jedoch die Ausdrücke, die spezifische Konzepte bezeichnen und den Dialekten außerhalb der Alpen unbekannt sind. Einige Beispiele aus dem Bereich ALMWESEN und speziell aus der MILCHVERARBEITUNG sollen Charakteristika dieser Alpenwörter illustrieren:

Alpenwörter gehen meistens auf die Zeit zurück bevor der Alpenraum teils germanisiert und slawisiert wurde; sie stammen dann aus dem Lateinischen oder aus den (so gut wie unbekannten) vorrömischen  Sprachen dieses Raums.

Vorrömisch sind:

  • ALM/ALP
  • SENN und vgl. Niev vocabulari sursilvan online s.v. signun
  • ZIGER
  • TOMME, das charakterisch für die Westalpen ist; es ist übrigens auch deshalb interessant, weil es im Mittelalter, nach der Reromanisierung Siziliens mit Siedlern aus Nordwestitalien nach Sizilien gebracht wurde (vgl. tuma, tumazzu unter ALS online). Diese Parallele wird durch einen anderen Typ bestätigt; das KÄSEN wird von 3 Informanten in den sizilianischen Madonie mit dem Typ fare il fruttobezeichnet (frutto in der Bedeutung 'Käse'; vgl. den morpho-lexikalischen Typ fari u fruttu unter: ALS online). Auch dieser spezielle Ausdruck ist in den Alpen belegt, und zwar genau im mutmaßlichen Herkunftsgebiet zahlreicher galloitalischer Kolonisten (vgl. KÄSEN, die mit dem Adelsgeschlecht der Aleramici nach Sizilien kamen.

Die Zugehörigkeit des gesamten Gebiets zum Römischen Reich spiegelt sich exemplarisch gut in der Verbreitung des Typs lat. EXCOCTA, wörtlich 'Herausgekochtes', der sich sowohl im romanischen wie im deutschen und slowenischen Teil wiederfindet. Die zugehörigen Wörter (alem. Schotten, ita. scotta usw.) beziehen sich auf das Erhitzen der Molke, um die verbliebenen Feststoffe durch Zusatz von Säure als Gerinnungsmittel herauszufiltern; sie bezeichnen teils teils die Feststoffe, teils die Flüssigkeit.

Ein methodisches Lehrstück, jenseits der MILCHVERARBEITUNG ist die Bezeichnung der GÄMSE.

VerbaAlpina: Der alpine Wortschatz und wie man ihn heute erforscht


Schlagwörter: Alpendialekte , Digitale Geisteswissenschaften , DH , Digital Humanities , Geolinguistik , Substrat

(1567 Wörter)

Sils Maria, 27.12.2017


Gegenstand dieses Vortrags ist das Projekt VerbaAlpina, das ich gemeinsam mit Stephan Lücke von der ITG leite. Es wird seit 2014 von der Deutschen Forschungsgemeinschaft (DFG) gefördert und wurde hier bereits einmal vorgestellt, als es noch in einem sehr frühen embryonalen Zustand war (vgl. Engadiner_Post). Gegenstand ist die Mehrsprachigkeit des Alpenraums, in dem sich die drei großen europäischen Sprachfamilien, Germanisch, Romanisch und Slawisch getroffen haben und seit ca. 1500 Jahren neben- und miteinander existieren (). Die folgende Graphik schematisiert die alpine Sprachgeschichte; konstitutiv sind die Romanisierung des gesamten Gebiets und seine nachfolgende teilweise Germanisierung und Slawisierung. Damit ist zwar stets eine  Verdrängung der jeweils früheren Sprachen verbunden, insofern das Lateinisch-Romanische  die vorrömischen Sprachen verdrängt und  seinerseits in manchen Gebieten durch das Germanische und Slawische verdrängt wird. Aber der Verdrängung geht eine mehr oder weniger lang andauernde lokale Zweisprachigkeit voraus (in der Graphik durch Kugeln symbolisiert), die sich in Entlehnungen aus den verdrängten in die verdrängenden Sprachen niederschlägt.  So hat sich die bemerkenswerte Situation ergeben, dass etliche spezifisch alpine Wörter nicht auf eine der drei Sprachfamilien beschränkt sind, sondern über die Grenzen dieser Sprachfamilien hinaus Verbreitung gefunden haben.


Dieser Beitrag situiert das Projekt in der aktuellen Forschung und skizziert seine Konzeption und Durchführung; die thematischen Schwerpunkte lassen sich aus Schlüsselwörtern des Titels entwicklen.

(1) ...heute...

Seit ca. 15 Jahren, d.h. seit der zügigen Durchsetzung interaktiver und kollaborativer Strukturen im Internet Web 2.0  durchlaufen zahlreiche wissenschaftliche Disziplinen einen Prozess tiefgreifenden Wandels, denn im Gefolge der medialen Revolution haben sich die Rahmenbedingungen der Wissenschaftskommunikation im Web substantiell verändert (vgl. die oben auf dieser Seite angebrachte Einladung Schreibe eine Antwort). In den Disziplinen, die sich mit kulturellen Techniken und ihrer geschichtlichen Entwicklung befassen, kann dieser Wandel mit dem Schlagwort der digital humanities identifiziert werden. Es ist nicht überraschend, dass die Wissenschaftler unterschiedlich auf diese Situation reagieren, nämlich teils mit

  • offensiver Ablehnung (Motto: "Das bedeutet den Ausverkauf der akademischen Fächer"),
  • nonchalanter Indifferenz (Motto: "Der kindische Unfug lässt mich kalt"),
  • konstruktiver Akzeptanz (Motto: "Endlich wird möglich, was ich immer schon wollte").

Nicht im Sinn eines missionarischen Eifers, sondern aus rein forschungspraktischer Überzeugung kommt für datenorientierte Disziplinen wie die historische Sprachwissenschaft eigentlich nurmehr die dritte Haltung in Frage. Wenn man diese Herausforderung jedoch annimmt, ändert sich fast Alles.

(2) ...erforscht.

Für die Einrichtung von Forschungsvorhaben (und womöglich angeschlossener universitärer Lehre) mit den Mitteln der Webtechnologie wurde eine neue, nützliche Bezeichnung geprägt; man spricht von einer virtuellen Lehr- und Forschungsumgebung.

Dieser Ausdruck wurde erforderlich, da Wissenschaftskommunikation unter den Bedingungen des Web 2.0, wie oben skizziert, nicht mehr den etablierten Gattungen der gedruckten Traditionen folgen kann, oder zumindestens nicht mehr unbedingt folgen muss. Sprachwssenschaftlich relevante Gattungen sind zum Beispiel die Abhandlung, der Sprachatlas, das Wörterbuch oder  das Textkorpus. Jede Gattung erfüllt einen bestimmten Zweck, der auf keinen Fall aufgegeben werden sollte. Jedoch werden diese Zwecke aus ihrer Isolierung befreit und in untereinander verknüpfte Funktionen verwandelt, so dass es möglich ist ohne weiteres zwischen ihnen hin und her zu wechseln.

VerbaAlpina unterscheidet fünf Funktionsbereiche und mehrere Zugangsmöglichkeiten:

    • Dokumentation,
    • Kooperation,
    • Publikation,
    • Datenerhebung durch Crowdsourcing,
    • Forschungslaboratorium.

Diese Optionen sollen – von der letzten abgesehen – nun ausgehend von einem konkreten Beispiel vorgeführt werden. Einen unmittelbaren Zugang bieten die Reiter der Startseite. So eröffnet die ‚Interaktive Karte‘ eine kartographische Präsentation des dokumentierten Materials, die über mehrere Filter gesteuert wird. Der Filter KONZEPTE erschließt sämtliche Sachen und Vorgänge, deren Bezeichnungen erfasst sind (vgl. zur Notation), so zum Beispiel die BUTTER. Die belegten Bezeichnungstypen können ebenfalls herausgefiltert werden, so dass ihre jeweiligen Bedeutungen auf der Karte erscheinen.

Weiterhin ist es möglich von der  Karte aus den zugehörigen lexikologischen Kommentar abzurufen, so wie der lexikologische Kommentar in der entgegengesetzten Richtung zur kartographischen Päsentation führt – 'Atlas' und 'Wörterbuch' sind also systematisch verschränkt. Übrigens handelt es sich keineswegs um ein uninteressantes Allerweltsbeispiel, denn sowohl die Sache als auch ihre Bezeichnungen haben einen ausgeprägten Bezug zum Alpenraum. Die Nutzung des Milchfetts ist ja dort besonders nahe liegend, wo die wichtigste antike Quelle für Fett, der Olivenbaum, nicht gedeiht. Ab einer bestimmten Höhe konnten ausschließlich tierische Fette gewonnen werden, insbesondere SCHMALZ und BUTTER. Es ist daher nicht überraschend, sondern geradezu selbstverständlich, dass in einem Teil Graubündens, also in einer Gegend, wo BUTTER traditionell das Fett schlechthin darstellt, ihre Bezeichnung auf das lateinische pinguis 'fett' zurück geht. (; vgl. surs. pieun/engad. painch u.a. im Pledari grond).
Zwar war BUTTER grundsätzlich schon in der Antike bekannt, jedoch nicht als Nahrungsmittel, sondern als medizinische Salbe.

Auch die Herkunft anderer Formen ist bemerkenswert; rätoromanisch (surs.) pischada ist durch die Herstellung motiviert, denn dieser Typ geht wahrscheinlich auf das lateinische Verb *pisiare 'stampfen' zurück (vgl. s.v. pischada). BUTTER ist sehr leicht verderblich; durch Auslassen kann die Haltbarkeit ein wenig gesteigert werden. daher ist es gut verständlich, dass in manchen Gegenden die BUTTER als Schmalz bezeichnet wird (von schmelzen im Sinne von 'auslassen'; vgl. diese Karte). Dieser Bezeichnungstyp ist aus dem Germanischen auch ins Romanische übernommen worden und hat dort zu Bezeichnungen von verwandten Konzepten geführt (vgl. Basistyp butyrum sowie das folgende Entlehnungsschema:


Zur historischen Rahmung der dialektalen Verbreitungsgebiete ist es sinnvoll, sie mit anderen  georeferenzierbaren Informationen zu kombinieren. Im Hinblick auf die Romanisierung des Alpenraums im Gefolge der römischen Eroberung sind vor allem antike Quellen von Bedeutung.; aus diesem Grund wurden auch die gesicherten Inschriften und römerzeitlichen Ortsnamen aufgenommen (vgl. die Karte CIL und Tabula Peutingeriana sowie die Hinweise zu den historischen Daten); vor diesem Hintergrund ist es interessant zu sehen, dass sich oft alte Bedeutungen aus der Antike bis heute gerade da erhalten haben, wo auch bereits römische Inschriften und antike Ortsnamen bezeugt sind. So bezeichnet der Worttyp Keller < lat. cellarium im deutschsprachigen Alpenraum in der Regel keineswegs einen RAUM UNTER DEM ERDGESCHOSS, sondern – wie das Grundwort lat. cella – den VORRATS- bzw. LAGERRAUM.

Der Filter Kartographische Darstellung → Informanten zeigt, aus welchen zahlreichen sprachwissenschaftlichen Quellen sich die Dokumentation speist. Bei den meisten davon handelt es sich um gedruckte Quellen (Atlanten und Wörterbücher), die in aufwändiger Weise retrodigitalisiert wurden, so dass ihre Belege zu einem Dialektmosaik des ganzen Alpenbogens zusammengefügt werden konnten. Manche, bereits digital vorliegende Projekte haben uns auch umfangreiche Datenbestände zur Verfügung gestellt, so dass ihre daten – selbstverständlich mit Quellenangabe – auch in der verbaAlpine Kartographie erfasst werden können. Hier ist zum Beispiel ganz im Sinn breiter Kooperation der dolomitenladinische Sprachatlas (ALD) von Hans Goebl zu nennen (vgl. ALD-Informanten in VA).

Zusätzlich zur Präsentation der Daten, die bereits durch andere (meist) gedruckte Quellen publiziert wurden, nutzt VerbaAlpina seine Projektseite auch zur Neuerhebung von Daten mit einem so genannten Crowdsourcing-Verfahren. Interessierte Nutzer können für alle politischen Gemeinden des Alpenraums (im Sinn der Alpenkonvention) Bezeichnungen der von uns vorgegebenen Konzepte eingeben oder darüber hinaus auch neue Konzepte hinzufügen. Bislang sind seit dem 10.2.2017 immerhin über 7 300 Bezeichnungen geliefert worden (vgl. diese Statistik). Mit diesem einfachen Verfahren können Bezeichnungstypen zuverlässig erhoben werden – allerdings können zuverlässige phonetische Angaben nicht erwartet werden; die Phonetik tritt in VerbaAlpina daher zurück. Grundsätzlich wird jedoch erwogen, unter Umständen auch mit der Erhebung gesprochener Audiodaten zu beginnen; die technischen Probleme sind grundsätzlich gelöst.

(3) Der alpine Wortschatz...

Bei den eben genannten Beispielen Butter und Schmalz handelt es sich aktuell nicht um spezifisch alpine Ausdrücke, denn sie sind gelten ja auch in der deutschen Hochsprache und darüber hinaus (vgl. z.B. eng. butter, niederl. boter). Durchaus charakteristisch für das Alpengebiet ist jedoch die herausgestellte Verbreitung der Typen über die Grenzen der Sprachfamilien hinweg und im Hinblick auf die lange Tradition der alpinen Milchverarbeitung ist es keineswegs abwegig, sondern sogar plausibel anzunehmen, die hochsprachliche Form Butter habe sich ausgehend von den Alpen überhaupt erst verbreitet. Es wäre demnach davon auszugehen, dass sie eben in dieser Region aus dem Lateinisch-Romanischen entlehnt wurde.

Ein gutes sprachliches Argument für diese Vermutung ist die Tatsache, dass Butter im süddeutschen, d.h. im Bairischen und gelegentlich im Alemannischen, maskulines Genus besitzt (bair. der Butter im Unterschied zu hochdeutsch die Butter) und damit noch genau dem ebenfalls maskulinen rom. Typ butirro entspricht, von dem es entlehnt wurde; die  Karte ist eindeutig, da der leere Bereich zwischen beiden Gebieten nur den fehlenden, besser: ungenauen Daten geschuldet ist, da das Genus oft nicht notiert wurde.

Wirklich konstitutiv für den alpinen Sprachraum sind jedoch die Ausdrücke, die spezifische Konzepte bezeichnen und den Dialekten außerhalb der Alpen unbekannt sind. Einige Beispiele aus dem Bereich ALMWESEN und speziell aus der MILCHVERARBEITUNG sollen Charakteristika dieser Alpenwörter illustrieren:

Alpenwörter gehen meistens auf die Zeit zurück bevor der Alpenraum teils germanisiert und slawisiert wurde; sie stammen dann aus dem Lateinischen oder aus den (so gut wie unbekannten) vorrömischen  Sprachen dieses Raums.

Vorrömisch sind:

  • ALM/ALP
  • SENN und vgl. Niev vocabulari sursilvan online s.v. signun
  • ZIGER
  • TOMME, das charakterisch für die Westalpen ist; es ist übrigens auch deshalb interessant, weil es im Mittelalter, nach der Reromanisierung Siziliens mit Siedlern aus Nordwestitalien nach Sizilien gebracht wurde (vgl. tuma, tumazzu unter ALS online).

Die Zugehörigkeit des gesamten Gebiets zum Römischen Reich spiegelt sich exemplarisch gut in der Verbreitung des Typs lat. EXCOCTA, wörtlich 'Herausgekochtes', der sich sowohl im romanischen wie im deutschen und slowenischen Teil wiederfindet. Die zugehörigen Wörter (alem. Schotten, ita. scotta usw.) beziehen sich auf das Erhitzen der Molke, um die verbliebenen Feststoffe durch Zusatz von Säure als Gerinnungsmittel herauszufiltern; sie bezeichnen teils teils die Feststoffe, teils die Flüssigkeit.

Ein methodisches Lehrstück, jenseits der MILCHVERARBEITUNG ist die Bezeichnung der GÄMSE.

Abstract Euralex 2018




(750 Wörter)

Abstract

The project VerbaAlpina funded by the German Research Foundation explores the Alpine region selectively and analytically in its historico-cultural and historical linguistic unity. This region is characterised by its ethnographic and topographic homogeneity and at the same time by its strong linguistic heterogeneity (different languages in form of different dialects). In three stages (stage 1: 2014 – 2017, stage 2: 2017 – 2020, stage 3: 2020 – 2023) the project elaborates the linguistic reality of three conceptual domains: stage 1: alpine pasture, stage 2: flora and fauna, stage 3: modern alpine life. With the innovative approach VerbaAlpina overcomes the traditional limitation of geolinguistic investigation to nation-states. To reach this aim, an extensive portal, which goes beyond single languages and national borders, is built using modern media technology (database, geocoding, internet, social software).

One of the main functional areas is lexicographic function embedded in the virtual research environment of VerbaAlpina. It offers new possibilities to gather, elaborate, access and visualize lexical data.Whereas the most of the dictionaries barely offer one point of view on the subject, VerbaAlpina allows exploring the language from both: onomasiological and semasiological perspective. To reach that aim the already existing data from language atlases (such as AIS, ASLEF, ALF), dictionaries (ALTR, WBÖE), in both digital and analogue form as well as the newest data harvested with the crowdsourcing tool undergo to a process of systematic elicitation of data to fit it to the unified and structured data entities in means of the relational database. The process can be divided into three major steps:

  • Transcription/Data transfer: The linguistic material is being brought into the structure of the relational database. Depending on the type of the source, the data is being transcribed or digitally transferred to the database. Beginning from this point and following the principle of Quellentreu, all the input data can be retraced to the original raw data and to the source. This step provides also the elicitation of concepts related to the source data.
  • Tokenization: It consists in the automatic separation of the gathered utterances in single tokens. Doing so complex lexemes are split into single words whereby the grammatical and lexical units are separated from each other prior to the typification. Also at this stage, all the tokens, which are the voice attestations are converted into IPA to achieve kind of comparable data.
  • Typification: The last step consists in morpho-lexical typification. By that, we mean the allocation of single tokens to the morpho-lexical types, which can be seen as a lemma in a dictionary. The categories used to create a morpho-lexical type are language family (Romance, Germanic, Slavic), part of speech, affix, genus. Additionally, the lexical basis and its source language are determined.

As an outcome of that process, one can access and analyze the data two ways, through database queries and through the usage of an interactive card. The advantages of direct database query consist in easy and most precise structured access to all linguistic data gathered through the project. Although the queries make it possible to freely “ask” any question to the database, some knowledge of SQL is necessary. The second way, let say more user-friendly, is the presentation of a data in a geographical context. The interactive map gives to the user a number of choices and filters to visualize the linguistic data, as mentioned before in both ways: semasiologic and onomasiologic. The power of interactive map consist also in the possibility of bringing together linguistic and non-linguistic data such as infrastructure, historic data etc. The latest can be seen as an additional interpretative information. Every cartographic presentation created by the user can be stored in a database as a so called synoptic map and be easily retrieved later on.

The project is open for all kind of cooperation and is already working with numerous partners from the alpine region. Everyone is welcome to participate in the development of data stock and on creating of the network of projects and users interested in research subjects or in our technology. Therefore VerbaAlpina offers different tools for scientists and regular language users. The added value consists on the one side in the multi-directionality of the project which collects, documents and disseminates structured linguistic and ethnographic data. For example, it is possible for already existing online dictionaries to connect directly to the interactive card and give the reader the opportunity to look at the book page words in geographical context. On the other side the project make every effort to provide innovative online publishing platform with solutions focused on sustainabilty and citability.

Orientierungsmodul 20170117




(4809 Wörter)

Projektpräsentation im Rahmen des Orientierungsmoduls, BA Italianistik, LMU, 17.1.2017

Übersicht

qr code
Vorbemerkung: Forschung und Medien – nach der 2. medialen Revolution

Zur Konzeption

Funktionsbereich (1):  Dokumentation 

Funktionsbereich (2):  Kooperation

Funktionsbereich (3): Publikation

Funktionsbereich (4): Datenerhebung durch Crowdsourcing

Funktionsbereich (5): virtuelles Forschungslabor


Zur Konzeption

Die Raumorientierung

VerbaAlpina (VA) dokumentiert die dialektale Variation innerhalb eines ethnographisch (und weder sprachlich noch national) definierten Raums, und genau in diesem Sinne ist die Konzeption durchaus ethnolinguistisch; aus rein pragmatischen Gründen wird das Untersuchungsgebiet mit dem Geltungsbereich der so genannten Alpenkonvention gleichgesetzt.

Im Vordergrund steht das Lexikon, und der onomasiologische Rahmen für die Selektion des projektrelevanten Ausschnitts wird durch kulturelle Techniken und Lebensformen abgesteckt, die sich unter den jeweils spezifischen, auch kulturunabhängigen Umweltbedingungen konventionalisiert haben. Dergleichen Räume, die durch die Alpen in prototypischer Weise repräsentiert werden, konnten die sprachwissenschaftlichen Forschungstraditionen nicht angemessen erfassen, da sich die Teildisziplinen, die sich systematisch mit der Konstitution von Räumen beschäftigen – also die Sprachgeographie, bzw. Dialektologie oder auch Geolinguistik – beinahe ausnahmslos an vorgegebenen politischen und/oder (einzel)sprachlichen Grenzen orientieren. Der räumliche Zuschnitt zentraler und in mancher Hinsicht bis heute maßgeblicher Unternehmungen ist zwar nachzuvollziehen (vgl. etwa den AIS und das FEW) – zustimmen mag man jedoch oft nicht. Gerade die besonders faszinierenden mehrsprachigen Kulturräume, also z.B. die Pyrenäen, Korsika und Sardinien im Verbund oder aber das Gebiet zwischen der montenegrinisch-albanischen Adriaküste und der Donau, fallen daher durch das Raster der etablierten, durch nationalphilologische Voreinstellungen gesteuerten Forschung. Der ambitioniert geplante Atlante linguistico mediterraneo hätte ein richtungweisendes Großprojekt werden können; er ist jedoch über Ansätze niemals hinausgekommen.
VerbaAlpina zielt auf den Alpenraum; das Projekt will aber weder Sprach- noch Dialektgrenzen herausarbeiten (vgl. Auer 2004) und keineswegs das Mosaik gegeneinander abgegrenzter Varietäten (Dialekte) abbilden. Vielmehr wird eine Interlinguale Geolinguistik entwickelt, die untersucht, inwieweit spezifische Varianten, nämlich die für den alpinen Kulturraum charakteristischen Bezeichnungstypen, gerade den Dialekten gemeinsam sind und sie womöglich über die Grenzen der Sprachfamilien hinaus verbinden. Die relative Änlichkeit der lokalen Dialekte ergibt sich induktiv aus den Daten selbst. Die einzige vorgegebene Gliederung des Alpenraums, die der Kartographie von vornherein unterlegt wird, betrifft die aktuellen Grenzen zwischen den drei großen Sprachfamilien (Germanisch, Romanisch, Slawisch).

Perspektive

Die Verteilung der Varianten in diesen dialektalen Großräumen impliziert vielfältige, mehr oder weniger weit zurückliegende Kontaktbeziehungen; daher kann die übergreifende Perspektive des Projekts nur eine historische sein. Im Blick auf den skizzierten Untersuchungsraum versteht sich VerbaAlpina allerdings nicht als Beitrag zur nationalen Sprachgeschichtsschreibung der involvierten Sprachen, sondern als Versuch, die Stratigraphie eines mehrsprachigen kommunikativen Raums exemplarisch zu rekonstruieren.

Dabei wird ausschließlich bottom up verfahren, das heißt auf Grundlage von Daten, die lokal georeferenzierbar sind. Die minimale und by default geltende Referenzeinheit ist die politische Gemeinde, genauer gesagt ein Geopunkt, der die Gemeinde als ganze repräsentiert, oder aber die gesamte Gemeindefläche. Im Bedarfsfall kann die Georeferenzierung jedoch einerseits bis auf wenige Meter präzisiert oder aber, andererseits, regional erweitert werden: die Präzisierung gestattet grundsätzlich (mikro)toponomastische Anwendungen und die regionale Zusammenfassung erlaubt insbesondere in quantitativer Hinsicht nützliche synthetische Darstellungen.

Die Fundierung in Webtechnologie

VerbaAlpina kann als eine webbasierte Forschungsumgebung beschrieben werden, die in den digital humanities angesiedelt ist. Dieses Format wird bestimmt durch die aktuellen Rahmenbedingungen, die sich ganz erheblich von der traditionellen Wissenschaftskommunikation unterscheiden. So eröffnen sich in ganz selbstverständlicher Weise fünf unterschiedliche, aber eng miteinander verflochtene Funktionsbereiche angelegt.

Funktionsbereich (1): Dokumentation

Das Untersuchungsgebiet von VerbaAlpina erscheint in geolinguistischer Hinsicht auf den ersten Blick gut erschlossen. Allerdings klafft im zentralen und östlichen Teil Österreichs eine gewaltige Datenlücke.

geoling_va_gebiet

inf_va_legende

Karte 1: Erschließung des alpinen Sprachraums durch Atlanten

Durch Berücksichtigung der Daten des WBÖ, die ja größtenteils lokal erhoben wurden, kann diese Lücke bis zu einem gewissen Grad nun geschlossen werden. Die folgende Karte zeigt, dass alle Erhebungsorte des WBÖ inzwischen georeferenziert wurden, so dass bald Wörterbuchdaten aufgenommen werden können; VerbaAlpina wird jedoch die literarischen Belege des WBÖ systematisch ausblenden.

inf_wboe

Karte 2: Erhebungsnetz des WBÖ

Bei genauerem Hinsehen sind die Verhältnisse allerdings einigermaßen ernüchternd; die folgende, mit dem quantitativen Kartierungstool von VerbaAlpina erzeugte Karte zeigt die Dichte aller Erhebungspunkte des italienischen Staatsgebietes unabhängig von der Sprachzugehörigkeit. Wie man sieht,  ist die Erschließung sehr ungleichmäßig; die Regionen mit Minderheitensprachen erweisen sich als klar privilegiert. – Andere, geolinguistisch hochkomplexe Gegenden, wie zum Beispiel das okzitanisch-piemontesisch-ligurische Übergangsgebiet sind dagegen absolut unterrepräsentiert.

inf_italien

Karte 3: Geolinguistische Erschließung Italiens auf der Ebene der Gemeinden

Den Zugang zur Dokumentation vermitteln zunächst unterschiedliche Filter. Sie erlauben es dem Nutzer, aus den verfügbaren Daten eine gezielte Auswahl zu treffen und kartographisch darzustellen.

In der Kartographie sind mehrere interaktive Optionen vorgesehen, die bislang über die Symbole der Punktsymbolkarten gesteuert werden. Die interaktiven Symbolkarten markieren einen substanziellen Fortschritt der linguistischen und humanwissenschaftlichen Raumdarstellung, da sie es gestatten, stark abstrahierte ('synthetische') Repräsentationen mit ganz konkreten, lokalen Informationen ('analytisch') anzureichern. So zeigt die folgende Karte die Verbreitung der Bezeichnungstypen des Konzepts BUTTER im Überblick: Invalid map id

 

Linguistische Datenaufbereitung

Bei Aktivierung ('Klick') eines Punktsymbols auf der Karte öffnet sich ein Fenster mit den jeweils für den Ort verfügbaren sprachlichen Daten. Alle Daten werden quellentreu wiedergegeben (als phonetisch transkribierter Einzelbeleg, wie im vorstehenden Beispiel, oder in orthographisch typisierter Form) und allgemeineren Typen zugeordnet; die abstrakteste Kategorie wird durch den etymologisch definierten Basistyp vertreten. Außerdem wird auf Referenzwörterbücher verlinkt, die – wenn möglich – auf standardsprachliche Äquivalente verweisen (hier die Symbole C und T). Das folgende Beispiel zeigt die Bezeichnung des Konzepts RAHM in Bergün (Graubünden):

groma_AIS1204_1_Typ

Karte 5: Präsentation und Typisierung der Sprachdaten im Belegfenster der interaktiven Karte

Wenn standardsprachliche Entsprechungen fehlen, wird auf dialektale Referenzwörterbücher verlinkt (z.B. das Schweizerische Idiotikon). Die Zuweisung jedes Sprachdatums einer Quelle zu einem Typ gestattet es, Quellen ganz unterschiedlicher Art zu kombinieren, ohne ihre erheblichen qualitativen Divergenzen zu verwischen.

Nicht selten sind in den ausgewählten Kategorien bereits zahlreiche sprachliche Ausdrücke verfügbar; die Suche nach dem 'Konzept' BUTTER führt zu 1449 Belegen. Es wird daher die Möglichkeit gegeben, alle relevanten Ausdrücke nach unterschiedlichen Kriterien zu gruppieren und sortieren.

Alternative Visualisierung

Komplementär zur Punktsymbolkarte wird eine interaktive Flächensymbolisierung vorbereitet, um eine gute Visualisierung quantitativer Verhältnisse zu ermöglichen. Dabei sollen einerseits die georeferenzierten Gemeindeflächen zu Grunde gelegt werden (wie auf Karte 3); zusätzlich sollen jedoch alle Gemeinden durch 'Waben' identischer Größe repräsentiert werden; wegen der sehr unterschiedlichen Gemeindegrößen wird die optische Wahrnehmung dadurch unwillkürlich verfälscht. Im Fall gleichgroßer Karteneinträge müsste diese Form der Visualisierung (im Unterschied zum echten Voronoi-Verfahren) allerdings auf die Georeferenzierung verzichten. Hier eine mögliche Kartierung:

VA_Polygone

Quellen

Bislang wurden einige georeferenzierbare Wörterbücher (wie etwa der ALTR), vor allem jedoch Sprachatlanten ausgewertet. Dabei wurden im wesentlichen drei Techniken eingesetzt:

Quellentyp (1): Gedruckte Karten

Bereits auf gedruckten Karten publiziertes Material wurde mit einem speziell entwickelten Tool neu transkribiert und in die VA-Datenbank eingelesen, so im Fall der allermeisten Atlanten (SDS, AIS, TSA usw.). Im Einzelnen sind die Prozeduren für die Digitalisierung jedoch aufwändig und kaum, wenn überhaupt, zu automatisieren. Sie setzen zunächst eine rigorose Trennung der unterschiedlichen Informationen voraus, die eine analoge Sprachkarte liefert. Diese Informationen werden von VerbaAlpina in einem Wissenshorizont strukturiert, der durch die drei Dimensionen der außersprachlichen Realität, der Konzepte und der sprachlichen Ausdrücke abgesteckt wird.

Man vergleiche etwa den allgemeinen Kommentar zum Stimulus MILCH-,KÄSEKELLER, der drei Bautypen (A, E, S) unterscheidet und sie bei den Einzelbelegen um weitere Informationen ergänzt (rot Pfeile).

AIS_Milchkeller

Alle diese Hinweise werden von VerbaAlpina in abfragbare Unterkonzepte verwandelt, wie die folgende Abbildung zeigt:

Milchkeller_Unterknzpt

So wird eine differenzierte semantische Analyse der erfassten Ausdrücke ebenso möglich wie eine onomasiologische Untersuchung der Konzeptbezeichnungen.

Die folgende Abbildung zeigt die Oberfläche, auf der gedrucktes Material transkribiert wird:

Transkript_tool

Das von VA entwickelte Transkriptionstool

Quellentyp (2): Gedruckte Karten auf Basis digitalisierter Daten

Bereits auf gedruckten Karten publiziertes Material, das jedoch im Original schon digital vorliegt, wurde so konvertiert und algorithmisch neu transkribiert, dass es in die VA-Datenbank eingelesen werden konnte. Dieses Verfahren wurde für den ALD-II und den ALTR praktiziert.

Quellentyp (3): Nicht publiziertes analoges Material

Noch nicht publiziertes Material anderer Projekte wird direkt aus deren Erhebungsbögen transkribiert bzw. digital übernommen; einen Auszug aus einem Erhebungsbogen des SAO veranschaulicht die direkte Übernahme, die mit dem selben Tool erfolgen kann, das für den Quellentyp (1) benutzt wird.

SAO_Milchkeller

Fragebuchauszug aus dem SAO – Typ: 'Milchkammer' (Graphik: Stephan Lücke)

Die Datenbankeingabe der Quellentypen (1)-(3) geschieht nun zunächst mit Hilfe eines technischen Betacodes auf der Basis von ASCII-Zeichen und in einem zweiten Schritt mit einer automatischen Umsetzung der technischen Transkription in das Internationale Phonetische Alphabet (IPA), wie zwei Beispiele aus dem AIS und dem SAO zeigen:

AIS_Milchkeller_Transkription

(Graphik: Stephan Lücke)

SAO_Milchkeller_Transkription

(Graphik: Stephan Lücke)

Die Entsprechungen von Input (Quelle), Betacode und Output (Weboberfläche) werden in einer mittlerweile umfangreichen Codepage (CODEPAGE FÜR ALLE) dokumentiert.

Bei den Materialien, die bereits in digitaler Kodierung vorliegen, kann die Umsetzung in IPA im Idealfall durch entsprechende Programmierung automatisiert werden. Das war etwa im Fall der ALD-Daten möglich.

ALD_IPA

ALD-Kodierung 'edelvais' (Graphik: Stephan Lücke)

Die Quellentypen (1)-(3) ergeben oft ein inkonsistentes und wenig ausgeglichenes Bild, da nicht alle Stimuli offenkundig mit derselben Präzision abgefragt wurden; extrem sind z.B. die Details, mit denen die Bezeichnungen des ALMSTALLS in der Erhebung des AIS spezifiziert wurden. Dem übergeordneten Prinzip der Quellentreue folgend, werden die unterschiedlichen Gewichtungen in der Dokumentation von VerbaAlpina erhalten (Link --> Konzept --> Gebäude --> Almstall), idealerweise können sie jedoch durch Neuerhebungen ausgeglichen oder wenigstens reduziert werden.    

Quellentyp (4): Neuerhebung über soziale Medien

Der Erhebung neuen Materials ist der 'Funktionsbereich (4)' gewidmet (s.u.).

Multidimensionalität

Für ein umfassendes Verständnis der sprachhistorischen Prozesse ist es unbedingt wünschenswert, die sprachlichen Daten um andere, historisch relevante Daten zu ergänzen; das kann VerbaAlpina nur sehr bedingt leisten; immerhin sind manche relevante Daten in der 'Interaktiven Karte' über den Filter 'Außersprachliches' abrufbar. Der folgende Kartenausschnitt zeigt in synoptischer Zusammenschau einerseits die

          • Orte mit lateinischen Inschriften in der Provinz Noricum (mittelblauer Kreis);
          • Orte mit lateinischen Inschriften aus Raetien (lilafarbener Kreis);
          • aus der so genannten Tabula Peutingeriana überlieferten römische Ortsnamen an den viae publicae (pinkfarbener Kreis).

Andererseits wurden die Reflexe von drei lateinischen, genauer: zwei lateinischen und einem latinisierten aber mutmaßlich vorrömischen Basistypen aufgerufen:

          • Basistyp lat. casearia in der Bedeutung 'Hütte' ('C' im dunkelblauen Kreis) in Nord-, Süd- und besonders prägnant in Osttirol;
          • den Basistyp vorröm. baita in der Bedeutung 'Haus' ('B' im grünen Quadrat)  in Slowenien südlich von Ljubljana;
          • den Basistyp lat. cellarium in der Bedeutung 'Hütte' (grünes Dreieck) in Oberösterreich.

Invalid map id

Die unübersehbare Kongruenz oder wenigstens Affinität der Distributionen dürfte kaum einem Zufall geschuldet sein.

Ein westalpines Beispiel

Ein Beispiel aus den romanischsprachigen Westalpen, d.h. hier grosso modo  aus dem Gebiet zwischen dem Rhônetal im Westen und dem Ossolatal im Osten, soll nun exemplarisch das sprachgeschichtliche Potential der webbasierten geolinguistischen Dokumantation zeigen.

Die lokalen Mundarten dieses Gebiets werden durch mehrere, teils ganz kleinräumige (CLAPie) und teils erst initial (APV, ALEPO) publizierte Sprachatlanten dokumentiert (vgl. Karte 1). Die Idiome dieses westalpinen Kontinuums werden von der Dialektologie in mehreren großräumigen Gruppen klassifiziert, die als 'Okzitanisch', 'Frankoprovenzalisch', 'Ligurisch' und 'Piemontesisch' bezeichnet werden. Die beiden zuerst genannten sind deutlich grenzüberschreitend – ganz im Gegensatz zu den entsprechenden Atlanten, die nur in Ausnahmefällen über die Staatsgrenzen hinausgehen : der ALF mit 8 Erhebungspunkten in Italien; der ALJA mit einem Erhebungspunkt in Italien und der APV mit je 2 Erhebungspunkten in Italien und in der Schweiz. Man beachte also, dass sowohl ALEPO als auch CLAPie und ALP im Wesentlichen okzitanische Mundarten erfassen, und dass ALJA und APV auf das Frankoprovenzalische zielen.

Es ist daher dringend wünschenswert, die Daten zusammenzuführen und synoptisch zu kartieren, wie es zumindest für spezifische Ausschnitte des Wortschatzes im Projekt VerbaAlpina geschieht:

westalpen_sprachatlanten

Karte 7: Geolinguistische Erschließung der Westalpen

Das Beispiel tomme/toma 

Für eine detaillierte Sprachgeschichtsschreibung kann es im Übrigen nützlich, ja notwendig sein, eine weit über den eigentlich fokussierten Ausschnitt des Kontinuums hinausreichende  räumliche Perspektive einzunehmen, so dass auch sekundär entstandene Migrationsvarietäten berücksichtigt werden können. Im Fall der Westalpen sind die süditalienischen und sizilianischen Kolonien  von großem Interesse. Dazu das folgende, nicht ganz unbekannte Beispiel: In den Westalpen ist der morpholexikalische Typ tomme verbreitet; er geht etymologisch auf gall. toma (vgl. FEW 13, 20 f.) zurück. Als generische Bezeichnung des Konzepts KÄSE ist er weitgehend synonym mit dem Typ fra. fromage/ita. formaggio.
Invalid map id

tomme

Karte 8: Verbreitung von tomma/tuma

madonie_sottile-2002

Karte 9: Die Madonie; das Erhebungsgebiet von Sottile 2002

Die transparente Etymologie von fromage/formaggioaus dem lateinischen Partizip formaticu(m) 'geformt' zeigt, dass bei diesem Typ eine sekundäre taxonomische Bedeutungserweiterung von 'geformter fester Käse' --> 'Käse, allgemein' vorliegt. Weniger offensichtlich ist, dass sich die generische Bedeutung auch im Fall von tomme erst sekundär entwickelt zu haben scheint. Den Beweis liefert Sizilien, wo beide Typen mit komplementären Bedeutungen gut belegt sind: siz. tuma, das offensichtlich mit den galloitalischen Kolonisten im Gefolge der normannischen Eroberung gekommen ist, bezeichnete den ungeformten Frischkäse, während siz. fromaggiu ausschließlich und ganz im Sinne der Etymologie den geformten Käse bezeichnet, genauer: die in Formgefäßen gepresste Käsemasse unterschiedlicher Reifungsgrade:

"tuma GA ['tuma], GE → etn., AL → etn., CA → etn., IS. → etn., PO → etn. ['tuma],['tumwa] f. prodotto caseoso che si ottiene rompendo la cagliata. 2. formaggio fresco non sottoposto a sterilizzazione nella scotta. 3. formaggio fresco, immerso direttamente nella scotta senza essere pressato nelle fiscelle.
Rotta la cagliata (→ quagghiata) nella → tina, la massa caseosa che precipita sul fondo e che viene raccolta (→ accampari, → arricampari) e sistemata a scolare nel → tavulìeri è ormai detta tuma. La tuma, poi, facoltativamente tagliata a cubetti, viene sistemata in fiscelle (→ ntumari, → ntumalora) perché possa scolare ulteriormente. Tuma è, inoltre, chiamato il formaggio che non viene sottoposta a sterilizzazione nella scotta (cfr. GE) e che generalmente viene consumato subito [...]
Etn[otesto]. GE [a Geraci; TK] a tuma un ci â d'èssiri misa nâ → vasceɖɖa, si ssi parra di tuma.
Trad. «la 'tuma' non va messa [raccolta] nelle fiscelle, se parliamo della 'tuma' ». [...]
Etn. IS [a Isnello, TK] a tuma jeni u prodottu che si ffa ppoi u → formàggiu
Trad. «La 'tuma' è il prodotto [la pasta caseosa] che [con cui] si fa il formaggio». [...]" ((Sottile 2002, 168), 168)

In Sizilien haben sich also beide Typen in ihren ursprünglichen und spezifischen Bedeutungen erhalten, die im Fall von fromaggiu sogar noch motiviert ist. Ebenfalls noch motiviert ist der siz. Diminutiv tumazzu (vgl. Sottile 2002, 168), der für zwar feste und geformte, aber daher auch reduzierte, eher kleine Käselaibe steht (wie die Produkte, die heute in Frankreich und in der Westschweiz als tomme vermarktet werden).

Funktionsbereich (2): Kooperation

Neben den gleichsam historischen Sprachdaten, die in Sprachatlanten und Wörterbüchern dokumentiert sind, werden weitere, nicht selten aktuellere, Sprachdaten aus dem Alpenraum von Sprachforschern verschiedener akademischer Institutionen gesammelt, verwaltet und publiziert. Aus Sicht von VerbaAlpina spielen diese Daten in mehrfacher Weise eine bedeutende Rolle. Zum einen erlauben sie unter Umständen, Beleglücken onomasiologischer und/oder geographischer Art zu schließen, die die systematische Erfassung des Atlanten- und Wörterbuchmaterials zurückgelassen hat. Gerade wenn es sich um rezentes Sprachmaterial handelt, eröffnet sich daneben jedoch auch eine diachrone Perspektive, die durch den Vergleich mit dem historischen Material einen Blick auf Sprach- und unter Umständen auch auf einen dahinter stehenden Kulturwandel ermöglicht. Aus diesem Grund hat sich VerbaAlpina um den Abschluss von Kooperationsvereinbarungen mit einer ganzen Reihe von Projektpartnern bemüht. Die immer noch anwachsende Liste von Institutionen aber auch von Einzelpersonen ist auf dem VerbaAlpina-Portal einsehbar. Derzeit bestehen über 30 derartige Kooperationsvereinbarungen.

Zentraler Gegenstand der entsprechenden Vereinbarung ist der wechselseitige (!) Austausch von Sprachmaterial, d.h. VerbaAlpina stellt seinerseits seinen Projektpartnern das gesamte in der VerbaAlpina-Datenbank (VA_DB) zusammengetragene Material zur Verfügung. Wesentlicher Bestandteil der Kooperationsvereinbarung ist die allseitige Verpflichtung, bei der Verwendung von Sprachmaterial im Rahmen von Publikationen grundsätzlich die ursprüngliche Quelle der jeweiligen Daten zu nennen.

Durch die Vielzahl an Kooperationsvereinbarungen ist zunächst de iure, nach und nach jedoch auch de facto eine Vernetzung bislang voneinander getrennter Datenbestände entstanden, die es allen Beteiligten ermöglicht, die eigenen Daten in einem erweiterten Kontext zu sehen bzw. auch darzustellen. Zwar ist diese Art der Vernetzung aktuell, dem thematischen Focus von VerbaAlpina entsprechend, auf den Alpenraum beschränkt, eine Ausweitung über die Grenzen des Projekts und seinen geographischen Rahmen hinaus ist aber natürlich sehr sinnvoll und entsprechend wünschenswert. Aus diesem Grund wurde damit begonnen, Kooperationspartner auch außerhalb der Alpenregion zu suchen. Aktuell laufen Gespräche mit Vertretern des Atlante linguistico della Sicilia (ALS), und in einem kleinen Versuchsrahmen wurden auch schon Daten aus Sizilien in unser geolinguistisches System integriert. Es existiert auch bereits ein entsprechendes Portal, über die diese sizilianischen Daten in ganz ähnlicher Weise wie bei VerbaAlpina abgerufen, visualisiert und analysiert werden können:

tuma_als

Daten des Atlante Linguistico della Sicilia auf einer online-Karte (http://www.als-online.gwi.uni-muenchen.de/carta/)

Das Erscheinungsbild lässt deutlich erkennen, dass hier die selbe Technologie zum Einsatz kommt wie bei VerbaAlpina. Auch wenn man nicht von einem generischen System im engeren Sinne bzw. von modularer Verwendung sprechen kann, so ist die Realisierung eines solchen Ablegers, der sich im wesentlichen nur durch die geographische Verortung unterscheidet, aus rein technischer Sicht kein großes Problem. Und dadurch, dass die eigentlichen Daten im selben Backend und – ganz wesentlich – in einer kompatiblen Struktur verwaltet werden, sind problemlos regionsübergreifende Zusammenhänge erkenn- und darstellbar. Die sprachwissenschaftliche Relevanz dieser Möglichkeit wurde gerade vorhin illustriert am Beispiel der morpholexikalischen Typen Tomme/Toma und Fromage/formaggio.

Das Ziel besteht letztlich darin, eine geolinguistische Forschungsplattform zu etablieren, an der sich Sprachwissenschaftler unterschiedlichster Fachrichtungen und Interessen beteiligen können.

Für die Erzielung möglichst weitreichender Akzeptanz sind verschiedene Faktoren von Bedeutung. Einer dieser Faktoren wurde bereits genannt: Die allseitige Verpflichtung, bei der Verwendung fremden Materials grundsätzlich dessen ursprüngliche Herkunft zu nennen. Eine weitere wichtige Voraussetzung ist, dass einerseits Standards hinsichtlich Datenstrukturierung und Zeichenkodierung vereinbart und eingehalten werden, andererseits alle Beteiligten ein Maximum an individueller Freiheit hinsichtlich eben dieser Standards behalten. Was widersprüchlich klingt, lässt sich durch ein Schnittstellenmodell zumindest konzeptionell problemlos realisieren: Für jede Datenstruktur und Kodierung wird eine eigene Schnittstellenprozedur entworfen, die die Daten von der individuellen Gestalt in die definierten Standards überführt.

VerbaAlpina stellt jedem Partnerprojekt eine eigene relationale Datenbank auf einem MySQL-Server-Cluster zur Verfügung:

pva_datenbanken_20161122

Die Datenbanken der VerbaAlpina-Partner (PVA) auf dem MySQL-Cluster der ITG (Stand: 2016-11-22)

Die Projektpartner sind hinsichtlich der konkreten Ausgestaltung ihrer Datenbank im Hinblick auf Strukturierung und Zeichenkodierung vollkommen frei. Lediglich VerbaAlpina sowie sämtliche Kooperationspartner, die sich durch die Unterzeichnung der Kooperationsvereinbarung zur Einhaltung der genannten Regeln verpflichtet haben, besitzen Leserechte auf die Partnerdatenbanken. Nach außen hin ist der Zugang zu den Datenbanken passwortgeschützt, kann auf Wunsch der Eigentümer jedoch individuell oder für jedermann, vollständig oder in Teilen, freigegeben werden. Folgende Grafik gibt, unter anderem, einen Überblick über die Zugriffsrechte auf die einzelnen Module von VerbaAlpina. Mit Zugriffsrechten sind hier stets Leserechte, keine Schreibrechte, gemeint:

VA_Module_Daten_Gruppen

Die Daten der Projektpartner werden von der IT-Gruppe Geisteswissenschaften (ITG) der Ludwig-Maximilians-Universität (LMU) München in einer, z.T. an das Leibniz-Rechenzentrum (LRZ) angebundenen, professionellen IT-Infrastruktur gehalten. Die ITG garantiert hohe Ausfallsicherheit sowie, selbstverständlich, die regelmäßige Anfertigung von Backups. Auch die langfristige Archivierung der Daten der Projektpartner auf den Archivierungsservern des LRZ ist möglich.

Aus Sicht der Kooperationspartner könnte ein wichtiger Aspekt die institutionelle Absicherung der ITG sein. Es geschieht leider nicht selten, dass großangelegte Projekte, die über viele Jahre hinweg finanziert und betrieben wurden und die z.T. große Mengen an Material zusammengetragen haben, nach Ende der Finanzierung vor dem Aus stehen und es keine Möglichkeit gibt, die Projektdaten zu bewahren bzw. auch weiterhin zur Verfügung zu stellen. Dieses Problem ist weit verbreitet und nicht auf einzelne Länder beschränkt. Erst jüngst berichtete die Inhaberin der Humboldt-Professur für die Alte Geschichte des Nahen und Mittleren Ostens, Karen Radner (übrigens eine Österreicherin), von ihrer Erfahrung mit einer Datenbank mit Keilschrifttexten. Diese Datenbank war über Jahrzehnte hinweg an der Universität Helsinki erarbeitet worden. Nachdem der Verantwortliche Wissenschaftler in den Ruehstand gegangen war, habe sich an der Universität Helsinki niemand für diesen einzigartigen Datenbstand interessiert. Zum Glück konnte Karen Radner den Datenbestand übernehmen und das Projekt fortführen.

Der Umgang mit elektronischen Datenbeständen ist im Hinblick auf Nachhaltigkeit und Nachnutzbarkeit eine große Herausforderung für den gesamten Wissenschaftsbetrieb. Neben Fragen der Standardisierung von Kodierungen und Strukturierungen ist dabei ganz wesentlich die Frage, welche Institution(en) die Verantwortung für Bewahrung, Verfügbarkeit und Pflege dieser Art von Daten übernehmen sollen. Prädestiniert für diese Aufgabe erscheinen eigentlich die Bibliotheken, die seit Jahrhunderten für die Bewahrung von Wissen zuständig gewesen sind, und tatsächlich beschäftigen sich etliche Bibliotheken mit dieser Frage. Parallel entstehen andere Strukturen, die sich in ähnlicher Weise derselben Aufgabe widmen. Zu nennen wären hier z.B. sog. Repositorien wie etwa der Clarin-Verbund oder auch die D-Grid-Initiative, die es sich zur Aufgabe gemacht hat, "eine nachhaltige Grid-Infrastruktur in Deutschland aufbaut, um Informations- und Wissenstechnologien dezentral für die Wissenschaft nutzbar zu machen".

In gewisser Weise symptomatisch ist, dass ausgerechnet die im Wikipedia-Artikel "D-Grid" zitierten Portaladressen von D-Grid, http://www.d-grid.de/ und http://www.d-grid-ggmbh.de/, dort als "Offizielle Webpräsenz der D-Grid-Initiative" bezeichnet, nicht mehr erreichbar sind (Aufruf am 22.11.2016, vormittag):

d-grid_dead_link

Natürlich kann dergleichen aus technischen Gründen immer wieder passieren, und auch wir sind davor nicht gefeit. Dass allerdings auch eine Google-Suche nach "D-Grid" die offizielle Webpräsenz nicht (oder bestenfalls unter ferner liefen) zutage fördert, stimmt dann doch bedenklich. Schließlich handelt es sich um eine Initiative der Bundesrepublik Deutschland, die mit über 70 Millionen Euro gefördert worden ist (Quelle: https://de.wikipedia.org/wiki/D-Grid, 2016-11-22). Dieses Beispiel illustriert sehr schön, wie wichtig die dauerhafte institutionelle Verankerung einer verantwortlichen Institution in diesem Umfeld ist. Es ist allerdings, fairer Weise, darauf hinzuweisen, dass die Teilprojekte von D-Grid wie z.B. Textgrid nach wie vor im Internet erreichbar sind (https://textgrid.de/). Man kann nur hoffen, dass sie nicht in absehbarer Zeit ebenso verschwinden wie das Dach-Portal.

Die Lage ist unübersichtlich, und es ist schwer zu sagen, welche Institution sich für welche Art von Daten zuständig fühlt, wie die jeweiligen Perspektiven aussehen und, überhaupt, welche Lösung sich am Ende durchsetzen wird. Im Moment kann es daher nur darum gehen, eine geeignete Institution zu finden, die erstens bereit und dazu in der Lage ist, Daten über einen längeren Zeitraum sachgerechet zu speichern, verfügbar zu halten und zu pflegen, und die überdies über eine unbefristete Existenzperspektive besitzt. Diese Kriterien erfüllt z.B. die ITG. Sie ist eine zentrale wissenschaftliche Einrichtung der LMU, zuständig für die sechs geisteswissenschaftlichen Fakultäten, und ausgestattet mit derzeit, jeweils unbefristeten, vier wissenschaftlichen und drei technischen Personalstellen. Nicht zuletzt aus diesem Grund kann VerbaAlpina mit seiner Anbindung an die ITG seinen Partnern einen wichtigen Dienst leisten.

Funktionsbereich (3): Publikation

Wo immer Webtechnologie zum Einsatz kommt, verliert der Begriff der ‘Publikation’ seine Selbstverständlichkeit. Strenggenommen sind schon ein offener Quellcode ('open source') und die Datendokumentation im Internet Publikationsformen, ungeachtet der Tatsache, dass sie nicht immer dazugezählt werden. Darüber hinaus versteht sich VerbaAlpina aber auch als Instrument zur Veröffentlichung von projektbezogenen Texten. Dafür sind Im Wesentlichen drei Formate vorgesehen.

  • Theoretisch und methodologisch zentrale Begriffe und Probleme sowie Hinweise zur Funktionalität der Forschungsumgebung werden in meist konziser, gelegentlich auch etwas weiter ausholender Weise unter dem Reiter Methodologie abgelegt.
  • Ausführlichere analytische Untersuchungen von Projektergebnissen oder theoretische bzw. methodologische Diskussion können unter Projektpublikationen abgelegt werden.
  • Kommentare zu einzelnen sprachlichen Typen werden in der Kartenlegende durch einen ‚i‘-Button geöffnet; sie können dort auch sehr leicht durch Projektmitarbeiter oder Externe eingestellt werden (vgl. z.B. den Kommentar zum Basistyp *pinguia in der interaktiven Karte).

Da Webpublikationen im genannten Sinn leicht modifizierbar sind und vor allem im Fall von aktiven Projekten auch kontinuierlich modifiziert werden (sollten), ist es unerlässlich eine verlässliche Zitierweise zu ermöglichen, die in ihrer Verlässlichkeit dem Standard gedruckter Literatur entspricht. Der Projektinhalt von VerbaAlpina wird daher von Zeit zu Zeit in stabilen Zitierversionen 'eingefroren', die von der jeweils aktuellen und sich verändernden Arbeitsversion unterschieden werden müssen. Jedem Beitrag zur Projekt Methodologie ist daher mit einem entsprechenden Zitierhinweis versehen, der die jeweilig Version automatisch präzisiert; im folgenden Beispiel handelt es sich also um den Beitrag 'Typisierung' der Version 16/1:

zitierweise

Hinweis zur Zitierweise

Funktionsbereich (4): Datenerhebung durch Crowdsourcing

Außer durch die Datenbestände von Projektpartnern können die bereits angesprochenen Inkonsistenzen hinsichtlich der onomasiologischen oder geographischen Abdeckung auch durch das sog. Crowdsourcing ausgeglichen werden. Mit Crowdsourcing ist laut Wikipedia "die Auslagerung traditionell interner Teilaufgaben an eine Gruppe freiwilliger User, z. B. über das Internet" (Quelle) gemeint und wird dort als Anlehnung an den Begriff "Outsourcing" bezeichnet. Die Funktion des Crowdsourcing im Rahmen von VerbaAlpina ist jedoch vielleicht besser durch die Kernbedeutung des Wortes "source" beschrieben. Die Nutzer des Internets sollen als Daten-QUELLE dienen und ihre Kenntnisse der Dialekte des Alpenraums in den Datenbestand von VerbaAlpina einbringen.

In diesem Zusammenhang stellen sich die folgenden Probleme bzw. Herausforderungen:

  • Kontaktherstellung zu geeigneten "Crowdern" und evtl. Herstellung einer Bindung ans Projekt
    • Kontaktherstellung: Kontakt zu einschlägigen Institutionen im Alpenraum. Hier eine aktuelle Liste von Veranstaltungen, auf denen VerbaAlpina beworben werden könnte bzw. wird:

1) Bezirksbäuerinnentag (Südtiroler Bäuerinnenorganisation), 28.01.2017, Bozen
2) Alpsennenkurs (AVA, Alpwirtschaftlicher Verein im Allgäu e.V.), 26.04.2017, Immenstadt
3) Österreichische Almwirtschaftstagung (Steirischer Almwirtschaftsverein), 28.-30.06.2017, Krieglach (Dachorganisation: Almwirtschaft Österreich)
4) Deutscher Bauerntag (Deutscher Bauernverband), 28.-29.06.2017, Ort noch unbekannt
5) Käseolympiade (Tourismusverband Galtür), 23.09.2017, Galtür
6) Oberbayerischer Almbauerntag (AVO, Almwirtschaftlicher Verein Oberbayern), 7./8.10.2017, Samerberg

Adressenliste mit derzeit rund 4000 Einzelpersonen (darunter auch 150 Almen; Tabelle `crowdkontakte` in  VA_DB) und Institutionen im ganzen Alpenraum (A, D, F, I, SLO)

  • Flyer:flyercs_entwurf
  • Präsenz in den Medien (Zeitungen, Hörfunk)
  • Präsenz in sozialen Netzwerken (z.B. Facebook):

va_facebook

Ein- bis zweimal im Monat eine Meldung, z.B. eine spezielle, vielleicht nicht so bekannte Bezeichnung für ein bestimmtes Konzept. Evtl. auch interessante Abbildungen aus der Lebenswelt der Almen.

Bindung: Möglichkeit, sich zu registrieren (Motivation: Crowder kann sehen, wieviel er bislang beigetragen hat, auch im Vergleich zu anderen)

crowdsourcing_app_screenshot1

Die Crowdsourcing-App von VerbaAlpina

Die Crowdsourcing-App von VerbaAlpina

  • Steuerung der Datenerhebung (um onomasiologische und/oder geographische Lücken gezielt schließen zu können)
    • Priorisierung besonders schlecht belegter KONZEPTE bei der Auswahl, die dem "Crowder" präsentiert wird
    • Kartierung, die, bezogen auf definierte "Mittelräume" (sog. NUTS-3-Regionen), die Anzahl in VerbaAlpina bereits vorhandener Belege, durch Farbsättigung wiedergibt.
  • Attraktive Gestaltung der Schnittstelle und technische Zuverlässigkeit zur Steigerung der Akzeptanz: Möglichst einfach und übersichtlich; keine App, sondern Webseite mit "responsivem" Layout, die auch die komfortable Nutzung auf Smartphones erlaubt.
  • Orthographie und Typisierung
    • Fokus auf morphologischen Typen; Phonetik spielt keine bzw. untergeordnete Rolle
    • manuelle Typisierung dennoch nicht vermeidbar
  • Validierung der eingehobenen Daten
    • Prinzip: "Einmal ist keinmal, zweimal ist immer" – Wenn zwei von einander unabhängige Quellen (≙ Crowder) dasselbe behaupten, dann besteht Sicherheit; Visualisierungsmöglichkeit:relevanzindex
    • Einbindung von "Kompetenztests" nach folgendem Muster:

Unbenannt

  • Registrierung
  • Möglichkeit der Kommentierung durch registrierte Crowder und Wissenschaftler gleichermaßen

Funktionsbereich (5): virtuelles Forschungslabor

 


Bibliographie

  • AIS = Jaberg, Karl / Jud, Jakob (1928-1940): Sprach- und Sachatlas Italiens und der Südschweiz, Zofingen, vol. 1-7
  • ALD-II = Goebl, Hans (2012): Atlant linguistich dl ladin dolomitich y di dialec vejins, 2a pert, vol. 1-5, Editions de Linguistique et de Philologie. Link
  • ALEPO = Telmon, Tullio (2013): Atlante Linguistico ed Etnografico del Piemonte Occidentale III: Il mondo animale: I La Fauna: II caccia e pasca, Alessandria, vol. 3, Edizioni dell’Orso. Link
  • ALF = Gilliéron, Jules / Edmont, Edmond (1897-1900): l’Atlas linguistique de la France, Paris , Champion. Link
  • ALJA = Martin, Jean-Baptiste / Tuaillon, Gaston (1971, 1978, 1981): Atlas linguistique et ethnographique du Jura et des Alpes du nord, Paris, vol. 1, 3, 3a, Éd. du Centre National de la Recherche Scientifique
  • ALP = Bouvier, Jean-Claude (1975, 1979, 1986): Atlas linguistique et ethnographique de la Provence, Paris, vol. 1, 2, 3, Éd. du Centre National de la Recherche Scientifique
  • ALTR = Cordin, Patrizia (2005): L'Archivio lessicale dei dialetti trentini. Link
  • APV = Schüle, Ernest (1978): Atlas des patois valdôtains, Aoste, Departement de l'instruction publique. Link
  • Auer 2004 = Auer, Peter (2004): Sprache, Grenze, Raum, in: Zeitschrift für Sprachwissenschaft, vol. 23, 149-179. Link
  • CLAPie = Cugno, Federica / Rivoira, Matteo (2014): Culture e Lingue nelle Alpi del Piemonte. Link
  • FEW = Wartburg, Walter (1922-1967): Französisches etymologisches Wörterbuch. Eine Darstellung des galloromanischen Sprachschatzes , Basel, vol. 20, Zbinden. Link
  • SAO = Adalbert-Stifter-Institut des Landes Oberösterreich (Hrsg.) (1998ff.): Sprachatlas von Oberösterreich
  • SDS = Baumgartner, Heinrich/ Handschuh, Doris/ Hotzenköcherle, Rudolf (1962-2003): Sprachatlas der Deutschen Schweiz, Bern, vol. 1-9, Francke
  • Sottile 2002 = Sottile, Roberto (2002): Lessico dei pastori delle Madonie, Palermo, Centro di studi filologici e linguistici siciliani. Link
  • TSA = Klein, Karl Kurt/ Kühebacher, Egon/ Schmitt, Ludwig Erich (1965, 1969, 1971): Tirolischer Sprachatlas, vol. 1-3, Innsbruck, Tyrolia-Verl. [u.a.]
  • WBÖ = Eintrag nicht gefunden