Diese Präsentation wurde für den Workshop Neue Wege der romanischen Geolinguistik Vers. 2.0 (2021) verfasst (Schneefernerhaus, 4.-5.11.2021). Für die Einladung mitzumachen danken wir Joachim Steffen (Augsburg). Eine ausformulierte Version des Beitrags ist unter folgendem Link verfügbar: https://www.verba-alpina.gwi.uni-muenchen.de/?p=17197 |
Übersicht
I. Vorgeschichte: Drei Generationen von Sprachatlanten (🎙 TK)
II. Unsere 8 Prinzipien für die dritte Generation:
1. Strukturierte digitale Daten als Arbeitsgrundlage (🎙 SL)
2. Bezug der sprachlichen Daten zu außersprachlichen Normdaten (🎙 TK)
3. Forschungsdatenmanagement (FDM) (🎙 SL)
4. Adressierung und interaktive Einbindung eines breiten Publikums (🎙 TK)
5. Offene und dynamische Datenbestände (🎙 SL)
6. Virtuelle Kartographie auf georeferenzierter Grundlage (🎙 TK)
7. Möglicher Einbezug nicht sprachlicher Kontextdaten (🎙 SL)
8. Überwindung der Gattungsgrenzen (🎙 TK)
Appendix
- Ein Beispiel für Aggregation und Gattungsverschränkung (🎙 TK)
- Eckpunkte der technischen Umsetzung (🎙 SL)
- Die IT-Gruppe Geisteswissenschaften (🎙 SL)
Vorgeschichte: Drei Generationen von Sprachatlanten
Vorgestellte Prinzipien Ergebnis von 16 Jahren gemeinsamer Arbeit an vier gemeinsamen geolinguistischen Projekten:
- AsiCa – Atlante sintattico della Calabria
- ASD – Audioatlas Siebenbürgisch-Sächsischer Dialekte
- Metropolitalia
- VerbaAlpina
Unterschiede ...
- in der Modellierung räumlicher Variation;
- im Verständnis der Repräsentativität sprachlicher Daten vor dem Hintergrund der selektierten Informanten, Orte und Elizitationsverfahren;
- in der medialen Konzeption und Realisierung.
Drei Generationen von Sprachatlanten:
Erste Generation:
- eindimensional
- Dem Axiom des repräsentativen Einzelinformanten verpflichtet
- das prototypische Beispiel: der AIS
Zweite Generation:
- pluridimensional
- untersucht die räumliche Variation in mehreren Dimensionen; die Abhängigkeit der sprachlichen Daten vom Sprecher und von der Art der Elizitation rückt ins methodologische Zentrum der Arbeit.
- prototypisch: ADDU.
Dritte Generation:
- (idealerweise) Konzeption nach Art von zweiter Generation + konsequenter Einsatz von Webtechnologie
- sprachwissenschaftlicher und medialer Aspekt untrennbar miteinander verflochten: die Entstehung dieses Paradigmas nicht nur wissenschaftsintern zu sehen, sondern unter Voraussetzung des informationstechnischen Fortschritts (vgl. Wissenschaftskommunikation im Web)
- Beispiel: VerbaAlpina
- auch in der technischen Phase von Generation 3 teilweise nicht konsequente Nutzung der Möglichkeiten. Beispiel: Online-Atlas VIVALDI folgt konzeptionell der Generation 1
- Generation 3 verlangt vollständige und konsequente Digitalisierung
- unsere eigenen Projekte am Übergang von Generation 2 zu 3:
2. Generation | 3. Generation | |
AsiCa | → | Asica 2.0 |
ASD | ||
Metropolitalia | ||
VerbaAlpina | ||
geolinguistische Projekte der Autoren |
- VerbaAlpina illustriert prototypisch und exemplarisch Anforderungen und Umsetzung eines geolinguistischen Projekts der Generation 3.
II. Unsere 8 Prinzipien für die dritte Generation
1. Strukturierte digitale Daten als Arbeitsgrundlage
- Für die elektronische Datenanalyse und -visualisierung müssen die Daten digital und v. a. strukturiert sein
- Wir unterscheiden mehrere Digitalisierungsgrade:
Grad der Digitalisierung |
Etikett., Erweit., Verknüpf. | Daten- export |
|||
D3 | Tabelle | db csv |
strukturierter elektronischer Text | → | XML SQL CSV txt ... HTML PS Papier |
D2 ↑ | Textdatei | txt doc |
linearisierter elektronischer Text | ← praat | |
D1 ↑ | Scan | jpg | binärer Code | wav, mp3 | |
D0 ↑ | Papier | Schrift/Bild | Audio |
- Projekte der Generation 3 → Digitalisierungsgrad 3
- Datenerfassung: Daten ggf. digitalisieren und strukturieren bzw. re-strukturieren
- Strukturierung orientiert an projektspezifischen Kategorien (= Metadaten)
- Text: Digitalisierung durch Scannen und OCR
- Audio [bei VerbaAlpina bislang irrelevant]: ASR (automatic speech recognition; STT: speech to text) oder abtippen (Praat) ⇒ elektronischer Text (ASR bislang nur bei Standardsprache brauchbar)
- Beispiel für Datendigitalisierung und -strukturierung:
Daten analog | Daten digital | Daten digital und strukturiert | ||||||||
tˈeːʥɑ |
|
Beleg: AIS 1192 (LA CASCINA DI MONTAGNA), Ort 5 (Ems) (VA-Beleg S293; Discover@UB)
- Automatisierung variiert je nach Quelle/Vorlage und ist bestenfalls partiell möglich
- VerbaAlpina-Quellen liegen in unterschiedlichen Digitalisierungsgraden und Strukturen vor. Beispiele:
strukturiert | ASLEF-Tafeln | VerbaAlpina |
nicht/teil- strukturiert | VALTS | Idiotikon, WBOe |
analog | digital |
- Gegebene Strukturierungen verlangen häufig eine Umstrukturierung: Struktur A ⇒ Struktur B.
- Je nach Strukturierungs- und Digitalisierungsgrad gestaltet sich die Datenerfassung mehr oder weniger aufwendig.
- Optimal für Datenaustausch, Vernetzung und Nachnutzung: sog. APIs.
- APIs in lexikographischen online-Ressourcen bislang selten
- Beispiel für API: "Digitales Wörterbuch der Deutschen Sprache" (DWDS; API: https://www.dwds.de/d/api) (für VerbaAlpina von nachrangiger Bedeutung).
- VerbaAlpina-API: https://www.verba-alpina.gwi.uni-muenchen.de/?page_id=8844&db=211.
Einige Beispiele für VA-Quellen
- ASLEF-Tafeln
- OCR möglich
- transparente Strukturierung
- ⇒ teilautomatische Erfassung möglich, aber nicht realisiert wegen hohem Aufwand – manuell schnelle
- Vorarlberger Sprachatlas mit Einschluss des Fürstentums Liechtenstein (VALTS)
- Georeferenzierung durch kartographische Abbildung der Daten
- Unterschiedliche Informationskodierung (Symbole, Farbe)
- Vermischung von Belegen unterschiedlicher Kategorien (Typen [z. B. Tieie], Einzelbelege)
- Dokumentation unterschiedlicher Konzepte (SENNHÜTTE, SENNEREIRAUM [= Teil der Hütte], KÄSEKELLER, PRIMITIVE SENNHÜTTE AUF MAIENSÄSSEN)
- ⇒ Automatisierte Erfassung unmöglich
Beispiel für ein Wörterbuch: Schweizerdeutsches Idiotikon
- Verteilung von VerbaAlpina-relevanten Entitäten im Fließtext
- Automatisierung auch hier de facto nicht möglich
- ⇒ manuelle Erfassung
Ein positives Beispiel ist das Bibl:WBOe.
- sehr altes Projekt (Handzettel)
- konsequente Digitalisierung und Weiterentwicklung
- XML-Dateien (auch als Backend für das "Lexikalische Informationssystem Österreich", LIÖ (s. https://www.oeaw.ac.at/de/acdh/sprachwissenschaft/projekte/wboe/materialbasis
- Kritikpunkt 1: XML-Dateien anscheinend nicht öffentlich zugänglich
- Kritikpunkt 2: XML-Format nach Einschätzung von VerbaAlpina problematisch (VA bevorzugt das relationale Datenformat = Tabellen; Export im XML-Format jedoch möglich; Beispiel: VA-Einträge zum Konzept C1, SENNHÜTTE der VA-Version 211)
VerbaAlpina-Tools zur Digitalisierung und strukturierten Datenerfassung
- Transkriptionstool (Link)
- gesteuerte Datenerfassung: Tool gibt vor, welche Daten zu erfassen sind
- Metadaten werden z. T. (Quelle, Erhebungspunkt/Informantennummer) automatisch angelegt
- ⇒ Förderung von systematischem Vorgehen
- ⇒ Reduktion von Fehlern
- Transkription im sog. Betacode (ohne Sonderzeichen ⇒ Standardtastatur nutzbar)
- ⇒ keine Spezialkenntnisse für Transkription nötig
- Durchführung durch Hilfskräfte
Typisierungstool (Link)
- Zuweisung von aus den Quellen erfassten Sprachdaten zu lexikalischen Typen
- systematisches Vorgehen
- Verwaltung (Neuanlage, Modifizierung) von lexikalischen Typen
- Typisierung durch graduierte Sprachwissenschaftler
Georeferenzierungen
- essentiell für VerbaAlpina – Sprachdaten OHNE Georeferenz nutzlos
- Referenzmatrix von VerbaAlpina: politische Gemeinden im Alpenraum ...
- ... mit Stand von etwa 2015
- Matrix wird NICHT aktualisiert (Auflösung, Neuschaffung von Gemeinden bleiben unberücksichtigt)
- Georeferenzen sind im Koordinatenbezugssystem WGS84 gespeichert
- Für jede Gemeinde: Polygondaten der Gemeindegrenzen UND Punktkoordinaten des geometrischen Mittelpunkts der Gemeindeflächen
- Grundlage für Visualisierung auf interaktiver online-Karte
- Individuelle, gemeindunabhängige Punktreferenzierungen sind möglich (fast metergenau) → Anreicherung durch Toponyme möglich
- Quellen geben Georeferenzen in unterschiedlicher Weise und Genauigkeit an.
- ⇒ Individuelle Abbildung auf VA-Referenzmatrix nötig
- Beispiele für Angabe von Georeferenzen in einigen VA-Quellen:
- Glossaire des patois de la Suisse romande (GPSR), der
- Vocabolario dei dialetti della Svizzera italiana (VSI)
- Dicziunari Rumantsch Grischun (DRG)
- Visualisierung der Erhebungsnetze auf der VA-Karte:
- Problematisch in dieser Hinsicht: Idiotikon: manche Ortsabkürzungen nicht eindeutig auflösbar, manche Gemeinden nicht identifizierbar, die Gemeindezuordnung etlicher Orte hat sich durch politische Reorganisation verändert usw.
- Ein Blick in die VA-Datenbank (Partner-Schnittstelle vap_de; Link [nur für Partner])
2. Bezug der sprachlichen Daten zu außersprachlichen Normdaten
- sprachliche Daten sind stets auf die außersprachliche Wirklichkeit bezogen
- Butter ⇒ BUTTER
- Dadurch werden Semasiologie und Onomasiologie scharf getrennt. – Vgl. die Konzeptsuche:
- Einbindung der VerbaAlpina-Daten in das Semantic Web → eine Verknüpfung mit Normdaten
- Verbreitete Normdatensysteme: Wikidata und GND
- BUTTER: VA-ID C156 = Wikidata-QID Q34172 = GND-ID 4009236-7 (man beachte die Einbindung von Wikidata in die GND!)
- Wikidata: ein Crowd-Projekt – jeder kann mitmachen ⇒ Erweiterungen möglich (https://www.wikidata.org/wiki/Q66817486)
- Normdatensystem für Geodaten: geonames.org – Beispiel Garmisch-Partenkirchen: https://www.geonames.org/2922530/garmisch-partenkirchen.html
- Normdaten: in den Belegfenster der interaktiven Karte von VerbaAlpina:
- Integration der VerbaAlpina-Daten in das Semantic Web → Export als RDF-Triple (in Vorbereitung)
- Neuerdings: Einbindung auch *sprachlicher* Normdaten: L-IDs des Wikidata-Projekts Beispiel (Tooltip öffnet sich bei Mouseover über Morphtypen; online-Version):
- in Planung: Export der von VA gesammelten Sprachdaten in die Lexikographie-Sektion von Wikidata (Beispiel für eine SPARQL-Abfrage: Lexeme, die eine Farbe bezeichnen)
3. Forschungsdatenmanagement (FDM)
- Volldigitalisierung nach Generation 3 verlangt Konzept für langfristige Bewahrung
- "Forschungsdatenmanagement" als Label
- Orientierung an den FAIR-Kriterien, letztlich forschungsethische Leitkriterien:
- findable
- accessible
- interoperable
- reusable
- vgl. Lücke, Krefeld/Lücke 2020 und Krefeld 2018 g
- Konsequenz: Einhaltung der Open Access und Open Source-Richtlinien und Verzicht auf die Entwicklung und den Einsatz proprietärer Werkzeuge ⇒ CC BY-SA Lizenzen
- Kontakt zu FDM-Institutionen:
- UB der LMU (Bibliotheken als idealer Partner: unbefristet existent, kompetent, verlässlich)
- FDM-Projekt GeRDI (Motto: "Glanz und Elend der Projekte")
- FDM-Projekt eHumanities – interdisziplinär
- Workflow für Datenexport zur UB fertig
- VerbaAlpina-Daten abrufbar über Discover (bislang nur Versionen 191 und 192):
- VerbaAlpina gliedert sich in mehrere Teile: Kerndatenbestand (= Sprachdaten), diskursive und analytische Texte, Mediendateien, Software (Code)
- Problematisch vor allem: Webportal (Betrieb nach Projektende prekär)
4. Adressierung und interaktive Einbindung eines breiten Publikums (Crowdsourcing)
- gegenüber Buchpublikation verändertes Publikum (Buch: Fachwelt; Web: Fachwelt, Laien, u. a. Sprechergemeinschaften)
- Erläuterungen für Laien z. T. durch Informationsfenster, die sich öffnen, wenn der Mauspfeil darauf bewegt wird (so genannte Tooltips). Beispiel:
- Andere Voraussetzung: Webpublikation nie abgeschlossen ⇒ Interaktion und Aktualisierung
mehrfache aktive Einbindung der Nutzer:
- Jeder (Experten und Laien) kann beitragen (vgl. https://www.verba-alpina.gwi.uni-muenchen.de/en/?page_id=1741):
- sprachliche Formen
- fehlende Konzepte
- Nutzer, die Belege/Konzepte beisteuern, können sich registrieren und so für das Projekt erreichbar bleiben; das ist nützlich für eventuelle Rückfragen. #wieviel % machen das?#
- Jeder Nutzer kann interaktiv durch Kombination beliebiger Inhalte synoptische Karten generieren, fixieren und zur Veröffentlichung vorschlagen. Diese Vorschläge werden jedoch nicht automatisch allgemein zu Verfügung gestellt, sondern vorher durch die Projektverantwortlichen geprüft.
- direkte Kontaktaufnahme: über die Social Media-Auftritte des Projekts und über E-Mail-Adressen (vgl. Home).
- Wissenschaftliche Partnerprojekte können beliebig viele relevante Daten liefern und in einer eigenen Datenbank, die Teil der Projektarchitektur ist, hosten.
5. Offene und dynamische Datenbestände
- VA-Daten von Anfang an öffentlich zugänglich
- Projektfortschritt allgemein sichtbar (Livedaten)
- Offene Lizenz: CC BY-SA
- Nachnutzung: Atlas pan-picard informatisé (Link)
- Veränderung des Datenbestands problematisch für empirische Verlässlichkeit
- Lösung: Versionierung zweimal jährlich (Jahresmitte und Jahresende)
- Unterscheidung zwischen Arbeitsdatenbank (Suffix "xxx") und "eingefrorenen" Versionen (Im Suffix Angabe von Jahr und Version innerhalb des Jahres. ⇒ 191, 192)
- Technische Umsetzung: Erzeugung einer Kopie der Arbeitsversion der Datenbank mit entsprechendem Suffix; Inhalte der versionierten Fassungen bleiben unverändert.
- Wechsel zwischen den verschiedenen Versionen auf dem Webportal von VerbaAlpina:
- Versionsnummer: Teil der meisten URLs, die auf VerbaAlpina-Ressourcen verweisen
Beispiel: die URL für den Morpholexikalischen Typ L2599/tegia (roa f.) im LexikonAlpinum in der VA-Version 211:
- Übersicht über sämtliche bislang vorhandenen Versionen auf der Startseite von VerbaAlpina unter dem Button "Timeline". Ein Klick auf eines der Versionsbilder öffnet eine Statistik, die den Datenzuwachs in der jeweiligen Version anzeigt:
- Timeline-Übersicht: künftig noch weitere Informationen zu Veränderungen gegenüber den Vorgängerversionen; vor allem zu nicht quantifizierbaren Errungenschaften wie etwa die Entwicklung neuer Tools oder Veränderungen in Design oder Usability
6. Virtuelle Kartographie auf georeferenzierter Grundlage
- Konsequente Nutzung von Webtechnologie ⇒ Verzicht auf graphische Grundkarte
- Stattdessen: Auswahl verschiedener georeferenzierter Basiskarten von Tile-Servern in einem WebGIS
- ⇒ Karten mit/ohne Relief, mit/ohne Beschriftung, Karte/Satellitenbild usw.:
- verschiedene geographische Referenzeinheiten:
- politische Gemeinde (Primärreferenz)
- NUTS 3-Regionen (NUTS: Nomenclature des unités territoriales statistiques):
- Nationalstaaten
- Sprachgebiete (Sprachfamilien)
- quantifizierende Darstellungen durch sog. heat maps. Beispiel: Menge der Crowder, d.h. der aktiven Nutzer, die uns Belege geliefert haben (1688 Personen, am 13.10.2021, 9:40) mit Bezug auf die Gemeinden und die von der Europäischen Kommission definierten NUTS 3-Regionen
- Das Beispiel zeigt im Übrigen, dass jederzeit aktuelle Datenbestände visualisiert werden können.
7. Möglicher Einbezug nicht sprachlicher Kontextdaten
- demographische und historische Informationen über den Belegort: unerlässlich für die Interpretation geolinguistischer Konstellationen
- daher: Verknüpfung aller 5771 Gemeindenamen des Alpenraums mit den jeweiligen Einträgen im Dienst geonames.org
- Beispiel der Gemeinde, auf deren Territorium wir uns befinden, Garmisch-Partenkirchen → vielfältige topographische, administrative und enzyklopädische (Wikipedia-Logo) Informationen:
- relevant: sprachliche Stratigraphie des Alpenraums
- ⇒ Einbindung historischer Daten
- Frage: Existenz eines lateinisch-romanischen Substrats?
- Beispiel Garmisch-Partenkirchen:
- Existenz lateinischer Inschriften?
- antike Erwähnung des Ortsnamens im Itinerarium Antonini bzw. auf der darauf basierenden Tabula Peutingeriana:
- Nicht-sprachliche Kontextdaten: zusammen mit den Sprachdaten in der zentralen VerbaAlpina-Datenbank in der Tabelle "Orte":
- aktuell etwa 165000 Einträge
- mehr als 250 MB.
- 47 Kategorien, z. B.:
- Tabula Peutingeriana
- Kloester (1317);
- langobardische_graeberfelder (120);
- Walsergemeinden (77);
- Raetische Inschriften (36);
- ...
8. Überwindung der Gattungsgrenzen
- die Ergebnisse geolinguistischer Forschung traditionelle in unterschiedlichen Gattungen veröffentlicht (Ortsmonographie, Atlas, Wörterbuch, Korpus)
- jeweils spezifische Zwecke
- komplementär
- im Rahmen der digitalen Medien: kategorische Trennung sinnlos.
- Komplementarität der Gattungen → Verflechtung im Webauftritt von VerbaAlpina
- unter dem Reiter Methodologie: theoretische Erörterungen zentraler linguistischer und informationstechnischer Begriffe
- Verschränkung mit mit den beiden wichtigsten Funktionalitäten, der interaktiven Karte und dem Lexicon Alpinum
- symbiotische Anlage dieser beiden Komponenten
- Lexikoneintrag → Visualisierung auf einer Karte (durch einen Klick)
- Karte → korrespondierender Lexicon-Eintrag (durch Klick)
- im diskursivem Text / aus der interaktiven Karte heraus: direkte Abfrage des Datenkorpus möglich
- auch für Nutzer möglich, auf der interaktiven Karte individuelle Datenbankabfragen über die Schaltfläche 'SQL Query' abzuschicken und die Ergebnisse so in kartographischer Darstellung einzusehen
- die Nutzung der SQL-Funktion → Kenntnisse in der Abfragesprache SQL.
- Informationen über Struktur und Inhalt der abfragbaren Tabelle: Fragezeichen neben dem Schlüsselwort "WHERE"
- Detaillierte Informationen zu Datenbankfeldern und deren Inhalten: blauer Link am unteren Rand des Tooltipps
- Beispiel: Slawische Belege mit dem Basistyp "butyru(m)":
Appendix
Ein Beispiel für Aggregation und Gattungsverschränkung
- detaillierteres Beispiel für Aggregation unterschiedlicher Quellen(typen) und Gattungsverschränkung
- Artikel chaschöl des bündnerromanischen Referenzwörterbuchs DRG (Link)
- die dort genannten Formen → auf der Karte chaschöl
- im Verbund mit denjenigen aus anderen Quellen, vgl. stellvertretend die Markierung der Orte des VSI
- regionale Besonderheit des lexikalischen Typs (Tessin, Graubünden, Dolomiten) → im kartographischen Kontext aller anderen Bezeichnungen von KÄSE (vgl. die Karte KÄSE)
Eckpunkte der technischen Umsetzung
- Reine Webtechnologie
- Portal: https://www.verba-alpina.gwi.uni-muenchen.de/ (DOI:https://dx.doi.org/10.5282/verba-alpina; online seit 2015)
- Full stack Entwicklung
- Frontend: WordPress
- Backend: MySQL-Datenbank
- Staff: 2 Informatiker (65% Zeitanteil), zeitweise unterstützt durch Hilfskraft
- Interaktive Karte:
- JS-Bibliotheken Leaflet, Pixi, WebGL
- sehr leistungsfähig (nötig bei zahlreichen Kartensymbolen und Grenzverläufen! Demo)
- detaillierte Beschreibung
- Hosting auf den Servern der IT-Gruppe Geisteswissenschaften (ITG):
- Professionelle IT-Umgebung
- hohe Verfügbarkeit der Webkomponenten (Web- und DB-Server)
- Betrieb der Website auch über Projektende hinaus
Die IT-Gruppe Geisteswissenschaften (ITG)
- seit 2000
- unbefristete Existenzperspektive
- zuständig für die 6 geisteswissenschaftlichen Fakultäten der LMU
- Aufgabengebiete:
- IT-Infrastruktur
- Forschung & Lehre digital
- Forschungsdatenmanagement (FDM)
- Personal:
- dauerhaft: 5 Wissenschaftler, 2 Techniker;
- variabel: drittmittelfinanzierte Projektmitarbeiter
- Technische und konzeptionelle Unterstützung von DH-Projekten von Anbeginn (56 Stand 11/2021; Liste)
Bibliographie
- ADDU = Thun, Harald / Elizaincín, Adolfo (2000-): Atlas lingüístico diatópico y diastrático del Uruguay, Kiel, Westensee
- AIS = Jaberg, Karl / Jud, Jakob (1928-1940): Sprach- und Sachatlas Italiens und der Südschweiz, Zofingen, vol. 1-7
- ASD = Krefeld, Thomas / Lücke, Stephan / Mages, Emma (2016): Audioatlas Siebenbürgisch-Sächsischer Dialekte , München, Ludwig-Maximilians-Universität. Link
- ASLEF = Pellegrini, Giovan Battista (1974-1986): Atlante storico-linguistico-etnografico friulano, Padova, vol. 1-6
- AsiCa = Krefeld, Thomas / Lücke, Stephan (2006-2017): Atlante sintattico della Calabria, München. Link
- Asica 2.0 = Krefeld, Thomas / Lücke, Stephan (2019): Atlante sintattico della Calabria. Rielaborato tecnicamenta da Veronika Gacia e Tobias Englmeier, München. Link
- DRG = De Planta, Robert/ Melcher, Florian/ Pult, Chasper/ Giger, Felix (1938ff.): Dicziunari Rumantsch grischun, Chur, Inst. dal Dicziunari Rumantsch Grischun. Link
- DWDS = Berlin-Brandenburgische Akademie der Wissenschaften (Hrsg.) (2004-): Das Digitale Wörterbuch der deutschen Sprache, Berlin. Link
- GPSR = Gauchat, Louis (Hrsg.) (1924ff.): Glossaire des patois de la Suisse romande, Genève [u.a.], Droz [u.a.]
- Idiotikon = (1881 ff.): Schweizerisches Idiotikon. Schweizerdeutsches Wörterbuch, Basel. Link
- Krefeld 2018 g = Krefeld, Thomas (2018): I principi FAIR nel progetto VerbaAlpina, ossia il trasferimento della geolinguistica alle Digital Humanities. Link
- Krefeld/Lücke 2020 = Krefeld, Thomas / Lücke, Stephan (2020): 54 Monate VerbaAlpina – auf dem Weg zur FAIRness, in: Ladinia, vol. XLIII, 139-156. Link
- Metropolitalia = Krefeld, Thomas / Lücke, Stephan / Bry, François (2010-2013): Metropolitalia. Social Language Tagging, München. Link
- VALTS = Gabriel, Eugen (1985-2004): Vorarlberger Sprachatlas mit Einschluss des Fürstentums Liechtenstein, Westtirols und des Allgäus , vol. 1-5, Bregenz, vol. 1-5, Vorarlberger Landesbibliothek
- VIVALDI = Kattenbusch, Dieter/ Tosques, Fabio (1998-2016): VIVALDI: Vivaio Acustico delle Lingue e dei Dialetti d'Italia. Aktustischer Sprachatlas der Dialekte und Minderheitensprachen Italiens., Berlin, Humboldt-Universität Berlin, Institut für Romanistik. Link
- VSI = Sganzini, Silvio (1952ff): Vocabolario dei dialetti della Svizzera italiana, Lugano, Tipografia la Commerciale
- VerbaAlpina = Krefeld, Thomas / Lücke, Stephan (2014-): VerbaAlpina. Der alpine Kulturraum im Spiegel seiner Mehrsprachigkeit, München. Link
- WBOe = Bauer, Werner/ Kranzmayer, Eberhard. Institut für österreichische Dialekt- und Namenlexika (Hrsg.) (1970–): Wörterbuch der bairischen Mundarten in Österreich, Wien, Verl. der Österr. Akad. der Wiss.