Beitrag zu den Tandem-Talks auf den e-Science-Tagen in Heidelberg 2019
Stephan Lücke, Martin Spenger
Teil 1: Die Perspektive des Projekts (Stephan Lücke)
Vorbemerkung
Das Projekt VerbaAlpina betreibt intensive Methodenreflexion. Die meisten der im Folgenden nur kurz angeschnittenen Themen werden in der Rubrik "Methodologie" des Projektportals vertieft abgehandelt. Die nachfolgende Präsentation ist punktuell auf Einträge in dieser Methodologie verlinkt.
Das Projekt VerbaAlpina (VA)
- Von der DFG-gefördertes Langfristvorhaben mit Perspektive bis 2025
- Derzeit zweite Förderphase (2017-2020)
- interdisziplinäres DH-Projekt (Sprachwissenschaften, Informationstechnologie, [Ethnographie, Geschichte ...])
- Leitung: Thomas Krefeld (Sprachwiss.), Stephan Lücke (IT)
- Personalausstattung:
- 2 Sprachwissenschaftler (Romanistik, Germanistik),
- 2 Informatiker,
- eine Koordinatorin,
- Hilfskräfte
- Thema: Sprache und Kultur im Alpenraum
- Im Zentrum steht die Frage: Welche Sachen werden an welchen Orten wie bezeichnet?
- Beispiel: Die Sache (das "Konzept") BUTTER wird in der Schweiz als "Anke" bezeichnet, in Bayern als "Butter", in Frankreich als "beurre", in Italien als "burro". Phonetische Variationen werden nicht berücksichtigt, es geht vor allem um morpholexikalische Typen. Beschränkung auf ausgewählte "Konzeptdomänen" (Almwirtschaft, Natur und Umwelt, Tourismus)
- Sammlung der Daten für den gesamten Alpenraum (= Gebiet der sog. Alpenkonvention). Quelle sind im wesentlichen sog. Sprachatlanten und Wörterbücher, die über die geographische Herkunft der Bezeichnungen Auskunft geben.
- VA stellt nach Möglichkeit alle Inhalte unter der Lizenz CC BY-SA zur Verfügung – auch diese Präsentation
- VA hat Kooperationsabkommen mit zahlreichen Partnern
Besonderheiten von VA
- VA ist konsequent und ausschließlich "digital" (WordPress; php, js, sql)
- Strukturierte elektronische Erfassung des Materials aus Sprachatlanten und Wörterbüchern
- Eintragung in eine relationale Datenbank (MySQL)
- VA hält Trennung zwischen "Forschungsdaten" und deren Interpretation für problematisch ⇒ Gesamtdatenbestand wird als "Forschungsdaten" betrachtet (inkl. entwickelter Programmcode ⇒ WordPress-Plugins)
- Multifunktionalität des Projektportals: Werkzeug — Dokumentation — Publikation — Kommunikation
- Nutzung von Crowdsourcing (zum Ausgleich von Inkonsistenzen im Datenmaterial und für Dokumentation von Veränderungen gegenüber früher [Diachronie])
Institutionelle Einbindung (Organisationsstruktur): VA – ITG – UB
- VA angebunden an die IT-Gruppe Geisteswissenschaften (ITG) der LMU (Projektinformatiker dort angestellt)
- ITG: DH-Kompetenzzentrum für alle geisteswissenschaftlichen Fakultäten der LMU; zuständig für IT-Infrastruktur — Forschung & Lehre digital — Forschungsdatenmanagement
- Institutioneller Verbund *vor Ort*: Projekt (VA) — Kompetenzentrum (ITG) — Datenzentrum (UB) ... enger Kontakt mit regelmäßigen Treffen ⇒ hohes Maß an Effizienz; nach Ansicht von VA mit Modellcharakter!!
- VA als Pilotprojekt eingebunden in das Projekt eHumanities – interdisziplinär (Förderung durch das Bayerische Kultusministerium seit 2018 bis Ende 2019)
- VA-Daten gelangen über UB auch an GeRDI (Aggregator)
FDM: Mehrwert der Kooperation mit der UB der LMU für VA
- Problem bzw. Anspruch: Erfüllung der FAIR-Kriterien – Was tun mit den Projektdaten?
- Perspektive: Bisher keine Standardverfahren
- Drittmittelgeförderte Repositoriumslösungen problematisch wegen unsicherer Zukunft
- Daher zunächst: Strategie der Verteilung der Daten auf verschiedene Repositorien (u.a. Clarin-D)
- ... UND: Open Data LMU der UB
- Bibliotheken Idealpartner, weil ...:
- Existenz dauerhaft gesichert
- kompetentes Personal
- traditionell mit Wissensbewahrung beauftragt ⇒ große Erfahrung
- flächendeckend vorhanden
- UB übernimmt VA-Daten und reichert sie um Metadaten an (zweistufig: generisch ⇒ Datacite; fachspezifisch [in Entwicklung])
- UB sorgt für Beschaffung feingranularer DOIs, Option: UB-eigene persistente Adressen! Feine Granularität u.a. wichtig für Interoperabilität!
- ungelöstes Problem "lebendes System": dauerhafter Betrieb des virtuellen Projektportals (versuchsweise: Betrieb auf Docker-Image auf UB-Server)
Teil 2: Open Data (Martin Spenger)
Powerpoint-Präsentatiion (pdf-Version)