Vortrag, gehalten von Thomas Krefeld und Stephan Lücke am 19.05.2021 im Rahmen der von Prof. Dr. Christine Haug, Dr. Marcel Schellong im Sommersemester 2021 veranstalteten "Vortragsreihe Forschungspotential der Digital Humanities in der Buch- und Literaturwissenschaft" (Programm)
0. Vorab
- Im Sinne der FAIR-Prinzipien Verzicht auf Folienpräsentation
- Stattdessen nachhaltiger online-Beitrag
- DOI: http://dx.doi.org/10.5282/verba-alpina?urlappend=/%3fp=14940%26db=xxx
1. Übersicht
4. Theorie der Forschungskommunikation in virtueller Umgebung
5. Herausforderungen der Virtualität/Digitalität für die Forschungskommunikation
2. VerbaAlpina
- "Lexikographisches" Projekt mit Focus auf dem Alpenraum
- Wörter aus dem Umfeld typisch alpiner Konzeptdomänen (Alm- und Milchwirtschaft, Fauna, Flora, Ökologie, Tourismus); Konzeption in der Tradition der romanistischen Ethnolinguistik)
- sprachgrenzüberschreitend im germanischen, romanischen und slawischen Sprachraum; (vgl. Sprachfamilien im Alpenraum und Karte)
- Berücksichtigung auch und vor allem dialektaler Ausdrücke
- Quellen: in der Hauptsache Sprachatlanten und Wörterbücher
- Ergänzung/Abrundung/Ausgleich durch Crowdsourcing
- Wesentliche Voraussetzung: Georeferenzierung (geographische Verortung von Einzelbelegen)
- Dadurch: Dokumentation von Verbreitungsarealen bestimmter Lexeme (u. a. interessant: Verbreitungsareale, die die Grenzen von Sprachfamilien überschreiten, z. B.: lat. excŏcta, sowohl im germ., rom. als auch slaw. Sprachraum)
- Visualisierung durch eine interaktive Karte (vgl. Karte excŏcta)
- Bidirektionale Perspektive:
- vom Wort zur Sache (terminologisch: Bezeichnung ⇒ Konzept)
- von der Sache zum Wort (terminologisch: Konzept ⇒ Bezeichnung)
- In diesem Sinn auch Überwindung der Gattungen (Lexika: "Vom Wort zur Sache", Sprachatlanten: "Von der Sache zum Wort")
- Förderung durch die DFG als "Langfristvorhaben" seit 2014 (derzeit Phase 3, bis 2023)
- Personelle Ausstattung: 2 Sprachwissenschaftler, 2 Informatiker, Hilfskräfte (Team)
- VA in sprachwissenschaftlicher Hinsicht: interlinguale Geolinguistik (zutreffender als ‘Dialektologie’)
3. Technische Umsetzung
- VA ist vollständig digital konzipiert (konsequenter Verzicht auf Papier)
- Ausschließlich Einsatz von Web-Technologie (daher u. a. kein Powerpoint ...)
- grundsätzlich keine proprietäre/kostenpflichtige Software, nur Open Source
- Content Management System (CMS): WordPress
- Backend: MySQL-Datenbank
- Entwicklung zahlreicher "Tools" durch die Projektinformatiker, z. B.:
- Interaktive online-Karte
- LexikonAlpinum
- Transkriptionstool
- Typisierungstool
- Crowdsourcingtool (Link)
- ...
- Multifunktionales Webportal:
- Arbeitsinstrument für Erzeugung von Inhalten (Datensammlung, Datenverarbeitung und -aufbereitung)
- Publikation von Inhalten
- Kommunikation (z. B. Sitzungsprotokolle)
4. Theorie der Forschungskommunikation in virtueller Umgebung1
- Wesentlicher Teil des Selbstverständnisses: Selbstreflexion ⇒ Rubrik Methodologie (Verwendung im vorliegenden Beitrag)
- Sprachwissenschaft und Informationstechnik nicht einfach additiv, sondern im aristotelischen Sinn mehr als die Summe der beiden Teile ⇒ Einsatz der Informationstechnik verändert Sprachwissenschaft substantiell (Wesen der DH ganz generell)
- Die durch die technischen Möglichkeiten veränderten Rahmenbedingungen verlangen, die traditionellen Formen der Wissenschaftskommunikation2 zu überdenken und diese an den neuen Möglichkeiten auszurichten.
- Entsprechende Reflexion und exemplarische Umsetzung ist eines der Ziele von VA
Traditionell mit dem Medium des Buchdrucks
- Drei Phasen:
- Forscher sucht und sammelt Informationen (= Rohdaten von Quellen, Informanten)
- Forscher verarbeitet und *selektiert* (theoriegebunden) Informationen
- Forscher publiziert die Ergebnisse auf Papier (= öffentlicher medialer Diskurs)
- ausschließlich 'finale' Relevanz des Publikationsmediums
- teilweise Fremdbestimmung des AUTORs durch die VERLAGe (z.B. Sprachwahl)
- extrem eingeschränkte Zugänglichkeit des Produkts (in Bibliotheksregalen)
- feste Bindung der kommunikativen Rollen (AUTOR – QUELLE – LESER) an Personen
Digital und im Web (2.0)
- Web ermöglicht einen Neustart des öffentlichen medialen Diskurses ('auf Null')
- genuin digital ('0' | '1')
Publikation
- permanente Relevanz von Publikationsmedien während des gesamten Forschungsprozesses
- substantielle Änderung des Publikationsbegriff
- nicht nur Text: alles im gestrichelten Oval von Graphik 3 ist publikationsfähig
- Live-Daten können publiziert werden (Link)
- Hoheit | Kontrolle in der Kompetenz des Projekts (100% selbstbestimmt)
- substantielle Änderung des Publikationsbegriff
Transparenz der Daten
- Relation zwischen den publizierten Informationen einsehbar
- Beispiel Transkription: Original – Beta – IPA
- im Fall von VA: LESER → Datenbankabfrage der Primärdaten
Wechsel der kommunikativen Rollen
im Fall von VA:
- LESER → QUELLE (CS-Reaktion auf VA-Öffentlichkeitsarbeit)
- QUELLE → AUTOR
- durch Eingabe neuer KONZEPTE, Button 'Begriffe vorschlagen', Link):
-
- Definition und Fixierung eigener Karten
5. Herausforderungen der Virtualität/Digitalität für die Forschungskommunikation
- Vorteile des gedruckten Buchs:
- dauerhaft
- unveränderbar
- stabil zitierbar ⇒ Titel, Seite/Spalte
- institutionell abgesichert ⇒ Bibliotheken
- Vorteile von Digitalität/Virtualität:
- (theoretisch) grenzenlose Verfügbarkeit
- elektronische Verknüpfbarkeit von Inhalten
- vergleichsweise geringe Kosten
- Erleichterung von Zusammenarbeit (Erzeugung von Inhalten durch große Anzahl von Beteiligten/Autoren)
- Multimedialität (Text, Ton, Bild – auch in 3D)
- Erleichterung des bidirektionalen Austausches Autor ⇔ Leser (etwa durch Kommentarfunktion)
- Unabhängigkeit von Verlagen
- ...
- Wesentliche Nachteile der Digitalität/Virtualität:
- prekäre Stabilität ("Flüchtigkeit"; dabei geht es um Änderungen im Detail genauso wie um vollständiges Verschwinden)
- Fehlen eines verbindlichen Referenzsystems (Ersatz für Buchseiten)
- bislang noch nicht etablierte Strukturen bzw. Zuständigkeiten
ZIEL: Nutzung der Vorteile der Digitalität *ohne* Verlust der Vorteile des Buches
Antworten von VA
Prekäre Stabilität
- Versionierung: Jeweils zu Jahresmitte und -ende "Einfrieren" des Datenbestands
- Technisch: Anfertigung einer Kopie der Projektdatenbank:
-
- Arbeitsversion: XXX (bedingt zitierfähig; Stabilität der Inhalte nicht garantiert)
- Wechsel in Zitierversionen ⇒ Inhalte garantiert stabil
- In zitierfähigen Versionen von VA: Einblendung von Zitierlinks:
Adressierbarkeit
Feingranulare URLs/DOIs
- Für Kommunikation bedeutsam/nützlich/unverzichtbar
- Ersatz für Buchseiten: URLs/DOIs
- Kernvoraussetzung für Nützlichkeit: Feine Datengranulierung
- Beispiele in VA:
- URLs für Einträge in der Methodologie (z. B.: https://doi.org/10.5282/verba-alpina?urlappend=%3Fpage_id%3D493%26db%3D202%26letter%3DA%23138)
- URLs für Einträge im Lexicon Alpinum (z. B.: https://doi.org/10.5282/verba-alpina?urlappend=%3Fpage_id%3D12180%26db%3Dxxx%23L489)
- URLs für spezifische, gespeicherte Karten auf der interaktiven online-Karte (z. B.: https://www.verba-alpina.gwi.uni-muenchen.de/?page_id=133&db=xxx&tk=3436)
- URLs für analytische, projektbegleitende Beiträge (z. B.: https://www.verba-alpina.gwi.uni-muenchen.de/it/?p=366&db=xxx)
- URLs für Kapitel und Absätze innerhalb von längeren Texten (wie etwa analytischen Texten) – in VA noch nicht umgesetzt, Muster: Korpus im Text (Kapitel "Über Villen, Weiler und lat. villa"; Absatz 18)
VA und Normdaten
- Normdaten generell wichtig für inhaltlich/semantisch exakte und außerdem maschinell operationalisierbare wechselseitige Referenzierung zwischen verschiedenen Datenbeständen (im Sinne der Forschungskommunikation)
- Vorteile von Normdaten:
- Normdaten schließen Ambiguitäten aus
- Normdaten vereinfachen Datenmappings:
-
- Normdaten müssen klar definiert und stabil sein
- Normdaten entfalten maximalen Nutzen bei maximaler Akzeptanz (nicht steuerbar)
- VA-Nutzung externer Normdaten:
- Identifikatoren von Referenzlexika (für morpholexikalische Typen)
- Wikidata-QIDs (für Konzepte)
- Geonames-IDs (für Georeferenzen)
- künftig?: Wikidata L-IDs (für morpholexikalische Typen; aktuell problematisch, da mit VA inkompatibel)
-
- Probleme:
- unzureichend präzise Adressierbarkeit (z. B. Idiotikon https://digital.idiotikon.ch/idtkn/id12.htm#!page/120029/mode/1up oder FEW)
- semantisch intransparente URLs: http://online.drg.ch/#acf6e5a5ffa97df9e58a21e14c2ac7d0) (anders Georges 1913: http://www.zeno.org/Georges-1913/A/butyrum)
- Probleme:
- VA-Normdaten
- Grundlegend: Feingranulare Strukturierung von Inhalten
- VA-spezifische, stabile IDs für die zentralen Entitäten des Datenbestands:
- Morpholexikalische Typen (Praefix L)
- Konzepte (Praefix C)
- Einzelbelege (Praefix S)
- Orte (politische Gemeinden) (Praefix A)
- Präzise Adressierbarkeit der feingranulierten Inhalte durch URLs bzw. DOIs
- Beispiel für stabile, feingranulare Adressierbarkeit:
- ID des lateinischen Basistyps (vereinfacht: "Etymon") "excocta": B180
- LexikonAlpinum, aktuelle Arbeitsversion: https://www.verba-alpina.gwi.uni-muenchen.de/?page_id=12180&db=xxx#B180
-
- LexikonAlpinum, zitierfähige Version 192: https://www.verba-alpina.gwi.uni-muenchen.de/?page_id=12180&db=192#B180
- interaktive Karte: https://www.verba-alpina.gwi.uni-muenchen.de/?page_id=133&db=192&single=B180
- API ("Application Programming Interface"):
- Download im HTML-Format: https://www.verba-alpina.gwi.uni-muenchen.de/?api=1&action=getText&id=B180&lang=de&version=192
- Download im XML-Format: https://www.verba-alpina.gwi.uni-muenchen.de/?api=1&action=getRecord&id=B180&lang=de&version=192&format=xml – VORSICHT: Lange Ladezeit, Screenshot:
Institutionelle Absicherung
- Wesentlicher Aspekt: Für die dauerhafte Bewahrung von Wissen braucht es verantwortliche Institutionen mit unbefristeter Existenzperspektive
- Aus Sicht von VA sind die wissenschaftlichen Bibliotheken der natürliche Partner
- VA hat sich daher schon früh an die UB der LMU gewandt
- VA-Daten werden in das Forschungsdatenrepositorium der UB übertragen (Entwicklung der entsprechenden Prozeduren in den letzten Jahren)
- seit Mai 2021: Discover@UB:
-
- Strukturierter Kerndatenbestand von VerbaAlpina
- derzeit 222630 Datensätze (Versionen 19/1 und 19/2)
- unterschiedliche Granularität (komplette Versionen,
- Einbindung von generischen Metadaten (Datacite, DDC)
- Ad-Hoc-Erzeugung von DOIs für Einzelobjekte
- Neben UB: Enge Anbindung an ITG
- ITG übernimmt Betrieb und Pflege des VA-Portals auch über das Projektende hinaus ("post mortem"; im Rahmen der technischen und personellen Möglichkeiten)
- VA als Pilotprojekt in verschiedenen Projekten zum Forschungsdatenmanagement (GeRDI, eHumanities – interdisziplinär)
Ungelöstes (unlösbares?) Problem: "Lebende" Systeme (Webportale)
- Dauerhafter, unbefristeter Betrieb von Webportalen bedarf permanenter Pflege
- Zwei Kernprobleme:
- Ständige Veränderung der Softwareumgebung (Betriebssysteme, Frameworks) ⇒ Updates (v. a. wegen Sicherheitsproblematik)
- Abhängigkeit von externen Ressourcen durch Vernetzung ("tote" Links; instabile Inhalte)
- Beispiel für Abhängigkeit: VA auf archive.org:
- ⇒ gekapselte Systeme (z. B. Dockerimages) keine Lösung wegen Abhängigkeiten durch Vernetzung
- Notbehelf: Detaillierte Dokumentation der Funktionsweise des Webportals (zusammen mit Dokumentation von Datenbank und entwickeltem Softwarecode ⇒ Künftige "Rekonstruktion" der Funktionalitäten des Webportals zumindest theoretisch möglich)
Wir danken für Ihre Aufmerksamkeit!
***
Die Überlegungen dieses Kapitels gehen im Kern auf Krefeld 2011 zurück; sie flossen also bereits in die Konzeption von VerbaAlpina ein und wurden im Zuge der Projektarbeit kontinuierlich elaboriert. ↩
Der Ausdruck wird oft enger gefasst und im Sinne von "externer Forschungskommunikation" verwandt; dann bezeichnet er ausschließlich die divulgative "Kommunikation von Forschung über Fachgrenzen hinaus", so z. B. von Knöchelmann 2021; diese Verwendung wird der medialen Grundlage von Kommunikation und ihrer radikalen Veränderung nicht gerecht. Webbasierte Kommunikation muss gerade nicht trennscharf zwischen Laien- und Fachpublikum unterscheiden, sondern kann sich gleichermaßen – wenn auch nicht in identischer Weise – sowohl an das eine wie an das andere wenden. ↩
Bibliographie
- Knöchelmann 2021 = Knöchelmann, Marcel (2021): Die Stunde der Vermittler, in: FAZ vom 19.5.2021, 4
- Krefeld 2011 = Krefeld, Thomas: La raccolta di dati linguistici ai tempi dei nuovi media, Palermo, in: Gruppo di ricerca dell'Atlante Linguistico della Sicilia (Hrsg.), Per i linguisti del nuovo millennio. Scritti in onore di Giovanni Ruffino, Sellerio, 111-114