Antworten_BS (Zitieren)

Florian Zacherl

(3 Wörter)

[questionnaireResults id=12834 minPages=0]

Ergebnisse_Fragebogen_BColcuc (Zitieren)

Beatrice Colcuc

(3 Wörter)

[questionnaireResults id=11034 minPages=2]

Ergebnisse_Fragebogen_PassiAlpini_BColcuc (Zitieren)

Beatrice Colcuc

(2 Wörter)

[questionnaireResults id=12612]

Che cos’è un passo? (Zitieren)

Beatrice Colcuc

(124 Wörter)

Carissimi informanti, vi do un caloroso benvenuto su questa pagina. Ciò che avete davanti è un breve questionario che ha lo scopo di capire quale sia il valore dei passi montani all'interno dell'area dolomitica (ma anche al di fuori). Le domande sono molto semplici. Vi chiedo di rispondere in tutta sincerità e con spontaneità. Non […]

DBDokuNeu (Zitieren)

Florian Zacherl

Tabelle tokens(↩ zurück zur Übersicht)

Beschreibung
Enthält die tokenisierten Daten aus der Tabelle `Aeusserungen`. Die Einträge dieser Tabelle (zusammen mit den Daten aus `Tokengruppen`, mit denen mehrere Tokens zu einer Mehrwortlexie zusammengefasst werden können) bilden somit den Kern der Projektdaten von VerbaAlpina.

Die Felder aus dieser Tabelle stimmen in vielen Fällen mit denen aus der Tabelle `Aeusserungen` überein und werden bei der Tokenisierung direkt übernommen.

Die Tabelle `aeusserungen` kann mehrere Belege in einer Zeile enhalten, falls ein Informant mehrere Belege geliefert hat. Diese werden entweder durch ein Semikolon (verschiedene Worttypen) oder ein Komma getrennt. Hier wird dies durch die Verwendung von drei Indexen in den Feldern Ebene_1, Ebene_2 und Ebene_3 abgebildet. Ebene_1 bezieht sich auf Teile der Äußerung, die durch ein Semikolon getrennt wurde, Ebene_2 auf solche, die durch ein Komma getrennt wurden und Ebene_3 auf die eigentliche Tokensierung des Beleges. Die Äußerung "la ṣẹ kū́la, si dé̜sfa; a kulársẹ" wird also beispielsweise auf 8 Tokens mit den folgenden Indexen aufgeteilt:

Token	Ebene_1	Ebene_2	Ebene_3
la	1	1	1
ṣẹ	1	1	2
kū́la	1	1	3
si	1	2	1
dé̜sfa	1	2	2
a	2	1	1
kulársẹ	2	1	2

Diese Tabelle wird von folgenden Tabellen referenziert:

Spalten

Der Name von Spalten, die Teil des Primärschlüssels sind wird fett dargestellt, die Namen von Fremdschlüsseln unterstrichen. Kursivierte Werte im Feld Datentyp bedeuten, dass der Wert optional (nullable) ist.

Spaltenname	Datentyp	Mögliche Werte	Beschreibung
id_token	int(11) unsigned	beliebig	Eindeutige ID des Tokens. An der Oberfläche werden diese IDs mit dem Präfix "S" (= Single) verwendet (vgl. Identifikatoren).
id_informant	int(11) unsigned	beliebig	Fremdschlüssel, der auf die Tabelle `informanten` verweist. Informant, von dem dieser Beleg stammt. Direkt aus der Tabelle `Aeusserungen` übernommen.
id_stimulus	int(11) unsigned	beliebig	Fremdschlüssel, der auf die Tabelle `stimuli` verweist. Stimulus, durch den dieser Beleg produziert wurde. Direkt aus der Tabelle `Aeusserungen` übernommen.
token	varchar(200)	beliebig	Basistranskription des Tokens. Je nach Quelle sind unterschiedliche Transkriptionssysteme möglich: Von VerbaAlpina transkribierte Belege sind im Betacode. Die entsprechenden Quellen sind in der Tabelle `Bibliographie` mit dem Flag VA_Beta markiert. Von VerbaAlpina über das Crowdsourcing-Tool erhoben wurden, entsprechen der Eingabe des Nutzenden. Alle Belege aus anderen Quellen sind in einer quellenspezifischen Transkription (IPA, eigener Betacode, etc.) Für Belege, die im Quellenmaterial ausschließlich bereits typsiert angegeben werden, ist dieses Feld leer. Die Quellentranskription ist über einen quellenspezifischen `phonetischen` oder `morpho-lexikalischen Typ` angegeben, der mit dem Token verknüpft ist.
ipa	varchar(200)	beliebig	IPA-Darstellung des Belegs. Für Quellen, die im VA-eigenen Betacode oder einem anderen systematischen Transkriptionssystem angegeben sind, wird die IPA-Darstellung automatisiert mit Hilfe der Tabelle `codepage_ipa` generiert. Für Quellenmaterial, das bereits IPA-kodiert war, entspricht dieses Feld dem Eintrag im Feld "token". Für alle weiteren Quellen (besonders Belege aus dem Crowdsourcing-Tool wird aktuell keine eigene IPA-Darstellung angegeben, da diese manuell erstellt werden müsste)
original	varchar(4000)	beliebig	Darstellung des Belegs, wie dieser im Quellenmaterial angegeben war. Dieses Feld ist primär für Tokens im Betacode relevant, aber auch für andere Quellen, deren Datenmaterial in einer nicht-menschenlesbaren Form kodiert ist. Die Einträge in diesem Feld werden automatisiert mit Hilfe der Tabelle `codepage_original` für die dort geführten Quellen erzeugt.
portalsprache	varchar(10)	beliebig	Nur relevant für Belege, die über das Crowdsourcing-Tool eingegeben werden. Gibt die Sprache an, die jeweilige Nutzer im Tool gewählt hat. Diese entspricht nicht der Sprache der Äußerung, sondern nur der der Oberfläche (Bedienelemente, Hinweise, etc.). Direkt aus der Tabelle `Aeusserungen` übernommen.
id_aeusserung	int(11) unsigned	beliebig	Fremdschlüssel, der auf die Tabelle `aeusserungen` verweist. Gibt die vollständige Ursprungsäußerung an, aus der dieses Token stammt.
erfasst_von	varchar(50)	beliebig	Nutzername der Person, die diese Äußerung eingegeben/importiert hat. Direkt aus der Tabelle `Aeusserungen` übernommen.
erfasst_am	timestamp	beliebig	Zeitpunkt der Erstellung der zugeordneten Äußerung. Direkt aus der Tabelle `Aeusserungen` übernommen.
version	tinyint(4) unsigned	beliebig	Aufsteigende Nummer um redundante Mehrfachtranskriptionen zum Auffinden von Fehlern zu ermöglichen. Dies wird aktuell nicht verwendet; das Feld enthält somit immer den Wert 1. Direkt aus der Tabelle `Aeusserungen` übernommen.
bemerkung	text	beliebig	Freitextfeld für Bemerkungen. Falls die zugrundeliegende Äußerung eine Bemerkung hatte, wird dieses hier dupliziert. Bei Belegen, die im Quellenmaterial ausschließlich vortypisiert angegeben sind, wird hier zusätzlich die Quellentransktiption angegeben (z.B. SDS-Typ "Hütte"), da das Feld Token leer ist. Dies dient nur der Vereinfachung der Projektarbeit, da diese Information grundsätzlich auch durch die Verknüpfung mit einem entsprechenden quellenspezifischen Typ vorhanden ist. Zusätzlich sind eventuell weitere interne Notizen in diesem Feld möglich.
ebene_1	int(3)	beliebig	Index auf Ebene 1 (vgl. Tabellenbeschreibung)
ebene_2	int(3)	beliebig	Index auf Ebene 2 (vgl. Tabellenbeschreibung)
ebene_3	int(3)	beliebig	Index auf Ebene 3 (vgl. Tabellenbeschreibung)
id_tokengruppe	int(10) unsigned	beliebig	Fremdschlüssel, der auf die Tabelle `tokengruppen` verweist. Falls dieses Token Teil einer Mehrwortlexie ist, enthält es hier die ID einer entsprechenden Tokengruppe.
trennzeichen	varchar(10)	beliebig	Trennzeichen durch das dieses Token von nachfolgenden getrennt wird im Betacode. Für Tokens, die nicht Teil einer Mehrwortlexie sind oder die das letzte Token einer solchen sind, ist diese Feld immer NULL. Ansonsten enthält es aktuell entweder ein Leerzeichen oder {␣} (Betacode für einen Bogen, der zwei Tokens verbindet).
trennzeichen_ipa	varchar(10)	beliebig	Trennzeichen durch das dieses Token von nachfolgenden getrennt wird in IPA. Für Tokens, die nicht Teil einer Mehrwortlexie sind oder die das letzte Token einer solchen sind, ist diese Feld immer NULL. Ansonsten enthält es aktuell entweder ein Leerzeichen oder ‿.
trennzeichen_original	varchar(10)	beliebig	Trennzeichen durch das dieses Token von nachfolgenden getrennt wird in Originaldarstellung der Quelle. Für Tokens, die nicht Teil einer Mehrwortlexie sind oder die das letzte Token einer solchen sind, ist diese Feld immer NULL. Ansonsten enthält es aktuell entweder ein Leerzeichen oder ‿.
genus	enum	'','f','m','n','?','n/a'	Genus des Tokens (falls anwendbar)
pos	enum	'','v','art','sub','pron','adj','PPP','PPA','adv','num','praep','konj','mod','int'	Wortart des Tokens
person	enum	'','1','2','3','n/a'	Grammatikalische Person des Tokens (falls anwendbar)
tempus	enum	'','pres','impf','pasr','fut','n/a'	Tempus des Tokens (falls anwendbar)
modus	enum	'','ind','cong','cond','imp','inf','n/a'	Modus des Tokens (falls anwendbar)
numerus	enum	'','sg','pl','n/a'	Numerus des Tokens (falls anwendbar)
komplement	varchar(20)	beliebig	Aktuell nicht in Verwendung
chronoreferenz	char(9)	beliebig	Aktuell nicht in Verwendung. Für eine zeitliche Angabe der Verwendung vorgesehen.
id_dialekt	int(10) unsigned	beliebig	Fremdschlüssel, der auf die Tabelle `dialects` verweist. Nur relevant für Belege, die über das Crowdsourcing-Tool eingegeben werden. Gibt den im Tool ausgewählten Dialekt an. Da diese Möglichkeit in älteren Versionen des Tools noch nicht gegeben war, gibt es auch Crowdsourcing-Äußerungen, bei denen dieses Feld leer ist. Direkt aus der Tabelle `Aeusserungen` übernommen.
geaendert_am	timestamp	beliebig	Zeitpunkt der letzten Änderung

Ausschnitt

id_token	id_informant	id_stimulus	token	ipa	original	portalsprache	id_aeusserung	erfasst_von	erfasst_am	version	bemerkung	ebene_1	ebene_2	ebene_3	genus	id_dialekt	geaendert_am
219168	1081	104004	ha(gle(1{e1}		<span style="position : relative">ha̜gl<span style="position: relative">e᪸<span style='position: absolute; font-size: 60%; top: -0.7em; left: calc(50% – 0.3em);'>ə</span></span></span>		256214	MPantele	2019-05-06 15:33:21	1		1	1	1			2019-10-28 14:22:04
767746	111	1088	la	la	la		505742	ester24	2020-06-25 17:28:29	1		1	1	1	f		2021-03-08 11:58:36
6179	1094	30230					41725	MNeumeier	2015-02-18 14:44:41	1	n. SDS-Typ "Milchgade"	1	1	1	n		2018-07-31 19:30:18
181910	4439	30816					199928	mpantele	2019-01-24 15:47:49	1	TSA-Typ "we̜tərlo̜ɒχn"	1	1	1			2019-04-29 17:04:46
760602	48	1032	su(-\si/c/c/a	sˌʊːsˈiʧʧa	sū̜̀síćća		489590	ester24	2020-06-15 09:18:37	1		1	1	2	f		2021-03-08 11:55:26
171213	13501	106284	Odlrinna			deu	180235	anonymousCrowder_612	2018-04-29 02:12:23	1		1	1	1		47	2019-11-21 18:02:48
254676	182	694	radi/c/o?	radˈiʧo	radíćọ		248308	abrancatelli	2019-05-02 15:28:37	1		1	1	1			2019-05-21 15:55:46
306160	5394	1527	li-/nu	lˈiːnu	lī́nu		278552	patrizia95	2019-06-12 16:04:12	1		1	1	2	m		2019-06-24 16:42:56
477744	1105	104148	apri(/l-	aprˈɪl	aprí̜l̄		501424	AMaeder	2020-06-22 10:30:00	1		1	1	1			2020-08-24 11:24:12
142473	1645	3529	klabu/k	klabˈuk	klabúk		88393	jakob	2016-08-03 13:14:37	1		1	2	1			2018-06-20 14:08:43

(0 Wörter)

Video-Beitrag zur Celtic Knot Conference vom 9.-10. Juli 2020 (Zitieren)

Florian Zacherl

(35 Wörter)

Das Video ist unter folgendem Link auch über YouTube abrufbar: https://www.youtube.com/watch?v=P7ROTQ9N_8w

VerbaAlpina erklärt sich selbst – Teil 2: Informationstechnik (Zitieren)

Stephan Lücke

(1974 Wörter)

Grundsätzliches VerbaAlpina (VA) beschäftigt sich mit der Frage, welche Bezeichnungen es für ausgewählte, für den Alpenraum typische Konzept/Begriffe es gab und gibt VA ist mit diesem Ziel ein von der DFG gefördertes Langfristvorhaben mit Perspektive bis 2025 (derzeit dritte Teilphase [2019-2022] in Beantragung) Die Untersuchung ist auf den Alpenraum beschränkt Die Grenze des Untersuchungsgebiets ist […]

LexAlp (Zitieren)

Florian Zacherl

Das Lexicon Alpinum stellt im Wesentlichen eine alphabetisch geordnete Liste der von VerbaAlpina gesammelten morpho-lexikalischen Typen, Basistypen und Konzepte dar. Manchen Einträgen sind sprachwissenschaftliche Kommentare beigegeben. Dies ist hauptsächlich dann der Fall, wenn die dort gegebenen Informationen nach Ansicht von VerbaAlpina nicht oder nur unzureichend aus den zitierten Referenzwörterbüchern hervorgehen. Die alphabetische Liste enthält vereinzelt auch Eintragungen zu ausgewählten, aus Sicht von VerbaAlpina zentralen, Konzepten wie z.B. KÄSE, BUTTER oder auch ALMHÜTTE. Ausführlichere Erläuterungen sind – außer durch die besondere projektspezifische Bedeutung – meist dadurch veranlasst, dass VerbaAlpina die in den gängigen Nachschlagewerken (hauptsächlich in den großen etymologischen Wörterbüchern und in den von Wikimedia betriebenen Portalen, allen voran in der Wikipedia) präsentierten Informationen im Kontext der Projektperspektive für unzulänglich hält. Bis zu einem gewissen Grad ist sowohl die Auswahl der im Lexicon Alpinum vorgestellten Konzepte wie auch die Entscheidung, welchen morpho-lexikalischen bzw. Basistypen ein spezieller Kommentar beigegeben wird, intuitiv erfolgt.
Die Funktionalität des Lexicon Alpinum besteht in erster Linie aus einer zentralen Volltextsuche sowie einer Titelliste, die durch Texteingabe gefiltert werden kann. Weitere Funktionen gehen weitestgehend aus den Symbolen (Icons) in der Titelzeile und am rechten Rand der jeweiligen Einträge hervor; die Bedeutung der Icons erscheint zudem, wenn man den Mauspfeil darauflegt (Mouseover). Jeder Eintrag kann über das Zitationsicon (") direkt angesprochen und über ein weiteres Icon (Kettensymbol) verlinkt werden. Das jeweilige Stichwort des Artikels kann zudem auf der interaktiven Karte visualisiert werden. Das Icon am rechten Rand ('Daten') führt zu sämtlichen Informationen, die in den Infowindows der interaktiven Karte versammelt sind; vor allem erscheinen die Links zu korrespondierenden Artikeln in Referenzwörterbüchern. Im Fall der Konzepte werden außerdem Links zu den Wikidata-Datenobjekten sowie zu anderen Normdaten geliefert; so wird das VA-Material lexikographisch und enzyklopädisch kontextualisiert.
Die Einträge des Lexicon Alpinum sind jedoch nicht nur mit projektfremden Normdaten verknüpft, sondern es werden auch projekteigene Normdaten angeboten, die in der Titelzeile unmittelbar nach dem Stichwort erscheinen. Je nachdem, ob das Stichwort einen morpho-lexikalischen Typ, einen Basistyp oder ein Konzept repräsentiert, werden diese VA-Normdatum mit 'Lnn', 'Bnn' oder 'Cnn' indiziert. Schließlich steht auch zum Download aller Informationen ein Icon bereit.

(auct. David Englmeier | Thomas Krefeld | Stephan Lücke)

(0 Wörter)

VerbaAlpina erklärt sich selbst (in 10 Sätzen) (Zitieren)

Thomas Krefeld
Schlagwörter: DH

, Digital Humanities

, Geolinguistik

, Lexikographie

, Sprachatlas

(328 Wörter)

Dieser Beitrag versteht sich als eine Vorstellung des Projekts VerbaAlpina (VA) in 10 Kernsätzen; es handelt sich jedoch nicht um einen Beitrag über das Projekt, denn das Projekts präsentiert sich gewissermaßen selbst in Gestalt ausgewählter Zitate und Materialien, die auch unabhängig von dieser Vorstellung über die Nutzeroberfläche abrufbar sind. Im Vordergrund steht die sprachwissenschaftliche Seite […]

This post was not versioned, yet. It can only be accessed within the current working version.