La carta interactiva pussiblitescha a l'utilisader da tschertgar trais differents 'tips' linguistics. Mintga 'tip' è d'interpretar sco ina classa d'expressiuns linguisticas; cun quai duai la varietad nunsurvesaivla da las variantas linguisticas numerusas vegnir structurada en maniera survesaivla. I vegnan duvrads criteris fonetics, morfologics e – en il cass dal 'tip da basa' – criteris da l'istorgia da la lingua. La tipisaziun da las datas linguisticas georeferenziadas fa part da las pretaisas fundamentalas da VerbaAlpina. Per quai vegnan, nua ch'igl è pussaivel, extratgs en in emprim pass sunter la transcripziun tokens ('pleds singuls') da las datas d'entrada che vegnan lura registrads en il champ da la banca da datas da medem num.
El center dagl interess da VerbaAlpina stat la tipisaziun morfologica dal material linguistic collectà. In tip morfologic vegn definì da la congruenza da las caracteristicas suandantas: famiglia da linguas – spezia da pled – pled simpel vs. pled affixà – genus – tip da basa lexicala. La furma numinala dal tip morfologic s'orientescha finalmain als lemmas correspundents da lexicons da referenza tschernids (v. sut).
Tras l'assegnaziun ad in tip da basa lexical cuminaivel vegn clera la parentella da tut ils tips morfolexicals unids – era sur ils cunfins linguistics ora. Uschia sa laschan assegnar ils nomens e verbs suandants (che n'èn betg descrits qua en detagl) ad in tip da basa unic: malga (ALP, MUVEL), malgaro (SIGNUN), malghese (PASTUR), immalgare (CHARGIAR L'ALP), dismalgare (STGARGIAR). Il tip da basa lexical na palaisa dentant nagut sin l'istorgia da pled d'in tip morfolexical singul: i sto mintgamai vegnir elavurà separadamain sch'in tip cun etimon latin-neolatin ch'oz è cumprovà en il territori linguistic german ni sloven, sco p.ex. sloven bajta 'chasa simpla', deriva da substrat anteriur local u plitost da contact linguistic neolatin pli recent. Per questa raschun vegn evitada la designaziun "etimon" en quest context cunquai ch'ella sa referescha per princip al prestadi istoric immediat d'in pled; tuttina è il tip da basa lexical en blers cas per propi era l'etimon d'in tip morfolexical.
Ils tips morfolexicals furman la categoria dirigenta en l'administraziun da las datas linguisticas. Els èn cumparegliabels als lemmas da la lexicografia. Tras ils criteris surmenziunads, solids e bain operaziunalisabels pon ins reducir p.ex. ils quatter tips fonetics barga, bark, margun, bargun cun la significaziun TEGIA D'ALP, STALLA D'ALP a trais tips morfolexicals.
L'appartegnientscha dals tips morfolexicals a las famiglias da linguas (gem., roa., sla.) dependa da la funtauna respectiva; ella resulta automaticamain tras ils infurmants e vegn notada correspondentamain en la banca da datas en il cas da datas d'atlas u dicziunaris ch'èn stadas registradas tradiziunalmain. En il cas da las datas che VerbaAlpina releva sez tras crowdsourcing inditgeschan ils infurmants lur appartegnientscha linguistica resp. dialectala che vegn cumprovada en il cas ideal quantitativamain; il dumber dals infurmants confermativs daventa uschia in instrument per la validaziun da datas.
Tips morfolexicals èn limitads ad ina famiglia da linguas. Quai caschuna la dumonda suandanta: tgei furma vegn duvrada per represchentar in tip morfolexical en la funcziun da retschertga da la charta interactiva? Pertutgant la famiglia da linguas germana e la famiglia da linguas slava è la resposta plitost simpla; omaduas èn represchentadas be d'ina lingua standardisada ('Deutsch' [deu] resp. 'Slowenisch' [slo]). Ils tips morfolexicals pon vegnir represchentads en furma da lur variantas da la lingua da standard, evidentamain sut la cundiziun ch'i dat equivalents dal tip en la lingua da standard. Uschia pon p.ex. ils tips fonetics correspundents da l'aleman e dal bavarais ch'èn variantas da la furma da standard vegnir clamads tranter questa furma da standard. Sch'i na dat betg variantas da standard per in tip, vegni fatg diever dals lemmas dals gronds dicziunaris da referenza dialectals (Idiotikon, WBÖ).
En il cas da la famiglia da linguas neolatina è la situaziun zunt pli cumplexa pervia da las linguas minoritaras numerusas, parzialmain betg avunda standardisadas. Per raschuns pragmaticas è vegnida tschernida la soluziun suandanta: tut ils tips morfolexicals vegnan, sche existents, represchentads da furmas da standard franzosas e talianas. Uschia pon p.ex. tut ils tips fonetics ch'èn variantas da beurre/burro 'paintg' vegnir clamads tranter questas duas furmas; TLF e Treccani fan da dicziunaris da referenza. Sche be ina da questas duas linguas da standard ha ina varianta correspundenta, cumpara mo questa, sco en il cas da ricotta (l'appartegnientscha al talian vegn inditgada da la convenziun da notaziun -/ricotta). Sch'i na dat betg ina varianta dal tip en nagina da las duas linguas da referenza neolatinas, vegni fatg diever dal lemma d'in diciziunari da referenza dialectal, sco p.ex. LSI. En cas ch'i na dat nagins lemmas vardaivels en dicziunaris dialectals, propona VerbaAlpina in tip da basa che vegn represchentà graficamain da la sigla 'VA'.
Igl è previs da tipisar il material linguistic era foneticamain. Quest pass è dentant periferic e na vegn betg realisà consequentamain. La categoria correspundenta è indispensabla surtut perquai ch'atlas linguistics (p.ex. SDS e VALTS) e dicziunaris documenteschan mintgatant mo tips fonetics. Tar la tipisaziun fonetica vegnan ils tokens classifitgads tenor criteris da la fonetica istorica (champ da la banca da datas 'phon_typ'). In exempel tipic (da l'AIS 1204 LA PANNA | RAHM | CRÈME):
I fa segn tenor la fonetica da distinguer las variantas da sun inizial [kr-] e [gr-] sco er las variantas da vocal accentuà [a], [e] e [o] davant [m].
In'automatisaziun da la tipisaziun fonetica sin basa dad algoritmus Levenshtein e soundex vegn examinada e sche pussaivel realisada.
Tras la tipisaziun (furmaziun da classas) daventa la varietad da datas pli e pli survesaivla; i vala pia la regla: dumber dals tokens > dumber dals tips fonetics > dumber dals tips morfolexicals > tip da basa. Ins remartgia dentant il cas extrem d'ina cumprova suletta (hapax) che correspunda ad in token, in tip fonetic ed in tip morfolexical sco unic represchentant d'in tip da basa. Eventualmain èsi raschunaivel da filtrar ora talas furmas da hapax da la preschentaziun.
Quemada, B. (1983): Trésor de la langue française: dictionnaire de la langue du XIXe et du XXe siècle (1789-1960). Tome dixième, Incartade-Losangique, Paris , Editions du Centre national de la recherche scientifique