Il progetto

Descriviamo qui propositi e struttura del progetto, rimandando, per un approfondimento delle questioni metodologiche e teoriche, a Barbato (2017).

Il modello dell’AGLIO è quello dell’atlante linguistico tradizionale, non tanto per la rappresentazione cartografica, che sarà sviluppata in una fase ulteriore, quanto come repertorio di dati: dati bruti o «semilavorati» ma omogenei e pronti all’interpretazione. Si pensi all’AIS: l’intero territorio italiano (o meglio italoromanzo) è disseminato di località di inchiesta; in ogni punto della rete vengono poste le stesse domande (in genere di carattere lessicale: “Come si dice x?”); i risultati cartografati permettono di ricostruire innanzitutto le diverse aree di una parola (es. testa/capo), ma eventualmente, attraverso una ricerca mirata etimologicamente, anche le linee di confine – o isoglosse – di un’evoluzione fonologica (es. -t- > [t]/[d]), e – andando ancora più a fondo – persino interi subsistemi fonologici e morfologici.

La rete di “località” dell’AGLIO è fornita dal corpus dell’Opera del Vocabolario Italiano, e in particolare dal sottocorpus costituito dai testi significativi (TS), quelli non solo filologicamente sicuri ma anche rappresentativi di una determinata varietà: i “punti” corrispondono alle località di cui abbiamo testi significativi. Per avere una base di riferimento fissa, è stato necessario “congelare” il corpus: la versione su cui lavoriamo è quella aggiornata al luglio 2016 (i testi sono 732, per un totale di 4.825.874 occorrenze). Qualora si riscontrino però a) degli errori di battitura nella preparazione del corpus, b) degli errori nella lemmatizzazione delle forme, si correggono tacitamente, di concerto con la squadra dell’OVI.

Come nell’OVI, abbiamo dunque una serie di aree generiche, cui corrisponde una serie di aree specifiche, per ognuna delle quali esistono uno o più testi, ciascuno con una sigla bibliografica (la sigla contiene la data del testo). Ecco un esempio:


area generica

area specifica

testo

tosc.

aret.

Restoro d’Arezzo, 1282


È stato stabilito inoltre un ordine fisso delle località, da Nord(Ovest) a Sud. All’interno di ogni località l’ordine dei testi è quello cronologico. Al raggruppamento per aree generiche e specifiche se n’è aggiunto uno per macro-aree (settentrionale, toscana, centro-meridionale). Per l’elenco dettagliato cfr. Consulta per aree e Consulta per testi.

Veniamo al “questionario”. L’operazione preliminare è la scelta di lemmi con particolari caratteristiche: appartenenti al lessico ereditario, di alta frequenza, di estensione idealmente panitaliana. Per l’elenco costantemente aggiornato dei lemmi cfr. Consulta per lemmi.

Il lemma corrisponde a quello del TLIO e ne registra anche l’informazione grammaticale: categoria lessicale e genere inerente per i sostantivi (es. assenza s.f.). Data l’architettura del TLIO, può accadere che sotto un lemma compaiano due generi (sost. m./f.) o due categorie lessicali (sost./agg.; avv./cong.). Nella lemmatizzazione si discrepa dall’OVI solo in questi casi:

1) L’OVI distingue participi con valore verbale (lemmatizzati sotto il verbo) e con valore aggettivale o sostantivale (lemmatizzati autonomamente). La distinzione non è pertinente ai nostri fini (morfologici), per cui sotto i participi verbali si troveranno anche quelli non verbali.

2) L’OVI distingue l’infinito sostantivato come lemma a sé. Noi lo prendiamo sotto il verbo. I casi di pluralizzazione, frutto di una conversione verbo > sostantivo (es. i beri) non si considerano.

I lemmi danno luogo a una serie di forme (cfr. Consulta per forme). Si noti che la forma non tiene conto di eventuali diacritici presenti nell’edizione: non distingue ad esempio campo e ca(m)po. Alle forme sono associati dei tratti fonologici e dei tratti morfologici. Nella codifica dei tratti si ignorano i clitici che accompagnano eventualmente le forme verbali. Alcune forme restituite dalla ricerca sono escluse dalla codifica: antroponimi e toponimi, forme latine (es. auri per ‘oro’), forme abbreviate (o. ancora per ‘oro’), superlativi (grossissimo), forme con materiale eccedente (menoché), chiari cultismi (es. radio per ‘raggio’), palesi errori di copia (es. portrare per ‘portare’).

I tratti fonologici (cfr. Consulta per tratti fonologici) sono di tipo diacronico ed esprimono il rapporto con l’etimo latino, per esempio il rapporto di legno con l-, i breve tonica, -gn-, -u. Essi tengono conto di alcune innovazioni panitaliane se non panromanze: fusione delle due a del latino (ma distinzione delle altre vocali), monottongazione di ae e oe (ma conservazione di au), formazione di jod e waw per riduzione di iato, confusione di j, dj, gj. Nel vocalismo atono, non si distinguono due a, e, u finali, perché queste vocali non danno mai risultati distinti.

Si usa il tratto -kw- per indicare la labiovelare classica, il tratto -cw-, per indicare il gruppo con [w] tardo-latino: dunque forme come giacque, tacque hanno -cw-, forme come acqua, aquila, seguire -kw-.


Nell’etimologizzazione si tiene conto delle innovazioni antiche: perdita di h, ns > s, sincope panromanza (es. oculu > oclu), perdita di -m e -t. Si tiene conto anche di innovazioni lessicalmente marcate (es. lacju per laqueu ‘laccio’).

Le desinenze verbali non vengono interpretate fonologicamente: in questo settore infatti l’influsso dei fattori analogici è così alto da rendere problematica (e fuorviante negli effetti) un’interpretazione fonologica. Gli unici tratti fonologici della forma (tu) ami saranno dunque [a tonica] [m intervocalica].

L’influsso dell’analogia non è certamente assente ma è più controllabile nella morfologia nominale: si è deciso dunque di codificare fonologicamente le desinenze nominali, senza le quali del resto verrebbe meno la gran parte dell’informazione sul vocalismo finale. I morfemi nominali sono codificati come -u, -e, -i, -a, -ora.

Gli allomorfi radicali tanto dei nomi quanto dei verbi vengono interpretati fonologicamente. Ad esempio alla forma solchi < sulci è associato il tratto [c + vocale non palatale], alla forma cigna ‘(egli) cinga’ è associato il tratto [ng + vocale palatale]. Si creano così dei “falsi storici”, ma si evita di incamerare dati inutilizzabili per ricerche fonologiche. L’interpretazione fonologica degli allomorfi è un’operazione spesso delicata ma abbiamo cercato di condurla fino in fondo, anche a costo di compiere qualche errore.

Un caso limite è quello del verbo ‘salire’: le forme sall- che compaiono dalla Toscana a Napoli si prestano a una doppia interpretazione: 1) <ll> rappresenta la laterale palatale, 2) rappresenta una laterale alveolare geminata effettivamente presente in alcune varietà moderne (cfr. AIS 1612). Si è valutata allora: a) la presenza negli stessi testi di altri casi di <ll> con valore palatale, b) la presenza negli stessi testi di forme di ‘salire’ con grafie che esprimono inequivocabilmente la palatale, c) la distribuzione moderna del tipo sallire (tosc., laz., abr.). Si è deciso di conseguenza di interpretare <ll> come ll solo per i testi mediani (Mascalcia, Buccio, Sant’Alessio) e romaneschi (Storie de Troia, Miracole).


In casi estremi (es. l’allomorfo dag- di ‘dare’) si è limitata la codifica fonologica al solo materiale sicuro (d-), senza escludere che in un secondo momento si possa riconoscere la molla dell’analogia e dunque interpretare fonologicamente anche il materiale restante.

Nel caso dei futuri, dei condizionali e degli infiniti sincopati si è rinunciato sistematicamente ad analizzare l'allomorfo. Nell’analisi dei tratti ci fermiamo alla vocale, dunque merrà da menare avrà [m iniziale] [i breve protonica], berrà [m iniziale] [i breve protonica], ecc.

I participi vengono classificati contemporaneamente come nomi e come verbi: la codifica fonologica dunque è integrale.

I tratti morfologici (cfr. Consulta per tratti morfologici) sono di tipo sincronico e dichiarano i valori morfosintattici delle forme romanze, per esempio il fatto che (tu) ami sia una seconda persona del presente indicativo.

Qualche problema pone la codifica dei nomi ambigeneri, antichi neutri. Forme flesse come braccio e braccia accordano rispettivamente al maschile e al femminile e come tali sono codificate. Arcaismi come la braccia plurale sono invece codificati come [n.pl.]. In caso di conflitto tra genere del determinante e genere del predicato, come regola generale, diamo la preferenza al primo.

Alcune varietà centrali hanno il sistema il braccio - i braccia. In casi ambigui, sulla base della letteratura e salvo prova contraria, tali plurali si considerano per default maschili in perug., orviet. e viterb., mentre si valuta caso per caso in aret., cort., castell., eugub., assis., tod.


Non si può neanche escludere l’ambiguità di numero. Il caso di legna che può essere singolare (la legna) o plurale (le legna) ha suscitato una ricerca monografica (Barbato/Fortunato, in stampa).

Si è rinunciato alla distinzione del “neutro di materia” (es. napol. llo ppane vs lo cane; mediano lo pane vs lu cane), dal momento che l’individuazione dei lessemi appartenenti a questo genere prevede analisi approfondite delle singole varietà. Faute de mieux, questi nomi sono codificati come maschili.

Alcuni nomi hanno un genere variabile: si pensi a miele, sale che possono essere femminili in area settentrionale. In caso di ambiguità, per decidere il genere, si è ricorso innanzitutto alla testimonianza dello stesso testo, poi di testi sincroni e sintopici, infine di dialetti sintopici (attraverso l’AIS e Rohlfs). Anche qui è inevitabile un margine di errore.

Può non essere semplice sceverare tra indicativo e congiuntivo alle prime due persone plurali. Esemplificando con la prima classe, il sistema italoromanzo primitivo si configura nel modo seguente (cfr. Barbato 2013):


indicativo

(iussivo)

congiuntivo

-amo

-emo

-ate

-ete


C’è poi una tendenza (abbastanza generale) a usare -amo al posto di -emo in funzione iussiva; e una tendenza (in particolare in area mediana) a usare -ete al posto di -ate in funzione iussiva. Prudenzialmente schediamo -amo come indicativo, -ete come congiuntivo. Anche il tosc. -iamo (che neutralizza l’opposizione tra -amo e -emo), se in funzione iussiva lo codifichiamo come congiuntivo.

Sebbene non sia popolare, il participio presente si può dire integrato al paradigma verbale nelle varietà medievali. Nelle varietà in cui -nte e -ndo si confondono per ragioni fonologiche, i casi ambigui in -nt si codificano come gerundi; le forme contaminate come ven. -anto si codificano pure come gerundi.

Qualche difficoltà può esserci a distinguere la terza e la sesta persona. È noto che con i predicati inaccusativi-passivi è possibile in tutte le varietà il non-accordo del soggetto posposto (es. viene i nemici, fu fatto i consigli). Il problema si pone per quelle varietà in cui la terza e la sesta persona sono identiche morfologicamente: la forma ambigua si considera allora di 3a pers. se il soggetto è posposto, di 6a pers. se il soggetto è preposto.

*

L’output di tutto questo lavoro è una cartografia (da intendere in senso lato) dei singoli fenomeni nell’intero territorio. L’Atlante fornisce una serie di “carte” in cui per ogni varietà compaiono le risposte alle singole domande (es. gli esiti di e breve tonica, del gruppo consonantico gn, ecc.). L’utente può fare ricerche ampliando e restringendo a piacere i vari campi (lemma, varietà, tratto). Si va dai casi più semplici (ad esempio, gli esiti di gn in una determinata località) a quelli più complessi in cui è possibile combinare più tratti: chi è interessato alla metafonesi, per esempio, combinerà esiti di e lunga tonica e di u finale; chi è interessato al paradigma di una certa classe verbale (es. la prima) dovrà combinare diversi lemmi ad essa appartenenti (es.amare, cantare, ecc.). Per maggiori dettagli vedi Istruzioni per la ricerca.

[M. Barbato, 27.02.2019]


AIS = Karl Jaberg/Jakob Jud, Sprach- und Sachatlas Italiens und der Südschweiz, 8 voll., Zofingen, Ringier, 1928-1940.

Barbato, Marcello (2013), Neutralizzazioni alla 4. e 5. persona in Italia mediana, in “L’Italia dialettale” LXXIV, 7-37.

Barbato, Marcello (2017), Per un atlante grammaticale della lingua italiana delle Origini, in “Zeitschrift für romanische Philologie” 133, 820-843.

Barbato, Marcello/Fortunato, Maria (in stampa), Quanto è antico la legna? in “Studi di Grammatica Italiana”.

Rohlfs, Gerhard, Grammatica storica della lingua italiana e dei suoi dialetti, 3 voll., Torino, Einaudi, 1966-1969.

Interroga la banca dati
Ricerca nell'archivio con richieste complesse


Trova forme
Interroga la banca dati e restituisce una o più forme

Trova aree
Interroga la banca dati e restituisce una o più aree

Consulta la banca dati
Esplora l'archivio a partire dagli elementi presenti


  Consulta per lemmi
  Consulta per forme
  Consulta per tratti fonologici
  Consulta per tratti morfologici
  Consulta per aree
  Consulta per testi