Morphalou 3.1

Qu'est-ce que Morphalou3 ?

Morphalou3 est un lexique à large couverture. Les lexies sont accessibles par leurs formes lemmatiques (forme canonique non fléchie). À chacun de ces lemmes sont associées toutes ses formes fléchies (déclinaisons et conjugaisons du lemme). Par exemple le lemme nom commun « reine » donne deux formes fléchies : « reine » (singulier) et « reines » (pluriel.)

Les informations grammaticales sont précisées pour les lemmes (catégorie, sous-catégorie, s'il s'agit d'une locution, genre, variantes orthographiques, variante pronominale et variante masculine si c'est un nom commun féminin) et pour les formes fléchies (nombre, genre, mode, temps et personne, si approprié).

Les lexies présentes dans Morphalou3 correspondent essentiellement aux formes orthographiques standards, mais certaines entrées sont en orthographe non standard, comme par exemple le lemme « paske » (conjonction de subordination) qui est une variante orthographique du lemme « parce que », ou le lemme « tjs » (adverbe) qui est une variante orthographique du lemme « toujours ». Morphalou3 contient également les nouvelles graphies des mots concernés par les rectifications de l’orthographe proposées en 1990 par le Conseil supérieur à la langue française et par l’Académie française.

Le lexique Morphalou 3.1 comprend également la trancription phonétique de 93 695 lemmes et 522 662 formes fléchies.

Pour chaque lemme et chaque forme fléchie, indication est faite de son ou ses lexiques d'origine.

Morphalou3 est diffusé sous licence LGPL-LR (Lesser General Public License For Linguistic Resources). Cette licence libre, adaptée aux ressources linguistiques, garantit la liberté de partage et de modification des données. Voir le texte intégral de la licence.

Quelles différences entre la version 3.1 et la version 3 ?

Par rapport à la version 3 de Morphalou, plus de 7 000 verbes, dont une partie des conjugaisons étaient mal renseignées, ont été corrigés dans la version 3.1.

Au total 21 880 formes fléchies manquantes ont été rajoutées. La grande majorité de ces conjugaisons manquaient pour la première personne du singulier, très rarement pour la deuxième personne du singulier et la troisième personne du pluriel :

à l'indicatif imparfait
au conditionel présent
au subjonctif présent
à l'indicatif passé simple
à l'indicatif présent

Un récapitulatif des conjugaisons pour chaque verbe a été généré à partir des données de Morphalou 3.1. Voir la section "Conjugaisons".

Fusion de cinq lexiques

La version 3 de Morphalou a été obtenue par la fusion de cinq lexiques :

Morphalou 2 (version de décembre 2013)
DELA (version de décembre 2011)
Dicollecte (version 4.3)
LGLex et LGLexLefff (version 3.4)
Lefff (version 2.1 avril 2006)

Cette fusion a permis d'augmenter et corriger le contenu de près de 70 000 lemmes et plus de 500 000 formes fléchies. Elle a également permis de redéfinir le jeu d'étiquettes, décrit en détail dans un chapitre dédié.

Une partie des données des lexiques ont été ignorées, essentiellement les noms propres et mots composés. (Voir la section Quels lemmes font partie ou non de Morphalou3 ?)

Un travail de corrections manuelles a également été opéré.

Morphalou 2

Le lexique Morphalou est un lexique ouvert des formes fléchies du français. Les données initiales de Morphalou proviennent du TLFnome, la nomenclature du Trésor de la Langue Française qui a fourni 539 413 formes fléchies, appartenant à 68 075 lemmes. Le transfert du TLFnome vers Morphalou s'est fait par une réorganisation structurelle des données et une normalisation des étiquettes grammaticales, sans perte d'informations linguistiques. Le lexique résultant est un lexique à large couverture (~540 000 formes fléchies), linguistiquement valide (sous la responsabilité d'un comité éditorial) et formellement en accord avec les propositions de normalisation pour les ressources lexicales du TAL à l'ISO (TC37/SC4). Il est en accès libre à des fins de recherche et d'enseignement. Le maintien et la mise à jour du lexique sont assurés par l'ATILF. Cette ressource est distribué sur le CNRTL.

Responsable : ATILF (Analyse et Traitement Informatique de la Langue Française), unité mixte de recherche CNRS - Université de Lorraine, Nancy

Site web : http://www.cnrtl.fr/lexiques/morphalou/

Exemple 1. Les entrées pour le lemme « exemple »

Format XML :

	<lexicalEntry id="exemple_1">
		<formSet>
			<lemmatizedForm>
				<orthography>exemple</orthography>
				<grammaticalCategory>commonNoun</grammaticalCategory>
				<grammaticalGender>masculine</grammaticalGender>
			</lemmatizedForm>
			<inflectedForm>
				<orthography>exemple</orthography>
				<grammaticalNumber>singular</grammaticalNumber>
			</inflectedForm>
			<inflectedForm>
				<orthography>exemples</orthography>
				<grammaticalNumber>plural</grammaticalNumber>
			</inflectedForm>
		</formSet>
		<originatingEntry target="TLF">EXEMPLE, subst. masc.</originatingEntry>
	</lexicalEntry>

Format MySQL :

Lemme :

26164, 'exemple', 'commonNoun', 'masculine', NULL, NULL, 'E g z a~ p l @', 'E g z a~ p l @', 'EXEMPLE, subst. Masc.', 0

Formes fléchies :

26164, 'exemple', 'commonNoun', 'masculine', NULL, NULL, 'E g z a~ p l @', 'E g z a~ p l @', 'EXEMPLE, subst. Masc.', 0

26164, 'exemples', 'plural', NULL, NULL, NULL, NULL, 'E g z a~ p l @', 'E g z a~ p l @', NULL

DELA

DELA est un dictionnaire fléchi du français, constitué de mots simples, mots composés et noms propres tels qu'ils apparaissent dans les textes et de leurs étiquettes grammaticales. Chaque mot possède un code morphologique qui permet d'engendrer automatiquement toutes ses formes fléchies. Les formes fléchies ont donc été obtenues automatiquement.

Responsable : Laboratoire d'informatique Gaspard-Monge, de l'Université Paris-Est Marne-la-vallée

Licence : LGPLLR

Site web : http://infolingu.univ-mlv.fr/DonneesLinguistiques/Dictionnaires/telechargement.html

Exemple 2. Les entrées pour le lemme « exemple »

```
exemple,.N+z1:ms
```
```
exemple concret,.N+NA+z1:ms
```
```
exemple de jurisprudence,.N+NDN:ms
```
```
exemple entre mille,.N+NPN+z1:ms
```
```
exemple frappant,.N+NA+z1:ms
```
```
exemple type,.N+NA+z1:ms
```
```
exemple unique,.N+NA+z1:ms
```
```
exemple vivant,.N+NA+z1:ms
```
```
exemple à suivre,.N+NPV+Hum:ms
```
```
exemples,exemple.N+z1:mp
```

exemples frappants,exemple frappant.N+NA+z1:mp

exemples vivants,exemple vivant.N+NA+z1:mp

exemples à suivre,exemple à suivre.N+NPV+Hum:mp

Dicollecte

Dicollecte est une ressource linguistique open source. C'est un lexique français de formes fléchies générées. Il contient les rectifications de l'orthographe proposées en 1990 par le Conseil supérieur à la langue française et par l'Académie française. Dicollecte vise à améliorer les dictionnaires orthographiques français pour les logiciels libres, comme LibreOffice, OpenOffice, Firefox, Thunderbird, Evolution, Pidgin, Notepad++, Eclipse, etc., ainsi que tous les logiciels utilisant le correcteur orthographique Hunspell.

(C'est une ancienne version de Dicollecte qui a été intégrée à Morphalou3, et qui ne comprend donc pas les améliorations des versions 5 et supérieures.)

Responsable : Olivier R.

Licence : MPL (Mozilla Public License) et GPL (GNU General Public License) et LGPL (GNU Lesser General Public License) (C'est avec l'accord du responsable de Dicollecte que nous diffusons sous licence LGPL-LR le contenu de Dicollecte qui a été intégré au sein de Morphalou3.)

Site web : http://dicollecte.org/home.php?prj=fr

Exemple 3. Les entrées pour le lemme « exemple »

145453	exemple	exemple	nom	mas sg	13438985	111270	33275	13583530	1	0.029929721321115

145453	exemples	exemple	nom	mas pl	2507550	10310	6539	2524399	1	0.005562218257942

Lefff

Le Lefff est un lexique des formes fléchies du français à large couverture, associant à chaque forme son lemme, ses traits morphologiques et d'autres champs récemment disponibles.

Ce lexique a été obtenu par diverses techniques, dont :

acquisition automatique (avec validation manuelle) à l'aide de techniques statistiques appliquées sur des corpus bruts
acquisition automatique (avec validation manuelle) d'informations syntaxiques atomiques
par correction et ajouts manuels ou guidés par des techniques automatiques, comme par exemple la fouille d'erreurs dans les sorties d'analyseurs syntaxiques
pour certains noms, adjectifs et adverbes, par l'exploitation du lexique morphologique Multext pour le français

Responsables : Institut National de Recherche en Informatique et en Automatique (INRIA) Lionel Clément et Benoît Sagot, Bordeaux

Licence : LGPLLR (Lesser General Public License for Linguistic Resources

Site web : http://www.labri.fr/perso/clement/lefff/

Exemple 4. Les entrées pour le lemme « exemple »

ex.		nc	[pred='exemple_____1<suj:(sn),objde:(de-sn|de-sinf),obja:(à-sinf)>',cat=nc,@m]

exemple		nc	[pred='exemple_____1<suj:(sn),objde:(de-sn|de-sinf),obja:(à-sinf)>',cat=nc,@ms]

exemple		ncpred	[pred='exemple_____1<suj:sn|sinf|scompl,obja:(à-sn|sur-sn)>',lightverb=prendre,cat=nc]

exemples		nc	[pred='exemple_____1<suj:(sn),objde:(de-sn|de-sinf),obja:(à-sinf)>',cat=nc,@mp]

LGLex et LGLexLefff

LGLex est un lexique syntaxique des verbes simples, des noms prédicatifs, des expressions figées et des adverbes du français au format texte et XML, généré par LGExtract à partir des tables du Lexique-Grammaire.

LGLexLefff est un lexique syntaxique des verbes simples et des noms prédicatifs du français converti au format Lefff à partir du lexique LGLex.

Responsable : Institut d'électronique et d'informatique et Laboratoire d'informatique Gaspard-Monge, de l'Université Paris-Est Marne-la-vallée

Licence : LGPLLR

Site web : http://infolingu.univ-mlv.fr/DonneesLinguistiques/Lexiques-Grammaires/Telechargement.html

Exemple 5. Les entrées pour le lemme « exemple »

LGLex (format texte) :

lexical-info=[cat="noun",Vsup=[cat="verb",list=(value="avoir")],detN=[list-det-modif=(det-modif=[det="un+une",modif="true",value-modif="certain"],
det-modif=[det="un+une",modif="false"]),noun=[notperm=[complete="exemple"],noun1="exemple"]],prepositions=()]

lexical-info=[cat="noun",Vsup=[cat="verb",list=(value="donner")],detN=[list-det-modif=(det-modif=[det="le",modif="false"],
det-modif=[det="le+l'+la",modif="true"]),noun=[notperm=[complete="exemple"],noun1="exemple"]],prepositions=(),Vconv=[cat="verb",list=(value="recevoir")]]
example=[example="Max (montre+donne) l'exemple de la politesse à Luc"]

lexical-info=[cat="noun",Vsup=[cat="verb",list=(value="donner")],detN=[list-det-modif=(det-modif=[det="le",modif="false"]),
noun=[notperm=[complete="bon exemple"],noun1="bon exemple"]],prepositions=(),Vconv=[cat="verb",list=(value="recevoir")]]

lexical-info=[cat="noun",Vsup=[cat="verb",list=(value="donner")],detN=[list-det-modif=(det-modif=[det="le",modif="false"]),
noun=[notperm=[complete="mauvais exemple"],noun1="mauvais exemple"]],prepositions=(),Vconv=[cat="verb",list=(value="recevoir")]]

LGLexLefff :

exemple___N_an09_113_	nc-2m	100;Lemma;cf;<Suj:cln|sn>;cat=nc,@SujN-hum,lightverb=avoir;%default	# BASE CONSTR = N0 avoir Det N () [] <> ; 
orig base constr = N0 avoir Det N

exemple___N_dr2_131_	nc-2m	100;Lemma;cf;<Suj:cln|sn,Objà:à-sn>;cat=nc,@ObjàNhum,@SujNhum,lightverb=donner;%default	
Ex.: Max (montre+donne) l'exemple de la politesse à Luc	# BASE CONSTR = N0 donner Det N à N1 () [] <> ; 
orig base constr = N0 donner Det N à N1

bon exemple___N_dr3_53_	inv	100;Lemma;cf;<Suj:cln|sn,Objà:à-sn>;cat=nc,@ObjàNhum,@SujNhum,lightverb=donner;%default	# BASE CONSTR = N0 donner Det N à N1 () [] <> ; 
orig base constr = N0 donner Det N à N1

mauvais exemple___N_dr3_244_	inv	100;Lemma;cf;<Suj:cln|sn,Objà:à-sn>;cat=nc,@ObjàNhum,@SujNhum,lightverb=donner;%default	# BASE CONSTR = N0 donner Det N à N1 () [] <> ; 
orig base constr = N0 donner Det N à N1

Résultat de la fusion

Nouvelles entrées

Cette section étudie l'origine des nouveaux lemmes et des nouvelles formes fléchies, qui n'étaient pas présentes dans Morphalou2 et ont donc été ajoutées^[1].

Attention : un même lemme, ou une même forme fléchie, peut être issue de plusieurs lexiques à la fois.

65 581 lemmes, non présents dans Morphalou2, ont été ajoutés dans Morphalou3.

470 524 nouvelles formes fléchies, non présentes dans Morphalou2, ont été ajoutées dans Morphalou 3.1.

Remarque : Lorsqu'un lemme n'avait aucune forme fléchie, la forme lemmatique a été ajoutée comme forme fléchie, la majorité des formes n'ayant aucun lexique d'origine correspondent à ce cas.

Graphiques

Au total

Par catégories de lemme

Données

Nouveaux lemmes

Tableau 1. Origines des nouveaux lemmes (non présents dans Morphalou2)

Catégorie \ Lexique d'origine	Total	Dela	Dicollecte	Lefff	LGLex	LGLexLefff	Aucun
Toutes catégories confondues	65 581	52 330	18 438	11 705	1 428	1 379	3
Noms communs	43 311	36 067	11 337	7 717	466	221	0
Adjectifs qualificatifs	13 864	10 340	5 254	2 091	40	0	0
Verbes	5 972	4 514	1 340	818	103	1 158	2 (auxiliaires dupliqués)
Adverbes	1 707	1 196	264	599	816	0	0
Nombres	163	68	161	0	0	0	1 (« un »)
Interjections	159	88	41	66	0	0	0
Prépositions	204	23	9	179	3	0	0
Pronoms	63	19	7	56	0	0	0
Conjonctions	151	10	1	146	0	0	0
Déterminants	38	5	5	33	0	0	0
Aucune	19	0	19	0	0	0	0

Nouvelles formes fléchies

Tableau 2. Origines des nouvelles formes fléchies (non présentes dans Morphalou2)

Catégorie \ Lexique d'origine	Total	Dela	Dicollecte	Lefff	LGLex	LGLexLefff	Aucun
Toutes catégories confondues	470 524	378 876	126 414	83 032	1 643	25 774	20 590
Noms communs	108 643	80 430	33 034	21 114	0	690	9 897
Adjectifs qualificatifs	51 468	33 723	20 718	7 670	57	0	4 652
Verbes	306 156	262 553	71 782	52 546	120	25 084	5 405
Adverbes	2 558	1 867	563	806	1 462	0	151
Nombres	178	74	170	0	0	0	6
Interjections	240	100	55	68	0	0	62
Prépositions	360	36	16	321	3	0	2
Pronoms	159	56	30	130	0	0	11
Conjonctions	275	14	2	262	0	0	4
Déterminants	133	23	24	115	1	0	2
Aucune	354	0	20	0	0	0	334

Origines

Cette section étudie les lexiques d'origine de tous les lemmes et formes fléchies de Morphalou3 (celles présentes dans Morphalou2 et les nouvelles).

Attention : une entrée peut être présente dans plusieurs lexiques à la fois.

Croisements

Cette section étudie les entrées issues de plusieurs lexiques à la fois. Si une entrée est présente dans plusieurs lexiques, alors celle-ci a un indice de confiance a priori plus élevé.

Sur les 159 271 lemmes présents dans Morphalou3, 52% sont issus de plusieurs lexiques

Sur les 976 570 formes fléchies présentes dans Morphalou3, 59% sont issues de plusieurs lexiques.

Graphiques

Données

Lemmes présents dans plusieurs lexiques

Tableau 3. Lemmes issus de plusieurs lexiques

Catégorie \ Nombre exact de lexiques d'origine	Les 6 lexiques	5 lexiques	4 lexiques	3 lexiques	2 lexiques	1 lexique	Aucun (créé dans Morphalou3)	Nombre total de lemmes de Morphalou3
Toutes catégories confondues	8 168	5 862	29 774	16 563	22 354	76 547	3	159 271
Noms communs	6 085	578	21 523	9 612	13 566	50 874	0	102 238
Noms communs	« abasourdissement »	« abrupt »...	« abaca »...	« abaisse »...	« aalénien »...	« aba »...	0	102 238
Adjectifs qualificatifs	0	1 024	6 646	5 165	5 915	17 773	0	36 523
Adjectifs qualificatifs	0	« aboulique »...	« abaissable »...	« abaisseur »...	« aalénien »...	« abattant »...	0	36 523
Verbes	2 083	2 937	1 084	986	1 913	5 757	2	14 762
Verbes	« abasourdir »...	« abaisser »...	« abcéder »...	« aberrer »...	« abalourdir »...	« s'abader »...	« avoir »...	14 762
Adverbes	0	1 314	420	656	776	991	0	4 157
Adverbes	0	« abjectement »...	« absurdement »...	« abandonnément »...	« adent »...	« ablativo »...	0	4 157
Nombres	0	0	0	29	69	99	1	198
Nombres	0	0	0	« cent »...	« quatre-vingt »...	« six-vingt »...	« un »	198
Interjections	0	0	10	85	72	255	0	422
Interjections	0	0	« ah »...	« allô »...	« adieu »...	« acré »...	0	422
Prépositions	0	8	29	9	15	197	0	258
Prépositions	0	« après »...	« avant »...	« dessous »...	« fors »...	« maugré »...	0	258
Pronoms	0	0	33	14	12	62	0	121
Pronoms	0	0	« aucun »...	« auquel »...	« autre »...	« mien »...	0	121
Conjonctions	0	0	15	3	11	150	0	179
Conjonctions	0	0	« car »...	« comment »...	« afin que »...	« ergo »...	0	179
Déterminants	0	1	14	4	3	35	0	57
Déterminants	0	« le »	« ce »...	« certain »...	« divers »...	« icelui »...	0	57
Aucune	0	0	0	0	2	354	0	356
« ouais »	0	0	0	0	« vive »...

Formes fléchies présentes dans plusieurs lexiques

Tableau 4. Flexions issues de plusieurs lexiques

Catégorie \ Nombre exact de lexiques d'origine	Les 6 lexiques	5 lexiques	4 lexiques	3 lexiques	2 lexiques	1 lexique	Aucun (créé dans Morphalou3)	Nombre total de flexions de Morphalou3
Toutes catégories confondues	8	87 556	234 454	126 903	127 272	379 851	20 526	976 570
Noms communs	0	11 917	41 067	18 141	21 760	86 130	9 897	188 912
Noms communs	0	« abasourdissement »...	« abaca »...	« abaisse »...	« aalénien »...	« aaléniens »...	« à-bas »...	188 912
Adjectifs qualificatifs	0	855	21 493	14 501	15 546	41 923	4 652	98 970
Adjectifs qualificatifs	0	« aboulique »...	« abaissable »...	« abaisseur »...	« aalénien »...	« abattant »...	« aaronide »...	98 970
Verbes	8	73 617	171 327	93 705	88 590	249 765	5 405	682 417
Verbes	« courbaturer »...	« abaissasses »...	« abaissa »...	« abasourdisses »...	« abaisse »...	« abada »...	« abrègera »...	682 417
Adverbes	0	1 157	449	390	1 155	865	151	4 168
Adverbes	0	« abjectement »...	« absurdement »...	« abandonnément »...	« adent »...	« ablativo »...	« adoncque »...	4 168
Nombres	0	0	0	24	72	100	6	202
Nombres	0	0	0	« cent »...	« dix »...	« II »...	« six-vingt »...	202
Interjections	0	0	9	80	66	205	62	422
Interjections	0	0	« ah »...	« allô »...	« adieu »...	« acré »...	« bast »...	422
Prépositions	0	8	28	7	20	347	2	412
Prépositions	0	« après »...	« avant »...	« dessous »...	« fors »...	« contr' »...	« maugré »...	412
Pronoms	0	0	42	30	32	119	11	234
Pronoms	0	0	« aucun »...	« aucune »...	« auxquelles »...	« leurs »...	« m' »...	234
Conjonctions	0	0	15	2	11	265	4	297
Conjonctions	0	0	« car »...	« comment »...	« lorsqu' »...	« ergo »...	« afin de »...	297
Déterminants	0	2	24	23	19	111	2	181
Déterminants	0	« l' »	« ce »...	« cet »...	« certain »...	« au »...	« icelles »...	181
Aucune	0	0	0	0	1	21	334	356
« ouais »	0	0	0	0	« vive »...	« ab hoc et ab hac »...

Formats dans lesquels Morphalou3 est disponible

Morphalou3 est diffusé avec sa licence et sa documentation. Tous les fichiers sont codés en UTF-8.

Sauf pour le format MySQL, le lexique complet est diffusé :

Soit avec toutes les entrées du lexique dans un seul fichier.
Soit avec une répartion des entrées dans plusieurs fichiers, afin d'alléger la taille des fichiers à traiter et d'en faciliter l'ouverture par des logiciels. Dans ce cas, les entrées sont regroupées en 6 grandes catégories :
- Adjectifs qualificatifs (« adjective »)
- Adverbes (« adverb »)
- Noms communs (« commonNoun »)
- Mots grammaticaux, c'est-à-dire les nombres, les prépositions, les pronoms, les conjonctions et les déterminants (« grammaticalWords »)
- Interjections (« interjection »)
- Non catégorisées (« noCategory »)

Format TEI (XML)

Qu'est-ce que le format TEI ?

Text Encoding Initiative (TEI) est un consortium qui développe et maintient un standard pour les représentations de textes sous forme digitale.

Comment sont formatées les données de Morphalou3 ?

Pour Morphalou3, nous utilisons principalement le module « dictionaries ».

Le schéma XML RELAX NG est fourni.

Exemple 6. Entrée « exemple »

			<!-- commonNoun masculine "exemple" -->
			<entry xml:id="e26164">
				<form type="lemma" corresp="morphalou2-tlf#EXEMPLE{commonNoun} dela#exemple{N+z1} dicollecte#exemple{nom} lglex#N_an09_113{noun} lglexlefff#exemple___N_an09_113_{nc-2m} lefff#exemple{nc} lefff#exemple{ncpred}">
					<orth>exemple</orth>
					<pron>E g z a~ p l @</pron>
					<gramGrp>
						<pos>commonNoun</pos>
						<gen>masculine</gen>
					</gramGrp>
				</form>
				<form type="inflected" corresp="morphalou2-morphalou1#exemple dela#exemple dicollecte#exemple lglexlefff#exemple lefff#exemple">
					<orth>exemple</orth>
					<pron>E g z a~ p l @</pron>
					<gramGrp>
						<number>singular</number>
					</gramGrp>
				</form>
				<form type="inflected" corresp="morphalou2-morphalou1#exemples dela#exemples dicollecte#exemples lglexlefff#exemples lefff#exemples">
					<orth>exemples</orth>
					<pron>E g z a~ p l @</pron>
					<gramGrp>
						<number>plural</number>
					</gramGrp>
				</form>
			</entry>

Format LMF (XML)

Qu'est-ce que le format LMF ?

Lexical Markup Framework (LMF ou cadre de balisage lexical, en français) est le standard de l'Organisation internationale de normalisation (plus spécifiquement au sein de l'ISO/TC37) pour les lexiques du traitement automatique des langues (TAL). C'est le format de Morphalou2

Comment sont formatées les données de Morphalou3 ?

Morphalou3 est exporté selon l'ancien format de Morphalou2, avec quelques rajouts :

l'élément grammaticalSubCategory après grammaticalCategory
l'élément pronominalVariantOf en plus de spellingVariantOf et feminineVariantOf
l'élément locution
un ou plusieurs éléments originatingEntry pour chaque lemme, et chaque forme fléchie.

Exemple 7. Entrée « exemple »

		<lexicalEntry id="exemple_1">
		<formSet>
			<lemmatizedForm>
				<orthography>exemple</orthography>
				<grammaticalCategory>commonNoun</grammaticalCategory>
				<grammaticalGender>masculine</grammaticalGender>
				<originatingEntry target="morphalou2" originatingCategory="commonNoun">EXEMPLE, subst. masc.</originatingEntry>
				<originatingEntry target="dela" originatingCategory="N+z1">exemple</originatingEntry>
				<originatingEntry target="dicollecte" originatingCategory="nom">exemple</originatingEntry>
				<originatingEntry target="lglex" originatingCategory="noun">exemple</originatingEntry>
				<originatingEntry target="lglexlefff" originatingCategory="nc-2m">exemple___N_an09_113_</originatingEntry>
				<originatingEntry target="lefff" originatingCategory="nc">exemple</originatingEntry>
				<originatingEntry target="lefff" originatingCategory="ncpred">exemple</originatingEntry>
			</lemmatizedForm>
			<inflectedForm>
				<orthography>exemple</orthography>
				<grammaticalNumber>singular</grammaticalNumber>
				<originatingEntry target="morphalou2">exemple</originatingEntry>
				<originatingEntry target="dela">exemple</originatingEntry>
				<originatingEntry target="dicollecte">exemple</originatingEntry>
				<originatingEntry target="lglexlefff">exemple</originatingEntry>
				<originatingEntry target="lefff">exemple</originatingEntry>
			</inflectedForm>
			<inflectedForm>
				<orthography>exemples</orthography>
				<grammaticalNumber>plural</grammaticalNumber>
				<originatingEntry target="morphalou2">exemples</originatingEntry>
				<originatingEntry target="dela">exemples</originatingEntry>
				<originatingEntry target="dicollecte">exemples</originatingEntry>
				<originatingEntry target="lglexlefff">exemples</originatingEntry>
				<originatingEntry target="lefff">exemples</originatingEntry>
			</inflectedForm>
		</formSet>
	</lexicalEntry>

Format CSV (format texte pour logiciels tableurs)

Qu'est-ce que le format CSV ?

Comma-Separated-Values (CSV) est un format informatique ouvert représentant des données tabulaires sous forme de valeurs séparées par des virgules (ou autre séparateur). Un fichier CSV est un fichier texte, par opposition aux formats dits « binaires ». Chaque ligne du texte correspond à une ligne du tableau et les virgules correspondent aux séparations entre les colonnes. Les portions de texte séparées par une virgule correspondent ainsi aux contenus des cellules du tableau.

Ce format présente l'avantage de pouvoir être utilisé par des logiciels tableurs, comme Microsoft Excel ou LibreOffice Calc.

Comment sont formatées les données de Morphalou3 ?

Voici comment est composé le fichier CSV :

Les 14 premières lignes ne sont pas des données, mais l'entête du fichier.
Les lignes 15 et 16 sont les titres des colonnes. (Il y a 2 lignes de titre).
Les données commencent à la ligne 17. Une forme fléchie par ligne. (Détails ci-après.)

Exemple 8. Entête et lignes de titres

Voici la configuration pour l'importation dans LibreOffice Calc :

Voici les lignes du fichier CSV contenant les titres :

LEMME;;;;;;;;;FLEXION;;;;;;;;
GRAPHIE;ID;CATÉGORIE;SOUS CATÉGORIE;LOCUTION;GENRE;AUTRES LEMMES LIÉS;PHONÉTIQUE;ORIGINES;GRAPHIE;ID;NOMBRE;MODE;GENRE;TEMPS;PERSONNE;PHONÉTIQUE;ORIGINES

Pour Morphalou3, nous utilisons le point virgule (;) comme séparateur. Lemmes et formes fléchies sont regroupées pour en faciliter la lecture : en premier les informations sur le lemme et ensuite les informations sur la forme fléchie. Une ligne pour chaque forme fléchie. Si un lemme donne plusieurs formes fléchies, alors les informations sur le lemme ne sont pas répétées et les cases correspondantes sont vides, comme dans l'exemple 9 ci-dessous.

Exemple 9. Entrée « exemple »

Voici l'entrée du lemme « exemple » (2 formes fléchies donc 2 lignes):

exemple;26164;commonNoun;-;-;masculine;-;-;-;E g z a~ p l @;E g z a~ p l @;morphalou2 dela dicollecte lglex lglexlefff lefff;exemple;224747;singular;-;-;-;-;E g z a~ p l @;E g z a~ p l @;morphalou2 dela dicollecte lglexlefff lefff
;;;;;;;;;;;;exemples;224748;plural;-;-;-;-;E g z a~ p l @;E g z a~ p l @;morphalou2 dela dicollecte lglexlefff lefff

Voici enfin le résultat tel qu'affiché par le tableur LibreOffice Calc :

Base de données MySQL

Qu'est-ce que le format MySQL ?

MySQL est un système de gestion de bases de données relationnelles. Il est distribué sous licence GPL.

Comment sont formatées les données de Morphalou3 ?

Morphalou3 est disponible sous forme de 4 fichiers MySQL de création de table, un fichier pour chaque table de la base de données.

Le format MySQL de Morphalou3 conserve toutes les informations de tous les lexiques, et notamment toutes les entrées d'origine qui ont été utilisés pour constituer Morphalou3.

Remarque : Attention à importer d'abord le fichier lemma.sql puis le fichier inflection.sql puis les deux autres, afin de respecter les dépendances des clés étrangères.

Sur un serveur PHP, vous pouvez utiliser phpMyAdmin, interface web de gestion de SGBD MySQL pour importer la base de données Morphalou3.

Schéma relationnel

Voici le schéma relationnel de la base de données MySQL :

Description des données

lemma = Lemme

Le lemme est l'unité de base morpho-syntaxique.

lemmaID

Un numéro unique identifiant le lemme. (Les identifiants de Morphalou2 sont les mêmes dans Morphalou3.)

content

La valeur du lemme

category

L'étiquette de premier niveau du lemme (ou rien s'il n'y en a pas).

Les catégories possibles sont : 'commonNoun','verb','adjective','interjection','adverb','preposition','pronoun','determiner','conjunction' et 'numeral'.

subCategory

L'étiquette de second niveau du lemme, c'est-à-dire sa sous-catégorie (ou rien s'il n'y en a pas).

Les sous-catégories possibles sont : 'people', 'abbreviation','auxiliary','impersonal','defective','onomatopoeia','negation','determinant','adjective','demonstrative','possessive','personal','relative','indefinite','interrogative','exclamatory','definite','negative','subordination' et 'coordination'

gender

Le genre du nom :

« masculine » = masculin
« feminine » = féminin
« invariable » = invariable (identique au masculin et au féminin.)
non renseigné si le lemme n'est pas un nom ou si c'est l'un des trois noms dont le genre varie selon le nombre (voir Le genre d'une forme fléchie).

variantOf

Une référence vers le lemme original en cas de variante orthographique (ou rien si le lemme n'est pas une variante).

feminineOf

Si le lemme est un nom commun et la version féminine d'un autre lemme, alors ce champ est renseigné et est une réference vers le lemme masculin. Sinon ce champ n'est pas renseigné.

Attention il n'a pas été possible de détecter automatiquement selon la morphologie toutes les correspondances. Par exemple le nom « aire » n'est pas le féminin du nom « air », « fane » n'est pas le féminin de « fan », « fraise » n'est pas le féminin de « frais ». Ce champ n'est donc pas forcément renseigné chaque fois qu'il devrait l'être.

pronominalOf

Une référence vers le lemme original en cas de version pronominal d'un verbe (ou rien si le lemme n'est pas une variante pronominale d'un autre verbe).

phonetic1 et phonetic2

Des transcriptions phonétiques du lemme (ou rien si non renseigné).

processStatus

Un indicateur hérité de Morphalou2.

status

Un indicateur sur le lemme ajouté au passage à la version 3 de Morphalou.

L'état (ou statut) peut être 'verifiedManually' ou 'verifiedByScript' ou 'correctedByScript' ou 'correctedManually' ou 'toDelete' ou 'toComplete' (pour les verbes surtout) ou 'toStudy' ou 'incorrect' ou 'toVerifyManually' ou 'spelling1990'. Par défaut, le status est 'toStudy'.

inflection = Forme fléchie

Un lemme est décliné en une ou plusieurs formes fléchies.

inflectionID

Un numéro unique identifiant la forme fléchie. (Les identifiants de Morphalou2 sont les mêmes dans Morphalou3.)

lemmaID

L'identifiant du lemme dont est issue cette forme fléchie.

content

La valeur de la forme fléchie.

number

Le nombre de la forme fléchie, c'est-à-dire la distinction entre singulier et pluriel grammaticaux. Le nombre d'une forme fléchie est soit :

« singular » = singulier
« plural » = pluriel
« invariable » = invariable (la forme fléchie est identique au singulier et au pluriel.)
non renseigné si ce champ n'a pas lieu d'être : pour les participes présent et les infinitifs.

mood

Le mode d'un verbe :

« indicative » = indicatif
« participle » = participe (passé pou présent)
« subjunctive » = subjonctif
« imperative » = impératif
« infinitive » = infinitif
« conditional » = conditionnel
non renseigné si le lemme correspondant n'est pas un verbe.

gender

Le genre de la forme fléchie :

« masculine » = masculin
« feminine » = féminin
« invariable » = invariable (identique au masculin et au féminin.)
« neuter » = neutre (ni masculin, ni féminin.)
non renseigné si ce champ n'a pas lieu d'être.

Il est à noter que le genre d'un nom est défini dans sa forme fléchie — et non au niveau du lemme — pour les noms dont le genre varie selon le nombre, à savoir « amour », « délice » et « orgue ».

tense

Le temps auquel le verbe est conjugué :

« present » = présent
« future » = futur
« past » = passé
« imperfect » = imparfait
« simplePast » = passé simple
non renseigné si le lemme n'est pas un verbe.

person

La personne grammaticale à laquelle la forme fléchie fait référence :

« firstPerson » = première personne
« secondPerson » = deuxième personne
« thirdPerson » = troisième personne
non renseigné si ce champ n'a pas lieu d'être : c'est-à-dire si le lemme n'est ni un déterminant possessif, ni un pronom démonstratif, ni un pronom possessif, ni certaines formes fléchies d'un verbe.

phonetic1 et phonetic2

Idem que pour un lemme.

status

Idem que pour un lemme.

originatingLemma = Entrée d'origine d'un lemme

Un lemme a une ou plusieurs entrée(s) d'origine, c'est-à-dire un extrait d'un lexique décrivant ce lemme.

id

Un numéro unique identifiant l'entrée d'origine.

lemmaID

L'identifiant du lemme correspondant à cette entrée.

lexicon

Le nom du lexique dont a été extraite cette entrée, soit « morphalou2 », soit « dela », soit « dicollecte », soit « lglex », soit « lglexlefff ».

category

L'étiquette du lemme dans son lexique d'origine.

originatingInflection = Entrée d'origine d'une forme fléchie

Une forme fléchie peut avoir une ou plusieurs entrée(s) d'origine.

Idem que pour un lemme, mais sans la mention de la catégorie d'origine.

Quels lemmes font partie ou non de Morphalou3 ?

Les lemmes présents

Un même mot dans plusieurs catégories

Une même forme de mot peut apparaître dans plusieurs catégories. C'est-à-dire que l'on peut avoir plusieurs formes (lemmatiques ou formes fléchies) de catégories lexicales différentes et pourtant orthographiées de la même manière. Par exemple :

« un » peut être un déterminant (C'est un homme) ou un chiffre (Un homme et deux femmes).
« bon » peut être un nom (Les bons et les mauvais), un adjectif (Ce plat est bon) ou une interjection (Bon, finissons-en).
« porte » est ambigu comme forme fléchie (nom ou verbe conjugé), mais pas comme lemme (le verbe « porter » est différent du nom commun « porte »).

Les lemmes présents dans plusieurs catégories

Catégories multiples les plus courantes pour les lemmes

Nom commun + Adjectif : 11 873 lemmes concernés (Exemples : « clair »)
Nom commun + Verbe : 142 lemmes concernés (Exemples : « agir », « aller », « bûcher », « clocher », « poster »)
Nom commun + Adverbe : 115 lemmes concernés (Exemples : « alentour », « au-delà », « doublement », « environ »)
Nom commun + Interjection : 104 lemmes concernés - dont 33 onomatopées) (Exemples : « adieu », « amen », « attention », « stop »)
Nom commun + Adjectif qualificatif + Adverbe : 67 lemmes concernés (Exemples : « aidant », « bas », « beau », « juste »)
Adjectif qualificatif + Adverbe : 50 lemmes concernés (Exemples : « attenant », « cher », « perso », « sûr »)

Formes lemmatiques ayant 4 catégories

Nom commun + Adjectif qualitificatif + Adverbe + Préposition : « avant », « ci-devant », « passé », « pendant »
Nom commun + Adjectif qualificatif + Adverbe + Interjection : « arrière », « bis », « bon »
Adverbe + Conjonction de coordination + Conjonction de subordination + Préposition : « comme », « sinon »
Nom commun + Adjectif qualificatif + Déterminant indéfini + Pronom indéfini : « certain », « nul »
Nom commun + Adjectif qualificatif + Adverbe + Conjonction de subordination : « bref », « partant »
Nom commun + Déterminant indéfini + Pronom indéfini + Nombre : « un »
Nom commun + Adverbe + Conjonction de subordination + Pronom interrogatif : « pourquoi »
Adverbe de négation + Conjonction de subordination + Pronom interrogatif + Pronom relatif : « que »
Nom commun + Adjectif qualificatif + Adverbe + Pronom indéfini : « même »

Formes lemmatiques ayant 5 catégories

Nom commun + Adjectif qualificatif + Adverbe + Déterminant indéfini + Pronom indéfini : « tout »
Nom comment + Adverbe + Conjonction de subordination + Interjection + Pronom interrogatif : « comment »

Les formes fléchies présentes dans plusieurs catégories

Une même orthographe de forme fléchie peut se retrouver dans des lemmes différents. Par exemple « croissant » peut être un nom commun, un adjectif ou le participe présent du verbe « croître » ou la variante « croitre » issue des rectifications orthographiques du français en 1990 (voir le chapitre sur les variantes orthographiques).

De même pour les verbes qui existent sous la forme pronominale et non pronominale. Il existe un lemme commençant par « se » et un lemme ne commençant pas par « se », cependant leurs formes fléchies auront la même orthographe. Par exemple : « s'endormir » et « endormir » auront tout deux les formes fléchies « endormis », « endormons », etc.

Catégories multiples les plus courantes pour les formes fléchies

Adjectif qualificatif + Nom commun + Verbe + Verbe : 136 formes fléchies (Exemples : « accru », « ascendant », « cannelle », « croissant », « frite »)
Adjectif qualificatif + Adjectif qualificatif + Nom commun + Nom commun : 71 formes fléchies concernées (Exemples : « acéracées », « antirides », « fol », « néo-fasciste », « partageuse »).

Remarque : En fait, la plupart de ces formes fléchies sont issues de lemmes dupliqués - à tort ou à raison - et les lemmes possiblement dupliqués devraient être étudiés au cas par cas pour décider s'ils doivent être réunis ou non (Exemple : lemmes « acéracées » et « acéracée », lemmes « fol » et « fou ».
Adjectif qualificatif + Nom commun + Nom commun + Verbe : 53 formes fléchies concernées (Exemples : « alliés », « barbes », « bouffes », « facilitées »)

Même remarque que ci-dessus
Adjectif qualificatif + Adjectif qualificatif + Nom commun + Verbe : 23 formes fléchies concernées) (Exemples : « affine », « converse », « patronne », « surprise »)

Remarque : Une partie de ces formes fléchies sont dûes à une erreur de rattachement des formes fléchies aux noms communs - qui ont un lemme féminin et un lemme masculin (voir la section suivante). Par exemple, « patronnes » ne devrait pas être une forme fléchie du lemme « patron », mais uniquement du lemme « patronne »

Un nom commun féminin est un lemme à part entière

Pour les noms communs existant au masculin et au féminin :

Si le féminin est différent du masculin : on distingue deux lemmes, l'un masculin et l'autre féminin (avec une référence vers le lemme masculin). Par exemple « acheteuse » est le féminin d'« acheteur ».
Si le féminin et le masculin sont identiques : on a a un seule lemme de genre invariable. Par exemple « extra-terrestre » est de genre invariable (un extra-terrestre ou une extra-terrestre.)

Les variantes orthographiques

Les variantes orthographiques d'un lemme devraient être présentes comme lemmes à part entière avec mention du lemme d'origine (via le champ « variantOf »).

Sont acceptées notamment les rectifications orthographiques du français de 1990. Par exemple :

Le verbe « abimer » est une variante de « abîmer ».
Le verbe « accroitre » est une variante de « accroître ».

Voici d'autres variantes non issues de la rectification de 1990 :

« béqueter » et « bèqueter » sont des variantes orthographiques de « becqueter ».
« bouloter » est une variante de « boulotter ».
Le nom commun « abattage » est la variante de « abatage ».
L'adverbe « affetuoso » est la variante de « affettuoso ».
L'interjection « allô » est la variante de « allo ».
L'interjection « pschtt » est la variante de « pscht ».
Les adverbes « chouia » et « chouya » sont des variantes de « chouïa ».

Les verbes pronominaux

Les verbes pronominaux commencent par « se » et mentionnent le lemme non pronominal s'il existe. Les formes fléchies ne contiennent pas de pronoms.

Par exemple : dans Morphalou3 existent le verbe « blottir » et le verbe pronominal « se blottir » (dont le champ « pronominalOf » fait référence au verbe « blottir »). Les formes fléchies de ces deux verbes sont de type « blottir », « blottira », « blottirai », etc.

Les mots tronqués

Les mots tronqués sont les mots amputés d'une partie de ce qui les constitue comme mots, sans pour autant que leur interprétation en soit nécessairement affectées. Ces mots tronqués ont des formes diverses, appartiennent surtout à la langue orale familière, et certains n'ont pas de formes écrites bien fixées.

On peut les classer comme abréviations, avec une référence vers le nom complet.

Exemples : le lemme « gynéco » est classé comme abbréviation et comme variante du nom commun (masculin) « gynécologue ». De même « démago » est l'abbréviation de « démagogue »

Les lemmes non souhaités

Les préfixes et suffixes

Morphalou ne devrait pas contenir de préfixes, ni de suffixes.

DELA et Dicollecte contiennent des préfixes (catégorie « PFX » dans DELA et « pfx » dans Dicollecte). Ils n'ont pas été importés dans Morphalou3.

Exemples : « néo » ; « aéro » ; « cellulo » ; « alcoolo » ; « bi » ; « hétéro » ; « mini » ; « ortho » ; « acéto » ; « absdomino » ; « académico »

On peut trouver certains de ces préfixes dans Morphalou 2 et donc dans Morphalou3, étiquetés comme noms communs ou adjectifs. Certains ne sont que des préfixes, comme « aéro », d'autres existent à part entière, comme l'adjectif « mini ».

Les noms propres

Les noms propres n'ont pas leur place dans Morphalou, mais dans Prolex (base multilingue de noms propres.) http://cnrtl.fr/lexiques/prolex

Les cas plus ambigus

Les groupes nominaux et locutions

Certaines locutions font partie de Morphalou3, issues de Morphalou2 et du Lefff. Un marquage a été fait des lemmes étant des locutions, à partir d'une recherche automatique sur le Wiktionnaire.

De quoi parle-t-on ?

Voici des exemples de ce que sont des locutions et groupes nominaux :

Locutions adverbiales : « en revanche » ; « par contre »
Locutions verbales : « faire florès » ; « avoir beau »
Locutions nominales : « à l'eau » ; « par rapport à »
Locutions prépositionnelles : « à partir »
Groupe nominal : « étude de marché », « éducation physique »

Pourtant, certaines unités lexicales devraient être présentes comme lemmes à part entière. C'est le cas des :

mots composés : « roman-photo », « rouge-gorge » ; « sèche-cheveux » ; « aigre-doux » ; « lance-missiles » ; « laisser-faire » ; « en-tête »
locutions ne pouvant être employées séparément, souvent latines : « a priori »
conglomérés : « main-d'oeuvre », « pied-à-terre », « va-nu-pieds », « va-et-vient », « à la va-vite »
synapsies, c'est-à-dire certains composés constituant un groupe entier de lexèmes et formant une désignation constante et spécifique : « pomme de terre » ; « robe de chambre » ; « clair de lune » ; « armoire à provisions » ; « machine à écrire » ; « avion à réaction »...

Qu'en est-il dans Morphalou3 ?

Les mots contenant des espaces n'ont pas été importés depuis DELA, Dicollecte, LGLex et LGLexLefff. Par contre, ces mots présents dans Morphalou2 n'ont pas été supprimés dans la version 3 qui comporte encore des lemmes contenant des espaces, dont certains sont clairement des locutions :

un nombre : « trente-six mille », issu de locutions.
des adverbes : « autour de » , « contre-mont à »
des adjectifs qualificatifs : « en suspens », « amiable à l' »
toutes les conjonctions n'ayant pas de sous-catégories : « afin de », « afin que », « c'est-à-dire que »
Mais la plupart de ces lemmes se retrouvent sans catégorie : « affile d' », « affilée d' », « à l'envers », « à pic »

Et d'autres ont leur place dans Morphalou :

deux verbes : « rock and roller » et « pique niquer », variante de « pique-niquer »
des interjections : « ho! ho! », « oh la la », « plan plan »
des adjectifs qualificatifs: « ad hoc », « ex abrupto »
des noms communs : « agnus dei », « à priori », « alter ego »
des lemmes sans catégorie : « ab intestat »

Bref, cela fait environ 400 lemmes restant à étudier au cas par cas.

Jeu d'étiquettes

Un nouveau jeu d'étiquettes a été créé pour catégoriser les lemmes de la version 3 de Morphalou. Il s'agit d'un classement à deux niveaux :

une catégorie
éventuellement une sous-catégorie

Il est à noter qu'après classification, certains lemmes restent sans catégorie.

Les mots ayant plusieurs catégories sont étudiés dans le chapitre précédent Un même mot dans plusieurs catégories.

Ce jeu d'étiquettes est mis en correspondance avec d'autres jeux d'étiquettes :

L'étiqueteur MarsaTag (http://sldr.org/voir_depot.php?lang=fr&id=841)
L'étiqueteur morpho-syntaxique TreeTagger (http://www.cis.uni-muenchen.de/~schmid/tools/TreeTagger/)
Le format générique MULTEXT (http://aune.lpl-aix.fr/projects/multext/lex/LEX2_3.html)

On distingue deux grands ensembles de lemmes :

les mots lexicaux
Ce sont les noms, les verbes, les adjectifs qualificatifs, les adverbes et les interjections. Ils sont en très grand nombre, de longueur variable et peuvent être créés s'il y a besoin. Certains mots lexicaux peuvent être remplacés par des pronoms.
les mots grammaticaux ou mots-outils
Ce sont les mots dont le rôle syntaxique est plus important que le rôle sémantique. Ils incluent les articles, les déterminants, les pronoms, les prépositions et les adjectifs non qualitatifs. Ils n'ont qu'une seule fonction. Ils sont limités en nombre, la création de nouveaux mots grammaticaux est très rare, ils sont fréquents et peu précis. Ils ne peuvent pas être remplacés par des pronoms. Les mots grammaticaux sont souvent très courts.

Les mots lexicaux

Morphalou 3.1 contient :

102 238 noms communs - 188 912 formes fléchies
36 523 adjectifs qualificatifs - 98 970 formes fléchies
14 762 verbes - 682 417 formes fléchies
4 157 adverbes - 4 167 formes fléchies
422 interjections - 422 formes fléchies

Voici un tableau récapitulatif décrivant les 4 catégories de mots lexicaux de Morphalou3, leurs lexiques d'origine, et leurs correspondances avec d'autres jeux d'étiquettes.

La colonne « Lemme » indique les informations relatives au lemme (la forme canonique) tandis que « Forme(s) fléchie(s) » indique les informations relatives aux déclinaisons et conjugaisons de ce lemme.

Tableau 5. Les mots lexicaux dans Morphalou3

Morphalou3								Lexiques d'origine (lexique(s) ayant défini l'étiquette)	Correspondances
Catégorie	Sous-catégorie	Code	Description	Quantité	Exemples	Lemme	Forme(s) fléchie(s)	Lexiques d'origine (lexique(s) ayant défini l'étiquette)	MarsaTag	TreeTagger	MULTEXT
commonNoun	∅	NOUN	Les noms communs. Les féminins sont des lemmes à part entière. Les noms propres ne font pas partie de Morphalou.	100 317	Ce service a cinq cents abonnés et deux cents abonnées. (Lemmes « service », « abonné » et « abonnée ») La salle était éclairée par deux ampoules sans abat-jour. (Lemmes « salle », « ampoule » et « abat-jour ») Il vous cédera le tout pour un prix raisonnable. Nous avons déjeuné pour quelques cents. (Lemme « cent ») Soutenir le pour et le contre. Quitter le certain pour l'incertain.	genre éventuellement référence vers le lemme masculin	2 formes fléchies : au singulier et au pluriel (ou 1 seule forme fléchie si invariant en nombre)	74 694 DELA 58 949 Morphalou2 43 102 Dicollecte 39 870 Lefff 7 138 LGLex 6 623 LGLexLefff	Nc	NOM	Noun
	people	NOUN:peo	Tous les gentilés.	1 759	Les Allemands et les Allemandes sont les habitants de l'Allemagne. (Lemmes « Allemand » et « Allemande ») Le Tiers-monde est l'ensemble des pays en développement. Dans ce temps-là le Tout-Paris se composait de cette élite d'hommes chargés de façonner l'opinion des autres.	genre éventuellement référence vers le lemme masculin		1 759 DELA 10 Dicollecte 1 Lefff		∅
	abbreviation	NOUN:abb	Toutes les abréviations	162	Les ARN ribosomiques ou ARNr sont produits à partir de gènes codés dans l'ADN. J'ai couru dix kilomètres, je suis KO. Mets un CD dans le lecteur.	∅	1 forme fléchie	80 Lefff 48 Morphalou2 35 Dicollecte 23 DELA 1 LGLex 1 LGLexLefff		ABR
adjective	∅ ou abbreviation	ADJ	Tous les adjectifs qualificatifs. Le féminin d'un adjectif est une forme fléchie du lemme masculin.	36 523	Bien des fruits étaient préparés à l’aigre-doux. Je suis certain qu’il réussira. Il n’y a pas qu’en Allemagne qu’on utilise des mots allemands et des expressions allemandes. (Lemme « allemand ») Il est abonné à toutes les revues scientifiques. (Lemmes « abonné » et « scientifique »)	∅	2 ou 4 formes fléchies variant en nombre et/ou genre, ou 1 seule si invariable.	24 639 DELA 22 659 Morphalou2 18 073 Dicollecte 10 139 Lefff 1 292 LGLex	Af	ADJ	Adjective
verb	∅	VERB	Les verbes.	14 712	Il s'est déjà abonné à cette revue. (Lemme « abonner ») Vouloir c'est pouvoir . Il sous-loue son appartement. (Lemme « sous-louer ») Il se blottit dans mes bras. (Lemme « se blottir ») Je m'absente quelques minutes. (Lemme « s'absenter ») Dans le Doubs, absinthe-toi. (Lemme « s'absinther ») J'agirai pour ton bien. (Lemme « agir ») Je pense donc je suis. (Lemme « être ») J'ai du bon tabac. (Lemme « avoir »)	référence vers le lemme non pronominal s'il existe	Généralement 51 formes fléchies	11 968 DELA 8 760 Morphalou2 7 687 Dicollecte 6 751 LGLexLefff 6 368 LGLexLefff 2 369 LGLex	Vm-	VER...	Verb
	defective	VERB:def	Les verbes défectifs	30	Elle laisse accroire qu’elle n’est pas affectée, mais il n’en est rien. Il appert des dépositions des témoins que le crime a eu lieu à 3 heures. (Lemme « apparoir ») Ci-gisent tous les rêves de l'ambition, toutes les conquêtes de la gloire guerrière. (Lemme « gésir ») Une vache qui paissait l’herbe abroutie du talus, leva son mufle vers lui. (Lemme « paître » ou « paitre »)		En moyenne 26 formes fléchies	25 DELA 25 Dicollecte 25 Lefff 24 Morphalou2 17 LGLexLefff 3 LGLex
	impersonal	VERB:imp	Les verbes impersonnels	18	Cette tâche vous incombe. (Lemme « incomber ») Il neige. (Lemme « neiger ») Il pleut. (Lemme « pleuvoir ») Il pleuvote. (Lemme « pleuvoter ») Ça urge. (Lemme « urger ») Il ne s'agit pas de ça. (Lemme « s'agir »)		En moyenne 23 formes fléchies	15 DELA 9 Dicollecte 6 Morphalou2 5 Lefff 3 LGLexLefff
	auxiliary	VERB:aux	Les auxiliaires : avoir et être. Attention ces deux verbes existent également comme non auxiliaires.	2	La porte s'est refermée. (Lemme « être ») J'ai fermé la porte. (Lemme « avoir »)	référence vers le lemme non auxiliaire (l'auxiliaire est enregistré comme une variante)	Les formes fléchies sont dupliquées du lemme non auxiliaire.		Va- (auxiliaire avoir) et Ve- (auxiliaireêtre)
adverb	∅ ou abbreviation	ADV	Les adverbes.	4 144	Un arbre tout en fleur. J'étais quelque peu gêné. Sa bonne humeur alla si bien crescendo Et certainement on ne saurait assez plaindre la perte de ces excellents originaux.	∅	1 forme fléchie (sauf « ne »/« n' » (adverbe de négation), « quelque »/« quelque » « tout »/« toute »/« tous »/« toutes », etc)	3 392 DELA 2 883 LGLex 2 442 Morphalou2 2 038 Lefff 1 949 Dicollecte	R-	ADV	Adverb
adverb	negation	ADV:neg	Tous les adverbes de négation.	13	Je crains qu'il ne vienne N'est-elle pas jolie ? (Lemmes « ne » et « pas »)	∅		11 Lefff 8 Morphalou2 8 DELA 8 Dicollecte 1 LGLex	Rn (adverbes de négation) et Rd (adverbes associés à la négation)	ADV	Adverb
interjection	∅ ou abbreviation	INTER	Toutes les interjections.	354	Adieu, je m’en vais. Ah ! Que cela est beau ! Aha, c’est là que tu te cachais ! Allô, qui est à l'appareil? Ce plat a l'air délicieux. Miam-miam !	∅	1 forme fléchie.	195 Morphalou2 184 DELA 125 Dicollecte 75 Lefff	I	INT	Interjection
interjection	onomatopoeia	INTER:ono	Toutes les onomatopées.	68	Ça a fait boum et les vitres ont volé en éclat. On entendait « flic-flac... flic-flac ». Ça clapotait. Tous les insectes ça fait crac quand on les écrase. Dring dring ! Ça sonne !	∅	1 forme fléchie.	68 Morphalou2 23 DELA 21 Dicollecte	I	INT	Interjection

Les mots grammaticaux / mots-outils

Morphalou3 contient :

258 prépositions - 412 formes fléchies
198 nombres - 202 formes fléchies
179 conjonctions - 297 formes fléchies
121 pronoms - 234 formes fléchies
57 déterminants - 181 formes fléchies
et 356 lemmes non catégorisés - 356 formes fléchies

Voici un tableau récapitulatif décrivant les 5 catégories de mots grammaticaux de Morphalou3, leurs lexiques d'origine, et leurs correspondances avec les étiqueteurs et catégories génériques.

La colonne "Lemme" indique les informations relatives au lemme spécifiques à la catégorie décrite.

Tableau 6. Les mots grammaticaux dans Morphalou3

Morphalou3								Lexiques d'origine (lexique(s) ayant défini l'étiquette)	Correspondances
Catégorie	Sous-catégorie	Code	Description	Quantité	Exemples	Lemme	Forme(s) fléchie(s)	Lexiques d'origine (lexique(s) ayant défini l'étiquette)	MarsaTag	TreeTagger	MULTEXT
preposition	∅ ou abbreviation	PREP	Toutes les prépositions.	254	Nous allons déjeuner, après quoi nous nous mettrons en route. Chacun est maître chez soi. Il nage contre le courant. On n’aurait jamais pensé qu’il s’abaisserait jusque là.	∅	1 forme fléchie (ou 2 si variante exemple "jusque" "jusqu").	219 Lefff 65 DELA 55 Dicollecte 54 Morphalou2 11 LGLex	SD-	PRP	Adposition
	adjective	PREP:adj	Préposition + déterminant	2	À l'expériation dudit délai. Permettons auxdits barbiers-baigneurs, étuvistes, perruquiers, de faire savonnettes, poudres de senteurs, pâtes et autres choses semblables pour leur usage.		1, 2, 3 ou 4 variant en nombre et genre	2 DELA 1 Dicollecte	Sd ou D-
	determinant	PREP:det	Préposition + article	2	Je vais au marché. Il faut boire du lait tous les jours.		1, 2, 3 ou 4 variant en nombre et genre	2 DELA 1 Dicollecte
numeral	∅	NUM	Tous les chiffres, c'est-à-dire les adjectifs numéraux cardinaux	198	Quatre pommes, une poire et un ananas. (Lemmes « quatre » et « un ») Jamais deux sans trois. Il y a cent années dans un siècle. Un vieillard de quatre-vingt ans. Henri IV a été roi de France.	∅	1 seule forme fléchie (sauf pour le lemme « un » qui varie en genre et le lemme « quatre-vingt » qui peur aussi s'écrire « quatre-vingts »)	191 Dicollecte 98 DELA 35 Morphalou2	Ak	NUM	Numeral
conjunction	subordination	CONJ:sub	Toutes les conjonctions de subordinations	139	Elle l'examina longtemps, comme pour s'assurer que c'était bien lui. Lorsqu’il pleut, les oiseaux se taisent. Puisque je vous le dis ! Ton récit est très bien, quoiqu'un peu court. Il ne se préoccupe de rien, sinon de manger et de boire.	∅	1 forme fléchie.	132 Lefff 17 DELA 17 Morphalou2 9 Dicollecte	Cs	KON	Conjunction
conjunction	coordination	CONJ:coo	Toutes les conjonctions de coordination	40	Il dit qu'il connaît parfaitement Marseille, mais il n'y est allé qu'une seule fois. J’irais à la piscine lundi ou mercredi. Comment et pourquoi ? Je pense, donc je suis. Vous savez bien ce qu'on appelle un dada, c’est-à-dire une idée fixe qui vous revient toujours en tête	∅	1 forme fléchie.	35 Lefff 11 Morphalou2 10 DELA 10 Dicollecte	Cc	KON	Conjunction
pronoun	indefinite	PRON:ind	Les pronoms indéfinis	38	Je n'en ai retrouvé aucun. Personne ne m'avait prévenu. Beaucoup de bruit pour rien. Nul n’avait chance d’échapper. Ils arrivent par vagues successives, puis certains repartent dans leur pays. (Lemme « certain ») Il est capable de tout.	∅	1 à 4 formes fléchies variant éventuellement en nombre et/ou genre	34 Lefff 11 Morphalou2 10 DELA 7 Dicollecte	Pi	PRO:IND	Pronoun
	interrogative	PRON:int	Les pronoms interrogatifs	12	J'ai deux photos. Laquelle veux-tu ? (Lemme « lequel ») Qui va là ? De quoi se mêle-t-il ? Quel est donc ton problème ? Alors, quid du rôle du revolver du père Jacques dans le drame?			11 Lefff 5 DELA 5 Morphalou2 4 Dicollecte	Pt	PRO
	relative	PRON:rel	Les pronoms relatifs	9	Souviens-toi du match de football auquel j'avais participé. Les Champs-Élysées, au coin desquels était le magasin. (Lemme « duquel ») Il appartient au monsieur dont je t'ai parlé hier. Les sonnets et les ballades où sa jeune verve s'était d'abord essayée.			7 Lefff 6 DELA 4 Dicollecte 4 Morphalou2	Pr	PRO:REL
	demonstrative	PRON:dem	Les pronoms démonstratifs	9	Par quelle allée va-t-on passer ? Par celle-ci ? Par celle-là ? (Lemmes « celui-ci » et « celui-là ») Pourra pareillement le mari, du consentement de sa femme, et après avoir pris l'avis des quatre plus proches parens d'icelle réunis en assemblée. (Lemme « icelui ») Cela va de soi. Tout mais pas ça. Lucie donne-moi de la tisane, donne-moi ci, donne-moi ça.			9 Morphalou2 8 DELA 8 Lefff 7 Dicollecte	Pd	∅
	personal	PRON:per	Les pronoms personnels	42	Il dit : « Tiens! Tu travailles ? » Je répondis : « J'écris Paludes » (Lemmes « il », « tu » et « je ») Maintenant, moi, j'ai fait mon devoir; voyons si les autres feront le leur Il est si sûr de lui-même Parmi vos paroissiens (...), en voyez-vous quelqu'un ou quelqu'une que je puisse inviter aussi? (Lemmes « vous », « quelqu'un » et « je »)		1 à 4 formes fléchies variant éventuellement en nombre et en genre, avec mention de la personne (première, deuxième ou troisième personne).	33 DELA 26 Dicollecte 26 Lefff 24 Morphalou2	Pp...	PRO:PER
	possessive	PRON:pos	Les pronoms possessifs	11	Les machines diminuent votre salaire, mais elles augmentent le mien. Ma voiture est en panne, prenons la tienne. (Lemme « tien ») Votre serviteur, monsieur. − Le vôtre, monsieur le curé, répliqua Durtal, en s'éloignant			6 Lefff 5 Morphalou2	Ps	PRO:POS
determiner	indefinite	DET:ind	Les adjectifs indéfinis et articles partitifs	40	Je cherche un livre. Certains élèves sont absents. (Lemme « certain ») À chaque jour suffit sa peine. Le complet de serge laissait voir maintes traces d’usure. (Lemme « maint ») Il restera quelque temps. Que sait-il ? Nulle chose. (Lemme « nul ») Tout ouvrier participe à la réussite de l'entreprise.		1,2,3 ou 4 formes fléchies variant en nombre et en genre	34 Lefff 14 DELA 11 Dicollecte 9 Morphalou2	Ai		Determiner
	demonstrative	DET:dem	Les adjectifs démonstratifs	5	Cet avion a sa place exacte dans ce hangar. (Lemme « ce ») Nazareth. Aucune ville ou bourgade de ce nom n’existe au Ier siècle de notre ère, pas davantage en Galilée qu’ailleurs. (Alors que je la vois, icelle ville ou bourgade, venir s’intégrer dans tous les Atlas du Nouveau Testament…) (Lemme « icelui »)			4 Lefff 2 Morphalou2 1 Dicollecte 1 DELA	?	∅
	definite	DET:def	Les articles définis.	4	Le pharaon se leva. Il vient du nord. Paris est la ville des villes. (Lemme « le ») Une remise en état du pont de la République devant être effectuée de toute urgence, le passage des véhicules à moteur sera interdit sur ledit pont pendant quinze jours. (Lemmes « le » et « ledit »)			4 Dicollecte 2 Lefff 1 Morphalou2 1 DELA 1 LGLex	?	DET:ART
	exclamatory	DET:exc	Les adjectifs exclamatifs	1	Quelle histoire !			1 DELA 1 Dicollecte 1 Morphalou2 1 Lefff	?	∅
	possessive	DET:pos	Les adjectifs possessifs	7	Mon père et ma mère m'ont dit de faire comme ça. (Lemme « mon ») Vous épouserez de riches fermiers; vous serez très occupées par vos bestiaux et vos poules et vous nous oublierez tous. (Lemme « votre ») Noël est notre fête, à nous, enfants. Ils partageraient leur temps entre la rédaction de leur livre, le jardinage et la peinture murale		Indication sur la personne en plus	7 Lefff 6 Dicollecte 6 Morphalou2 6 DELA	As	DET:POS
∅	∅ ou abbreviation	XXX	Toutes les autres mots grammaticaux. La plupart sont des locutions ou des parties de locutions, latines ou françaises. (Voir le chapitre sur les cas ambigus)	356	Voici quelques exemples de lemmes non classés : « ouais » « vive » « ab hoc et ab hac » « à contre-lumière » « bras-le-corps »	∅	1 forme fléchie.	337 Morphalou2 21 Dicollecte	?	∅	∅

Données statistiques

Les données statistiques sont détaillées sur cette page. (Attention cette page contient plus de 100 000 lignes et est par conséquent longue à afficher.)

Conjugaisons

Pour chaque verbe, vous pouvez visualiser les conjugaisons sur : cette page.

Lesser General Public License For Linguistic Resources

Preamble

The licenses for most data are designed to take away your freedom to share and change it. By contrast, this License is intended to guarantee your freedom to share and change free data--to make sure the data are free for all their users.

This license, the Lesser General Public License for Linguistic Resources, applies to some specially designated linguistic resources -- typically lexicons, grammars, thesauri and textual corpora.

TERMS AND CONDITIONS FOR COPYING, DISTRIBUTION AND MODIFICATION

0. This License Agreement applies to any Linguistic Resource which contains a notice placed by the copyright holder or other authorized party saying it may be distributed under the terms of this Lesser General Public License for Linguistic Resources (also called "this License"). Each licensee is addressed as "you".

A "linguistic resource" means a collection of data about language prepared so as to be used with application programs.

The "Linguistic Resource", below, refers to any such work which has been distributed under these terms. A "work based on the Linguistic Resource" means either the Linguistic Resource or any derivative work under copyright law: that is to say, a work containing the Linguistic Resource or a portion of it, either verbatim or with modifications and/or translated straightforwardly into another language. (Hereinafter, translation is included without limitation in the term "modification".)

"Legible form" for a linguistic resource means the preferred formst of the resource for making modifications to it.

Activities other than copying, distribution and modification are not covered by this License; they are outside its scope. The act of running a program using the Linguistic Resource is not restricted, and output from such a program is covered only if its contents constitute a work based on the Linguistic Resource (independent of the use of the Linguistic Resource in a tool for writing it). Whether that is true depends on what the program that uses the Linguistic Resource does.

1. You may copy and distribute verbatim copies of the Linguistic Resource as you receive it, in any medium, provided that you conspicuously and appropriately publish on each copy an appropriate copyright notice and disclaimer of warranty; keep intact all the notices that refer to this License and to the absence of any warranty; and distribute a copy of this License along with the Linguistic Resource.

You may charge a fee for the physical act of transferring a copy, and you may at your option offer warranty protection in exchange for a fee.

2. You may modify your copy or copies of the Linguistic Resource or any portion of it, thus forming a work based on the Linguistic Resource, and copy and distribute such modifications or work under the terms of Section 1 above, provided that you also meet all of these conditions:

a) The modified work must itself be a linguistic resource.

b) You must cause the files modified to carry prominent notices stating that you changed the files and the date of any change.

c) You must cause the whole of the work to be licensed at no charge to all third parties under the terms of this License.

These requirements apply to the modified work as a whole. If identifiable sections of that work are not derived from the Linguistic Resource, and can be reasonably considered independent and separate works in themselves, then this License, and its terms, do not apply to those sections when you distribute them as separate works. But when you distribute the same sections as part of a whole which is a work based on the Linguistic Resource, the distribution of the whole must be on the terms of this License, whose permissions for other licensees extend to the entire whole, and thus to each and every part regardless of who wrote it.

Thus, it is not the intent of this section to claim rights or contest your rights to work written entirely by you; rather, the intent is to exercise the right to control the distribution of derivative or collective works based on the Linguistic Resource.

In addition, mere aggregation of another work not based on the Linguistic Resource with the Linguistic Resource (or with a work based on the Linguistic Resource) on a volume of a storage or distribution medium does not bring the other work under the scope of this License.

3. A program that contains no derivative of any portion of the Linguistic Resource, but is designed to work with the Linguistic Resource (or an encrypted form of the Linguistic Resource) by reading it or being compiled or linked with it, is called a "work that uses the Linguistic Resource". Such a work, in isolation, is not a derivative work of the Linguistic Resource, and therefore falls outside the scope of this License.

However, combining a "work that uses the Linguistic Resource" with the Linguistic Resource (or an encrypted form of the Linguistic Resource) creates a package that is a derivative of the Linguistic Resource (because it contains portions of the Linguistic Resource), rather than a "work that uses the Linguistic Resource". If the package is a derivative of the Linguistic Resource, you may distribute the package under the terms of Section 4. Any works containing that package also fall under Section 4.

4. As an exception to the Sections above, you may also combine a "work that uses the Linguistic Resource" with the Linguistic Resource (or an encrypted form of the Linguistic Resource) to produce a package containing portions of the Linguistic Resource, and distribute that package under terms of your choice, provided that the terms permit modification of the package for the customer's own use and reverse engineering for debugging such modifications.

You must give prominent notice with each copy of the package that the Linguistic Resource is used in it and that the Linguistic Resource and its use are covered by this License. You must supply a copy of this License. If the package during execution displays copyright notices, you must include the copyright notice for the Linguistic Resource among them, as well as a reference directing the user to the copy of this License. Also, you must do one of these things:

a) Accompany the package with the complete corresponding machine-readable legible form of the Linguistic Resource including whatever changes were used in the package (which must be distributed under Sections 1 and 2 above); and, if the package contains an encrypted form of the Linguistic Resource, with the complete machine-readable "work that uses the Linguistic Resource", as object code and/or source code, so that the user can modify the Linguistic Resource and then encrypt it to produce a modified package containing the modified Linguistic Resource.

b) Use a suitable mechanism for combining with the Linguistic Resource. A suitable mechanism is one that will operate properly with a modified version of the Linguistic Resource, if the user installs one, as long as the modified version is interface-compatible with the version that the package was made with.

c) Accompany the package with a written offer, valid for at least three years, to give the same user the materials specified in Subsection 4a, above, for a charge no more than the cost of performing this distribution.

d) If distribution of the package is made by offering access to copy from a designated place, offer equivalent access to copy the above specified materials from the same place.

e) Verify that the user has already received a copy of these materials or that you have already sent this user a copy.

If the package includes an encrypted form of the Linguistic Resource, the required form of the "work that uses the Linguistic Resource" must include any data and utility programs needed for reproducing the package from it. However, as a special exception, the materials to be distributed need not include anything that is normally distributed (in either source or binary form) with the major components (compiler, kernel, and so on) of the operating system on which the executable runs, unless that component itself accompanies the executable.

It may happen that this requirement contradicts the license restrictions of proprietary libraries that do not normally accompany the operating system. Such a contradiction means you cannot use both them and the Linguistic Resource together in a package that you distribute.

5. You may not copy, modify, sublicense, link with, or distribute the Linguistic Resource except as expressly provided under this License. Any attempt otherwise to copy, modify, sublicense, link with, or distribute the Linguistic Resource is void, and will automatically terminate your rights under this License. However, parties who have received copies, or rights, from you under this License will not have their licenses terminated so long as such parties remain in full compliance.

6. You are not required to accept this License, since you have not signed it. However, nothing else grants you permission to modify or distribute the Linguistic Resource or its derivative works. These actions are prohibited by law if you do not accept this License. Therefore, by modifying or distributing the Linguistic Resource (or any work based on the Linguistic Resource), you indicate your acceptance of this License to do so, and all its terms and conditions for copying, distributing or modifying the Linguistic Resource or works based on it.

7. Each time you redistribute the Linguistic Resource (or any work based on the Linguistic Resource), the recipient automatically receives a license from the original licensor to copy, distribute, link with or modify the Linguistic Resource subject to these terms and conditions. You may not impose any further restrictions on the recipients' exercise of the rights granted herein. You are not responsible for enforcing compliance by third parties with this License.

8. If, as a consequence of a court judgment or allegation of patent infringement or for any other reason (not limited to patent issues), conditions are imposed on you (whether by court order, agreement or otherwise) that contradict the conditions of this License, they do not excuse you from the conditions of this License. If you cannot distribute so as to satisfy simultaneously your obligations under this License and any other pertinent obligations, then as a consequence you may not distribute the Linguistic Resource at all. For example, if a patent license would not permit royalty-free redistribution of the Linguistic Resource by all those who receive copies directly or indirectly through you, then the only way you could satisfy both it and this License would be to refrain entirely from distribution of the Linguistic Resource.

If any portion of this section is held invalid or unenforceable under any particular circumstance, the balance of the section is intended to apply, and the section as a whole is intended to apply in other circumstances.

It is not the purpose of this section to induce you to infringe any patents or other property right claims or to contest validity of any such claims; this section has the sole purpose of protecting the integrity of the free resource distribution system which is implemented by public license practices. Many people have made generous contributions to the wide range of data distributed through that system in reliance on consistent application of that system; it is up to the author/donor to decide if he or she is willing to distribute resources through any other system and a licensee cannot impose that choice.

This section is intended to make thoroughly clear what is believed to be a consequence of the rest of this License.

9. If the distribution and/or use of the Linguistic Resource is restricted in certain countries either by patents or by copyrighted interfaces, the original copyright holder who places the Linguistic Resource under this License may add an explicit geographical distribution limitation excluding those countries, so that distribution is permitted only in or among countries not thus excluded. In such case, this License incorporates the limitation as if written in the body of this License.

10. The Free Software Foundation may publish revised and/or new versions of the Lesser General Public License for Linguistic Resources from time to time. Such new versions will be similar in spirit to the present version, but may differ in detail to address new problems or concerns.

Each version is given a distinguishing version number. If the Linguistic Resource specifies a version number of this License which applies to it and "any later version", you have the option of following the terms and conditions either of that version or of any later version published by the Free Software Foundation. If the Linguistic Resource does not specify a license version number, you may choose any version ever published by the Free Software Foundation.

11. If you wish to incorporate parts of the Linguistic Resource into other free programs whose distribution conditions are incompatible with these, write to the author to ask for permission.

NO WARRANTY

12. BECAUSE THE LINGUISTIC RESOURCE IS LICENSED FREE OF CHARGE, THERE IS NO WARRANTY FOR THE LINGUISTIC RESOURCE, TO THE EXTENT PERMITTED BY APPLICABLE LAW. EXCEPT WHEN OTHERWISE STATED IN WRITING THE COPYRIGHT HOLDERS AND/OR OTHER PARTIES PROVIDE THE LINGUISTIC RESOURCE "AS IS" WITHOUT WARRANTY OF ANY KIND, EITHER EXPRESSED OR IMPLIED, INCLUDING, BUT NOT LIMITED TO, THE IMPLIED WARRANTIES OF MERCHANTABILITY AND FITNESS FOR A PARTICULAR PURPOSE. THE ENTIRE RISK AS TO THE QUALITY AND PERFORMANCE OF THE LINGUISTIC RESOURCE IS WITH YOU. SHOULD THE LINGUISTIC RESOURCE PROVE DEFECTIVE, YOU ASSUME THE COST OF ALL NECESSARY SERVICING, REPAIR OR CORRECTION.

13. IN NO EVENT UNLESS REQUIRED BY APPLICABLE LAW OR AGREED TO IN WRITING WILL ANY COPYRIGHT HOLDER, OR ANY OTHER PARTY WHO MAY MODIFY AND/OR REDISTRIBUTE THE LINGUISTIC RESOURCE AS PERMITTED ABOVE, BE LIABLE TO YOU FOR DAMAGES, INCLUDING ANY GENERAL, SPECIAL, INCIDENTAL OR CONSEQUENTIAL DAMAGES ARISING OUT OF THE USE OR INABILITY TO USE THE LINGUISTIC RESOURCE (INCLUDING BUT NOT LIMITED TO LOSS OF DATA OR DATA BEING RENDERED INACCURATE OR LOSSES SUSTAINED BY YOU OR THIRD PARTIES OR A FAILURE OF THE LINGUISTIC RESOURCE TO OPERATE WITH ANY OTHER SOFTWARE), EVEN IF SUCH HOLDER OR OTHER PARTY HAS BEEN ADVISED OF THE POSSIBILITY OF SUCH DAMAGES.

END OF TERMS AND CONDITIONS

Morphalou 3.1

Lexique morphologique ouvert du français

Conception de la ressource : Marie Tonnelier

Qu'est-ce que Morphalou3 ?

Quelles différences entre la version 3.1 et la version 3 ?

Fusion de cinq lexiques

Morphalou 2

DELA

Dicollecte

Lefff

LGLex et LGLexLefff

Résultat de la fusion

Nouvelles entrées

Graphiques

Au total

Par catégories de lemme

Données

Nouveaux lemmes

Nouvelles formes fléchies

Origines

Croisements

Graphiques

Données

Lemmes présents dans plusieurs lexiques

Formes fléchies présentes dans plusieurs lexiques

Formats dans lesquels Morphalou3 est disponible

Format TEI (XML)

Qu'est-ce que le format TEI ?

Comment sont formatées les données de Morphalou3 ?

Format LMF (XML)

Qu'est-ce que le format LMF ?

Comment sont formatées les données de Morphalou3 ?

Format CSV (format texte pour logiciels tableurs)

Qu'est-ce que le format CSV ?

Comment sont formatées les données de Morphalou3 ?

Base de données MySQL

Qu'est-ce que le format MySQL ?

Comment sont formatées les données de Morphalou3 ?

Schéma relationnel

Description des données

lemma = Lemme

inflection = Forme fléchie

originatingLemma = Entrée d'origine d'un lemme

originatingInflection = Entrée d'origine d'une forme fléchie

Quels lemmes font partie ou non de Morphalou3 ?

Les lemmes présents

Un même mot dans plusieurs catégories

Les lemmes présents dans plusieurs catégories

Catégories multiples les plus courantes pour les lemmes

Formes lemmatiques ayant 4 catégories

Formes lemmatiques ayant 5 catégories

Les formes fléchies présentes dans plusieurs catégories

Catégories multiples les plus courantes pour les formes fléchies

Un nom commun féminin est un lemme à part entière

Les variantes orthographiques

Les verbes pronominaux

Les mots tronqués

Les lemmes non souhaités

Les préfixes et suffixes

Les noms propres

Les cas plus ambigus

Les groupes nominaux et locutions

De quoi parle-t-on ?

Qu'en est-il dans Morphalou3 ?

Jeu d'étiquettes

Les mots lexicaux

Les mots grammaticaux / mots-outils

Données statistiques

Conjugaisons

Lesser General Public License For Linguistic Resources