logo de NAT

Styles possibles:

La coupure dans NAT

Les systèmes de coupure dans NAT

NAT utilise deux systèmes deux coupures en parallèle:

Seul le système littéraire est re-configurable, en modifiant les règles de coupures du dictionnaire.

Les règles de coupure littéraire

L'algorithme utilisé pour la coupure littéraire est celui de Liang; c'est aussi celui qui est utilisé en LaTeX par exemple, et dans de nombreux autres logiciels de traitement de texte.

Il a besoin pour fonctionner d'une liste de motifs (pattern), qui sont stockés dans un fichier dictionnaire. Par défaut, dans NAT, le dictionnaire utilisé est dans le répertoire xsl/dicts et se nomme hyph_fr_nat.dic.

Il est possible d'utiliser tout autre dictionnaire compatible avec l'algorithme de Liang, ou de créer son propre dictionnaire, soit en utilisant l'interface graphique d'édition des règles de coupure de NAT, soit en crèant un nouveau fichier dictionnaire avec un éditeur texte par exemple

Structure du dictionnaire de règle

Structure d'une règle

[.]r2èg3le_en_min1us1cul4e[.]

Exemple de conflit possible:

				Mot: braille
				Patterns correspondants:
				1le  qui donne b0r0a0i0l1l0e0
				4le. qui donne b0r0a0i0l4l0e0
				il2l qui donne b0r0a0i0l2l0e0
			

Il y a un conflit pour déterminer si la coupure est possible ou non entre les deux "l" de "braille".

On utilise donc le chiffre le plus élevé: 4. La coupure est donc impossible.

Notons au passage le . du pattern "4le." indiquant que la règle ne s'applique que si le mot finit par "le").

Réaliser ou mettre à jour un dictionnaire

Il est probable qu'occasionnellement, certains mots ne soient pas coupés comme on le souhaiterait. Certains seront tentés de modifier le dictionnaire en conséquence.

Il convient avant tout d'être prudent

Les modifications peuvent sembler fonctionner, mais il y a très souvent des effets de bord non prévus ensuite. En effet, les dictionnaires proposés ont été réalisés et éprouvés pendant de nombreuses ANNEES, une règle a donc dans l'immense majorité des cas une raison d'être.

Voici quelques conseils si vous souhaitez apporter des modifications:

Enfin, vous pouvez utilisez l'interface graphique d'édition des règles de coupure, qui permet de comprendre quels patterns sont utilisés lors de la coupure d'un mot.

Retour au sommaire de l'aide

Licence creative commons et licence gnu/gpl 2

Tous les contenus (images, textes, vidéos...) de cette documentation sont sous licence creative commons de type paternité partage des conditions initiales à l'identique

NAT est un logiciel libre sous licence GNU/GPL réalisé principalement par Bruno MASCRET, Frédéric SCHWEBEL et Vivien GUILLET