Aide à la recherche de texte
Principales définitions
Terme | Définition |
Forme | Ensemble de caractères continus ou discontinus qui renvoie à une entrée du lexique d'une langue. Ce terme est préféré à mot. |
Lexique | Ensemble des mots d'un corpus ou d'une langue. |
Séparateur | Caractère qui permet de séparer des formes dans un texte. Il existe deux type des séparateurs : séprateur absolu, séparateur conditionnel. Dans les séparateurs, il faut identifier les marqueurs syntaxiques des autres séparateurs. Les principaux séparateurs syntaxiques sont : ".,;:!?-()[]". Il est à noter que le caractère "-" entre dans la composition de formes comme "peut-être" de même pour la caractère " " (espace) qui entre dans la formation de mots composés comme "pied de table". Il existe une liste fermée de formes qui comportent une apostrophe : "aujourd'hui". |
Recherche d'une forme
La recherche de texte est régie par le principe des expressions regulières de type PERL.
La commande PHP utilisée est preg_match.
Terme | Définition |
Forme simple | Ensemble de caractères qui renvoie à une entrée du lexique d'une langue. Ce terme est préféré à mot. |
Liste | Pour rechercher un groupe de mots d'un champ lexical, il faut séparer les mots par une barre verticale. Exmple : "cheval|destrier" recherche tous les endroits où se trouve l'une des deux formes ou les deux à la fois. |
Radical | Il est possible de rechercher par un radical de mot ou par une terminaison. Il suffit de préfixer ou de suffixer la forme à rechercher avec le caractère astérisque. Exemple : 'aime*', recherche 'aimer, aimes, aimeras, aimera, aimerons, aimerez, aimeront ...' |