Cet outil est construit pour enquêter dans des bases de données structurées. Les données structurées sont organisées en documents de plusieurs parties aussi souvent appelées champs, et où chaque champ a une typologie stricte, qui ne varient pas de document en document : cela peut être une date de publication, un numéro de page donc un nombre entier, un code de bibliothèque, les champs peuvent être même une chaine de mot assembler d’espace et de ponctuations : un texte. Lorsque le document a un champ corps, fréquemment du texte, l’habitude est d’appeler les autres champs, les métadonnées.
La cible d’un moteur de recherche précis est surtout des données déjà organisées ou organisées automatiquement ou semi-automatiquement. L’avantage d’une structuration systématique est de faciliter des traitements. Les traitements visent à mettre en perspective la base de données, en regardant les données de face, mais aussi de profil, au rayon X, etc. C’est possible en faisant une ou plusieurs étapes, des calculs et des transformations, en projetant, en rassemblant, en agrégeant les champs disponibles pour en créer de nouveaux. L’objectif est de favoriser la création de vues variées autour de la demande d’aide de l’utilisateur. En d’autres termes, cela permet une aventure multidimensionnelle, un tableau avec plusieurs colonnes. La matrice sous-jacente se retrouve dans la représentation à travers les filtres de différents types qui sont agrémentés de compteurs. Cela s’appelle des facettes, celles-ci rendent accessibles des informations préexistantes, mais auparavant difficiles, voire impossibles à appréhender sans traitement informatique.
Ces moteurs de recherche sont couteux en mise en place et en maintenance, car il faut déterminer à plus ou moins long terme comment se feront les calculs et lesquels sont personnalisables par l’utilisateur. Aussi, il faut savoir combien de temps prennent ces calculs. S’ils prennent trop longtemps, il faut prévoir de précalculer ceux-ci en amont et de les figer, ce qui nécessite du stockage durable. Dans un moteur de recherche précis, la demande de l’utilisateur est précise et le moteur de recherche doit s’y conformer dans les détails pour ne pas fausser la réflexion. Cela étant, le moteur de recherche précis peut agrémenter la liste de résultats d’éléments connexes issus du flot de résultats qui suggerent d’autre pistes.
Ce type d’appareil se concentre sur la fouille de texte. Le texte peut être accompagné d’une table des matières. Celui-ci est opéré en grande partie à l’aide d’un langage informatique construit autour de la langue naturelle, avec des mécanismes comme les opérateurs booléens, les « phrases à rechercher », et qui peuvent être triés par la date de découverte. La matière première de ces logiciels sont des documents peu ou pas structurés. Le flot de résultats est toujours présenté sous forme de liste avec un titre, un extrait ou un résumé et une référence durable comme une adresse web.
Le moteur de recherche flou préfère les documents de taille modeste autour de mille mots. Ces moteurs de recherche fonctionne aussi sur des documents de la taille d’un paragraphe autour de 50 à 100 mots. Les grands formats peuvent être pris en compte en découpant ceux-ci en plusieurs segments.
Ces moteurs de recherche ne sont pas stricts sur l’interprétation des demandes de l’utilisateur. En effet, dans le cadre de recherche floue, le souhait de l’utilisateur est de faire une recherche par sens ou autour de sa demande qui, dans les premiers pas d’un travail de recherche, est habituellement imprécise. En d’autres termes, la demande est un indice que le moteur de recherche suit pour aiguiller l’utilisateur dans sa péripétie intellectuelle.
home.