hyper.dev
well come

đŸ–đŸœ

2024 · Moteurs de recherche précis ou flous

Un moteur de recherche est précis

Cet outil est construit pour enquĂȘter dans des bases de donnĂ©es structurĂ©es. Les donnĂ©es structurĂ©es sont organisĂ©es en documents de plusieurs parties aussi souvent appelĂ©es champs, et oĂč chaque champ a une typologie stricte, qui ne varient pas de document en document : cela peut ĂȘtre une date de publication, un numĂ©ro de page donc un nombre entier, un code de bibliothĂšque, les champs peuvent ĂȘtre mĂȘme une chaine de mot assembler d’espace et de ponctuations : un texte. Lorsque le document a un champ corps, frĂ©quemment du texte, l’habitude est d’appeler les autres champs, les mĂ©tadonnĂ©es.

La cible d’un moteur de recherche prĂ©cis est surtout des donnĂ©es dĂ©jĂ  organisĂ©es ou organisĂ©es automatiquement ou semi-automatiquement. L’avantage d’une structuration systĂ©matique est de faciliter des traitements. Les traitements visent Ă  mettre en perspective la base de donnĂ©es, en regardant les donnĂ©es de face, mais aussi de profil, au rayon X, etc. C’est possible en faisant une ou plusieurs Ă©tapes, des calculs et des transformations, en projetant, en rassemblant, en agrĂ©geant les champs disponibles pour en crĂ©er de nouveaux. L’objectif est de favoriser la crĂ©ation de vues variĂ©es autour de la demande d’aide de l’utilisateur. En d’autres termes, cela permet une aventure multidimensionnelle, un tableau avec plusieurs colonnes. La matrice sous-jacente se retrouve dans la reprĂ©sentation Ă  travers les filtres de diffĂ©rents types qui sont agrĂ©mentĂ©s de compteurs. Cela s’appelle des facettes, celles-ci rendent accessibles des informations prĂ©existantes, mais auparavant difficiles, voire impossibles Ă  apprĂ©hender sans traitement informatique.

Ces moteurs de recherche sont couteux en mise en place et en maintenance, car il faut dĂ©terminer Ă  plus ou moins long terme comment se feront les calculs et lesquels sont personnalisables par l’utilisateur. Aussi, il faut savoir combien de temps prennent ces calculs. S’ils prennent trop longtemps, il faut prĂ©voir de prĂ©calculer ceux-ci en amont et de les figer, ce qui nĂ©cessite du stockage durable. Dans un moteur de recherche prĂ©cis, la demande de l’utilisateur est prĂ©cise et le moteur de recherche doit s’y conformer dans les dĂ©tails pour ne pas fausser la rĂ©flexion. Cela Ă©tant, le moteur de recherche prĂ©cis peut agrĂ©menter la liste de rĂ©sultats d’élĂ©ments connexes issus du flot de rĂ©sultats qui suggerent d’autre pistes.

Les moteurs de recherche flous

Ce type d’appareil se concentre sur la fouille de texte. Le texte peut ĂȘtre accompagnĂ© d’une table des matiĂšres. Celui-ci est opĂ©rĂ© en grande partie Ă  l’aide d’un langage informatique construit autour de la langue naturelle, avec des mĂ©canismes comme les opĂ©rateurs boolĂ©ens, les « phrases Ă  rechercher », et qui peuvent ĂȘtre triĂ©s par la date de dĂ©couverte. La matiĂšre premiĂšre de ces logiciels sont des documents peu ou pas structurĂ©s. Le flot de rĂ©sultats est toujours prĂ©sentĂ© sous forme de liste avec un titre, un extrait ou un rĂ©sumĂ© et une rĂ©fĂ©rence durable comme une adresse web.

Le moteur de recherche flou prĂ©fĂšre les documents de taille modeste autour de mille mots. Ces moteurs de recherche fonctionne aussi sur des documents de la taille d’un paragraphe autour de 50 Ă  100 mots. Les grands formats peuvent ĂȘtre pris en compte en dĂ©coupant ceux-ci en plusieurs segments.

Ces moteurs de recherche ne sont pas stricts sur l’interprĂ©tation des demandes de l’utilisateur. En effet, dans le cadre de recherche floue, le souhait de l’utilisateur est de faire une recherche par sens ou autour de sa demande qui, dans les premiers pas d’un travail de recherche, est habituellement imprĂ©cise. En d’autres termes, la demande est un indice que le moteur de recherche suit pour aiguiller l’utilisateur dans sa pĂ©ripĂ©tie intellectuelle.


· /discourse · /acknowledgements ·


đŸ—’ïž hyper.dev · ïžđŸ“« amirouche.dev · hello@amirouche.dev · amirouche across platforms