Cet outil est construit pour enquĂȘter dans des bases de donnĂ©es structurĂ©es. Les donnĂ©es structurĂ©es sont organisĂ©es en documents de plusieurs parties aussi souvent appelĂ©es champs, et oĂč chaque champ a une typologie stricte, qui ne varient pas de document en document : cela peut ĂȘtre une date de publication, un numĂ©ro de page donc un nombre entier, un code de bibliothĂšque, les champs peuvent ĂȘtre mĂȘme une chaine de mot assembler dâespace et de ponctuations : un texte. Lorsque le document a un champ corps, frĂ©quemment du texte, lâhabitude est dâappeler les autres champs, les mĂ©tadonnĂ©es.
La cible dâun moteur de recherche prĂ©cis est surtout des donnĂ©es dĂ©jĂ organisĂ©es ou organisĂ©es automatiquement ou semi-automatiquement. Lâavantage dâune structuration systĂ©matique est de faciliter des traitements. Les traitements visent Ă mettre en perspective la base de donnĂ©es, en regardant les donnĂ©es de face, mais aussi de profil, au rayon X, etc. Câest possible en faisant une ou plusieurs Ă©tapes, des calculs et des transformations, en projetant, en rassemblant, en agrĂ©geant les champs disponibles pour en crĂ©er de nouveaux. Lâobjectif est de favoriser la crĂ©ation de vues variĂ©es autour de la demande dâaide de lâutilisateur. En dâautres termes, cela permet une aventure multidimensionnelle, un tableau avec plusieurs colonnes. La matrice sous-jacente se retrouve dans la reprĂ©sentation Ă travers les filtres de diffĂ©rents types qui sont agrĂ©mentĂ©s de compteurs. Cela sâappelle des facettes, celles-ci rendent accessibles des informations prĂ©existantes, mais auparavant difficiles, voire impossibles Ă apprĂ©hender sans traitement informatique.
Ces moteurs de recherche sont couteux en mise en place et en maintenance, car il faut dĂ©terminer Ă plus ou moins long terme comment se feront les calculs et lesquels sont personnalisables par lâutilisateur. Aussi, il faut savoir combien de temps prennent ces calculs. Sâils prennent trop longtemps, il faut prĂ©voir de prĂ©calculer ceux-ci en amont et de les figer, ce qui nĂ©cessite du stockage durable. Dans un moteur de recherche prĂ©cis, la demande de lâutilisateur est prĂ©cise et le moteur de recherche doit sây conformer dans les dĂ©tails pour ne pas fausser la rĂ©flexion. Cela Ă©tant, le moteur de recherche prĂ©cis peut agrĂ©menter la liste de rĂ©sultats dâĂ©lĂ©ments connexes issus du flot de rĂ©sultats qui suggerent dâautre pistes.
Ce type dâappareil se concentre sur la fouille de texte. Le texte peut ĂȘtre accompagnĂ© dâune table des matiĂšres. Celui-ci est opĂ©rĂ© en grande partie Ă lâaide dâun langage informatique construit autour de la langue naturelle, avec des mĂ©canismes comme les opĂ©rateurs boolĂ©ens, les « phrases Ă rechercher », et qui peuvent ĂȘtre triĂ©s par la date de dĂ©couverte. La matiĂšre premiĂšre de ces logiciels sont des documents peu ou pas structurĂ©s. Le flot de rĂ©sultats est toujours prĂ©sentĂ© sous forme de liste avec un titre, un extrait ou un rĂ©sumĂ© et une rĂ©fĂ©rence durable comme une adresse web.
Le moteur de recherche flou prĂ©fĂšre les documents de taille modeste autour de mille mots. Ces moteurs de recherche fonctionne aussi sur des documents de la taille dâun paragraphe autour de 50 Ă 100 mots. Les grands formats peuvent ĂȘtre pris en compte en dĂ©coupant ceux-ci en plusieurs segments.
Ces moteurs de recherche ne sont pas stricts sur lâinterprĂ©tation des demandes de lâutilisateur. En effet, dans le cadre de recherche floue, le souhait de lâutilisateur est de faire une recherche par sens ou autour de sa demande qui, dans les premiers pas dâun travail de recherche, est habituellement imprĂ©cise. En dâautres termes, la demande est un indice que le moteur de recherche suit pour aiguiller lâutilisateur dans sa pĂ©ripĂ©tie intellectuelle.
đïž hyper.dev · ïžđ« amirouche.dev · hello@amirouche.dev · amirouche across platforms