webleads-tracker

Déployer un moteur de recherche : Mode d'emploi

 

Nous avons tous en tête Google quand nous imaginons un moteur de recherche : un champ de saisie dans lequel on entre un ou plusieurs mots, et le moteur nous donne les résultats, voire, idéalement, le bon résultat.

Au sein d’une entreprise, les données sont souvent plus spécifiques que des données Internet. Réussir un déploiement pertinent pour votre contexte propre nécessite de se poser quelques questions en amont.

Quels contenus indexer ?

Evidemment, les disques partagés seront une cible de choix. Mais d’autres sources de données pourront se révéler pertinentes :

  • Indexer un annuaire ActiveDirectory pour obtenir les contacts de la société.

  • Indexer des sources documentaires, notamment si vous disposez d’une GED

  • Indexer des applicatifs métier (exemple : une base de contrats, une base de CV, …)

  • Indexer des espaces collaboratifs

  • Indexer vos intranets ou votre site internet

Sélection des meilleures sources de contenus à indexer

L’indexation d’espaces de travail pose la question de la pertinence des contenus : certains espaces peuvent contenir des documents temporaires ou non validés, et on peut souhaiter que ces documents n’apparaissent pas dans les résultats de recherche, dans une optique “le moteur de recherche est le référentiel des documents officiels de l’entreprise”. Au contraire, on peut souhaiter orienter le moteur de recherche dans une optique “le moteur de recherche est le point d’entrée vers tous les documents existants”, auquel cas des documents personnels peuvent y trouver leur place (sous réserve, bien sur, du respect de leurs droits d’accès). Ce choix est également à pondérer en fonction de la volumétrie de ces espaces.

Comment offrir une vue transversale ?

Même si une société est divisée en plusieurs services (par exemple : production, commercial, finances, RH, ...), on retrouve en général quelques points communs entre tous ces services, liés à l’activité de base de la société. Par exemple, pour une société de services, la notion de “nom du client” sera assez transversale. Pour une société qui fabrique des produits, les noms ou références de ceux-ci forment un vocabulaire commun à l’entreprise (les services de fabrications gérant des documents relatifs à la fabrication de ces produits, les services commerciaux gérant des documents relatifs à la vente de ces produits, les services de R&D faisant de la veille concurrentielle sur des produits similaires...)

Il est donc intéressant de repenser les sources de données indexées pour en présenter les contenus, non pas en fonction de leur seul emplacement ou format, mais en fonction du vocabulaire de l’entreprise.


Ajout de vocabulaire entreprise sur un contenu non structuré.

Cet enrichissement des contenus peut se faire assez simplement dans le cas de l’indexation d’une GED si les méta-données des documents sont bien renseignées, ou dans le cas de l’indexation d’un applicatif métier spécifique qui contient ses propres qualifications. Parfois, on saura extraire cette information de l’arborescence du disque que l’on indexe s’il est structuré en répertoires / sous répertoires pertinents. Dans d’autres cas, il pourra être pertinent de s’appuyer sur une extraction des mots contenus dans les documents. Parfois, l’uniformisation des vocabulaires passera par une mise en place de thésaurus ou de dictionnaires de synonymes.

Comment faciliter les recherches ?

Le champ de recherche plein texte permet de saisir plusieurs mots clés et de présenter les résultats les plus pertinents pour les mots clés saisis.

Mais il est parfois plus efficace pour préciser la recherche de pouvoir pointer directement un ensemble de documents.

Typiquement, en recherchant “Jean Dupont”, le moteur présentera tous les éléments dans lesquels ce nom apparait, aussi bien sa fiche annuaire, que les documents qu’il a effectivement écrits (méta-donnée “auteur”), que tout autre document dans lequel ce nom est simplement cité. Un exemple d’affinage de recherche serait alors de pouvoir indiquer “recherche annuaire uniquement”.

Ou encore, on peut vouloir taper un nom de produit, et restreindre les résultats aux documents de type “Spécification” en excluant les documents de type “Contrat de vente”.

Pour cela, les moteurs de recherches proposent tous des fonctionnalités de filtrage, le plus souvent sous formes de facettes qui permettent de sélectionner des sous-ensembles de documents suivant certains critères.

Utilisation de facettes de filtrage pour aboutir plus rapidement au résultat.

Un axe de réflexion important lors de la mise en place d’un moteur de recherche est donc : quels critères sont pertinents, pour les utilisateurs cibles, dans leur manière de rechercher une information ?

Dans ce domaine, il n’y a pas de réponse toute faite, tout dépend de la manière de travailler des utilisateurs : dans certains cas le critère de géolocalisation pourrait être vital (ex : quels documents s’appliquent à tel périmètre géographique), tandis que dans d’autres cas, la date pourrait être indispensable (ex : quels documents ont été émis le mois dernier).

Attention toutefois à ne pas multiplier les critères de recherche : une interface de recherche contenant trop de critères pourrait être perçue comme déroutante par les utilisateurs, et pourrait constituer un frein à l’appropriation.

Conclusion

La mise en place d’un moteur de recherche réellement pertinent pour vos utilisateurs nécessite une réflexion en amont sur ses usages prévisibles. Mais pour autant, un moteur de recherche n’est pas un élément figé. La plupart des moteurs de recherche offrent une certaine souplesse de configuration, ce qui permet d’améliorer en continu le système, si les usages réels s’avèrent différents de ceux imaginés initialement, ou si de nouveaux usages apparaîssent...
 

Crédits photo :