Cahier des charges : Corporate Search – Moteur de recherche – Knowledge Management

829

Le cahier des charges "Corporate Search - Moteur de recherche - Knowledge Management" a été rédigé par des experts indépendants. Il repertorie 484 critères techniques pour faciliter la préparation de votre cahier des charges et comparer les solutions de moteur de recherche et de recherche de documents du marché. Ce guide vous guidera dans votre réflexion stratégique et vous aidera à mener à bien votre projet de Knowledge Management au sein de votre entreprise.

TÉLÉCHARGER CE CAHIER DES CHARGES

Sommaire du cahier des charges corporate search - moteur de recherche - knowledge management

1 – Gestion du cycle de vie
1.1. Gouvernance à la conception
1.1.1. Modèle de services (ontologie)
2 – Contexte du projet 
2.1. Périmètre et objectifs du projet
2.2. Contexte technique

3 – Collecte des sources
3.1. HTTP/HTTPS
3.1.1. Page de démarrage
3.1.2. Crawling
3.1.3. Information sur les pages
3.1.4. Protocole HTTP.HTTPS
3.2. RSS / Atom
3.3 Filesystem
3.3.1. Crawling
3.3.2. Informations sur les fichiers
3.3.3. Sécurité
3.4. Serveurs de messagerie
3.4.1. Récupération des messages
3.4.2. Information sur les messages
3.5. GED / SGDB
3.5.1. Ouverture de la solution
3.5.2. Informations sur les documents
3.5.3. Sécurité
3.6. Fournisseurs de contenus
3.6.1. Informations sur les documents
3.6.2. Copyright
3.7. Encodage

4 – Indexation
4.1. Linguistique
4.2. Formats et récupération du texte intégral
4.3. Métadonnées et structure du document
4.4. Autres fonctions d’analyse des contenus

5 – Recherche
5.1. Recherche en langue maternelle
5.2. Opérateurs linguistiques
5.3. Recherche dans les métadonnées
5.4. Opérateurs booléens
5.5. Autres opérateurs
5.6. Tri
5.7. Aide à la recherche, à l’interprétation des résultats

6 – Front-office
6.1. Interface de recherche
6.2. Présentation des résultats
6.3. Personnalisation par l’utilisateur final
6.4. Gestion des documents par l’utilisateur final

7 – Back-office
7.1. Réglages
7.2. Sécurité
7.3. Gestion des rôles des utilisateurs finaux
7.4. Gestion des sources
7.5. Mise en forme du Front-Office

8 – Architecture
8.1. Pérennité de fonctionnement
8.2. Disponibilité
8.3. Pérennité et disponibilité
8.4. Volumétrie (pour un serveur)
8.5. Backup

9 – Installation et mise à jour
9.1. Outils embarqués par la solution
9.2. Outils sur lesquels s’appuie la solution
9.3. Mise à jour

10 – Sécurité
10.1. Authentification
10.2. Protection des informations

11 – Intégration

 

TÉLÉCHARGER CE CAHIER DES CHARGES

m

Pour beaucoup moteur de recherche rime avec recherche d’informations sur Internet, Google, Yahoo, Altavista, MSN…

Pour les entreprises, le corporate search regroupe l’ensemble des méthodes et des techniques utilisées pour permettre l’accès à l’information et à la recherche documentaire en prenant en compte toutes les sources d’informations.

Bien avant la généralisation du réseau Internet, quelques éditeurs commercialisaient des logiciels de recherche de documents.

Le « texte intégral » fut la première étape de vulgarisation des moteurs de recherche. L’idée était « d’indexer » tous les mots du documents et non plus uniquement les « mots clés » des documents extraits par un documentaliste.

L’enjeu s’est aujourd’hui déplacé au niveau du système d’information. En effet, l’accès à l’information d’entreprise doit apporter une vision globale et prendre en compte toutes les sources d’informations : bases de données, bases de contenus, portails, messagerie, etc.

TÉLÉCHARGER CE CAHIER DES CHARGES

Introduction du cahier des charges corporate search - moteur de recherche - knowledge management

Historique et enjeux actuels

Pour chacun d’entre nous moteur de recherche est synonyme de recherche d’informations sur Internet, donc synonyme de Google, Yahoo, Altavista, MSN…
Toutefois, bien avant la généralisation du réseau Internet, quelques éditeurs commercialisaient des logiciels de recherche de documents.

Pendant longtemps, et parfois encore, la bataille se gagnait sur le terrain technologique voire scientifique. Une des grandes bataille fut menée dès les années 1980 : la bataille du « texte intégral » (full text). Il s’agissait de remplacer toute une génération de bases documentaires. Ces dernières utilisaient l’indexation des documents, comme par exemple la pose par un documentaliste d’index généralement issus d’un thésaurus.
La recherche dans ces bases documentaires n’était donc pas à la portée de n’importe qui. Il fallait connaître le thésaurus, le langage de requête et donc les documents.
Le « texte intégral » fut la première étape de vulgarisation des moteurs de recherche.
L’idée était « d’indexer » tous les mots du documents et non plus uniquement les « motclés » des documents extraits par un documentaliste. Les difficultés commençaient : pour passer à une échelle industrielle il fallait régler les problèmes de performance en termes de temps et d’espace. D’autres difficultés liées à la richesse du langage sont apparues : on les a appelées « bruit » et « silence » (precision et recall).

Le débat s’est donc déplacé sur un plan quasiment idéologique : faut-il une approche vectorielle, un fichier inverse, des analyseurs linguistiques… il semble que la bataille technologique se soit arrêtée lorsque le leader mondial du bayesien a racheté le leader mondial du sémantique il y a quelques mois.

L’enjeu se déplace maintenant également au niveau du système d’information. En effet, l’accès à l’information d’Entreprise doit apporter une vision globale, prendre en compte toutes les sources d’information de l’Entreprise : bases de données, bases de contenus, portails, messagerie, etc.
Il faut par conséquent gérer les droits d’accès de toutes ces sources. Il faut également prendre en compte les métiers de l’entreprise, les rôles des collaborateurs…

Conduite d’un projet de recherche d’informations

La conduite d’un projet de gestion de contenu suit les principes de la conduite de projet informatiques. Certains points sont cependant accentués :

Une équipe équilibrée

La maîtrise d’ouvrage est généralement assurée par l’équipe documentation de l’Entreprise. Il peut s’avérer pertinent d’y adjoindre une autre entité fonctionnelle (la DRH par exemple) afin de diversifier la vision de la solution à mettre en oeuvre. Cette diversité de points de vue permet également de résoudre les divergences avec la maîtrise d’oeuvre.

Un prototype

Avant le choix définitif pour tel ou tel éditeur, un prototype sur des documents de l’entreprise peut être demandé pour chaque technologie. Ceci permettra également de valider l’adhésion de la maîtrise d’ouvrage.

FORMULAIRE DE TÉLÉCHARGEMENT

Veuillez compléter le formulaire ci-dessous pour télécharger gratuitement la version PDF du document "Cahier des charges : Corporate Search – Moteur de recherche – Knowledge Management".

Effectif

Fonction

Secteur d'activité

S'inscrire à la Newsletter Guides Comparatifs


AUCUN COMMENTAIRE

LAISSER UN COMMENTAIRE