Le framework

Administration

Une interface permet d'administrer les connecteurs, et la connexion au LDAP/AD si nécessaire. Elle permet de surveiller l'état du système et la récupération des documents.

Sécurité

Interface graphique pour la gestion des droits d'accès aux documents recherchés, avec connexion à l'Active Directory ou au LDAP en place dans l'entreprise.

Gestion de la charge

Gestion de la charge sur les sources de données, en nombre de threads, de documents récuperés, de taille des documents. Gestion de fenêtres temporelles de crawl.

Filtres de traitements

Possibilité de créer des filtres de traitements des données, avec notamment l'utilisation d'expression régulières pour inclure ou exclure des documents ou des repertoires.


Les connecteurs

Partages de fichiers

Indexation de vos partages de fichiers (Netapp, windows, samba, Dropbox...), de façon sécurisée. Gestion de l'OCR. Gère de nombreux formats comme ppt, xls, html, jpeg, MS office, open office...

GED et portails

Indexation de vos GED (Gestion Electronique de Documents), CMS ou portails (Liferay, Alfresco, Sharepoint, Documentum, Filenet, CMIS...), là encore de façon sécurisée.

Emails

Indexation des emails, pour exploiter de façon sécurisée ce gisement de données. Connexion directe au serveur d'emails (postfix, exchange) ou récupération via IMAP/POP3.

Tout le reste

BDD, réseaux sociaux... Système de plugin pour développer des connecteurs supplémentaires. Vous pouvez les créer vous-même, ou vous appuyer sur nos compétences.

Apache ManifoldCF

Comme son nom l'indique, Apache ManifoldCF est un projet de la fondation Apache. Initialement créé dans le seul but de fournir un framework de connecteur pour Lucene/Solr, la communauté a décidé de l'en détacher et d'en faire un projet à part entière. Vous pouvez obtenir plus d'informations sur le site d'Apache ManifoldCF. Apache ManifoldCF s'occupe donc de récuperer les données dans différents types de systèmes d'informations, propose un système de connecteur permettant d'en rajouter de nouveaux, gère la récupération des ACLs et des droits d'accès. Il est sous licence logiciel libre Apache v2.