Les éléments clés

Scalabilité

Datafari est capable d'indexer plusieurs centaines de millions de documents, en se basant sur une architecture big data de style hadoop, sur plusieurs machines.

Fiabilité

En mode distribué, la technologie distribuée avec Zookeeper et SolrCloud permet la gestion automatique de la défaillance des systèmes.

Flexibilité

Gestion du quasi temps réel, de multiple types de données (int, string, date...), mode schema-less, possibilité d'ajout dynamique de champs.

Sécurité

Les données transmises entre les connecteurs de crawling et le moteur d'indexation sont envoyées en https avec encryption, lorsque le crawler et le moteur sont séparés.


Apache Solr

Solr est un moteur de recherche en mode serveur, basé sur Lucene. Il ajoute des fonctionnalités de serveur web, de clusterisation, ainsi que des pages pour l’administration. Il s’agit d’un backbone stable, capable de gérer les montées en charge par répartition sur plusieurs machines, facilement administrable, et supportant les appels en REST. Vous pouvez obtenir plus d'informations sur le site technique de Solr. Tout comme Lucene, Solr fait également partie du projet Apache Lucene. En tant que tel, il est sous licence logiciel libre Apache. Apache Lucene/Solr est le moteur de recherche open source de référence. Il propose des fonctionnalités avancées, facilement configurable, rivalisant avec les meilleurs logiciels propriétaires.