De ce am creat un înlocuitor pentru dtsearch

De ce am creat un înlocuitor pentru dtSearch +12

  • 06.04.17 08:39 •
  • sochix •
  • # 325786
  • Habrahabr •
  • 12 •
  • 1600

- la fel ca Forbes, doar mai bine.

Am parcurs un drum lung de la utilizarea dtSearch la o soluție proprie. În acest articol, dorim să ne împărtășim experiența.








  • Alegerea a fost între Cross, Copernic, Archivist, dtSearch și mai multe soluții exotice
  • Compararea vitezei de interogare cu o cantitate mare de date a arătat un câștigător evident - dtSearch
  • DtSearch la momentul respectiv a avut cea mai dezvoltată sintaxă de interogare, care ne-a permis să implementăm toate "punctele mai fine" ale recuperării informațiilor
  • DtSearch are un API sub forma unei biblioteci pentru C #, pe care am folosit-o pentru a integra motorul în sistemul nostru. Nu este cea mai convenabilă opțiune, dar la acel moment a fost cea mai acceptabilă

Ce sa întâmplat în continuare

Ani au trecut, sistemul nostru sa dezvoltat și, treptat, dtSearch a devenit un loc îngust și problematic:







Lista continuă și continuă, dar orice altceva este mai mic, comparativ cu problemele enumerate mai sus.

Apoi, am considerat opțiunea de a crea un modul de căutare fulltext pentru sistemul nostru folosind Apache Tika + ElasticSearch sau Apache Solr, care ne-ar rezolva problema în ansamblul său. Cu toate acestea, am continuat să fim chinuiți de ideea că piața încă nu dispune de o soluție bună, cu interfețe rapide de căutare, OCR și interfață prietenoasă.

Prin urmare, fără să ne gândim mult timp, am decis să creăm propria noastră soluție open-source care ar face viața mai ușoară pentru toată lumea - așa sa născut Ambar.

Ambar - sistem de căutare a documentelor în format întreg

De ce am creat un înlocuitor pentru dtsearch

În procesul de dezvoltare, am ținut cont de toate problemele pe care le urmăriam cu dtSearch. Prin urmare, cerințele noastre de bază pentru sistem au fost: ușoare, intuitive, puternice și scalabile. Ne-am concentrat direct pe volumele în zeci și sute de milioane de fișiere, o condiție necesară a fost de căutare rapidă durează mai puțin de o jumătate de secundă, indiferent de complexitatea interogării și numărul de documente.

Principalele puncte despre sistemul nostru, care sunt importante pentru a ști:

> Blogul nostru. unde împărtășim toate faptele și evoluțiile interesante

Vă mulțumesc pentru atenție!







Articole similare

Trimiteți-le prietenilor: