Apache Lucene

Ez a cikk a Apache Lucene témával foglalkozik, egy rendkívül releváns kérdéssel, amely az elmúlt években felkeltette a szakértők és a nagyközönség figyelmét. A Apache Lucene számos tanulmány és kutatás tárgya volt a mindennapi élet különböző területeire gyakorolt ​​hatása miatt, az egészségtől a gazdaságig. A szövegben a Apache Lucene különböző aspektusait elemzik, a történetétől és fejlődésétől a mai társadalomra gyakorolt ​​hatásaiig. Emellett megvizsgálják a lehetséges megoldásokat és javaslatokat a Apache Lucene által a kortárs világban jelentett kihívásokra. A többdimenziós megközelítés révén a cél az, hogy az olvasónak egy teljes és naprakész látásmódot kínáljon a Apache Lucene-ről, hogy hozzájáruljon a jelenség vitájához és megértéséhez.
Lucene

FejlesztőApache Software Foundation
Legfrissebb stabil kiadás10.1.0 (stabil verzió, 2024. december 20.)[1]
Programozási nyelvJava
Operációs rendszermulti-platform
PlatformJava virtuális gép
ÁllapotAktív
Kategóriakeresés és index
LicencApache Licenc 2.0
A Lucene weboldala

Az Apache Lucene egy szabad/nyílt forráskódú információ lekérő szoftver könyvtár, amelyet eredetileg Doug Cutting készített java nyelven. Támogatást az Apache Software Foundation nyújt hozzá Apache Licenc alatt.

Lucene-t más programozási nyelvekre is portolták, többek közt a következőkre: Delphi, Perl, C#, C++, Python, Ruby és PHP.[2]

Története

A Lucene-t eredetileg Doug Cutting írta 1999-ben,[3] és a SourceForge webhelyéről volt letölthető. Később csatlakozott az Apache Software Foundation nyílt forráskódú Jakarta termékcsaládjához 2001 szeptemberében és 2005 februárjában vált az Apache felső szintű projektévé. Egészen mostanáig számos alprojektje jött létre: Lucene Java, Droids, Lucene.Net, Lucy, Mahout, Solr, Nutch, Open Relevance Project, PyLucene és Tika. A Solr-t összefésülték magával a Lucene projekttel, továbbá a Mahoutot, a Nutchot és a Tikát kiemelték független felső szintű projektekbe.

Funkciók és általános felhasználás

Habár illeszthető bármely alkalmazáshoz - mely teljes szöveg indexelési és keresési képességeket igényel -, Lucene széles körben ismert[4][5] az Internetes- és lokális keresőmotorok, valamint webhely keresések implementációit segítő eszközeiről.

A Lucene logikai architektúrájának magját az az elgondolás alkotja, hogy egy dokumentum kizárólag szövegmezőkből áll. Ez a rugalmasság biztosítja, hogy a Lucene API független legyen a fájlformátumtól. A szöveg jöhet a PDFekből, HTMLből, Microsoft Word-, és OpenDocument dokumentumokból, és még sok másból is (kivéve a képek). Mindezek indexelhetők mindaddig, amíg a szöveges információ kinyerhető az adott formátumból.

Lucene alapú projektek

A Lucene maga csak egy indexelő és kereső könyvtár és nem tartalmaz crawling és HTML elemzési funkcionalitást. Számos projekt létezik, amely kiterjeszti a Lucene képességeit:

  • Apache Nutch - biztosít web crawling-ot és HTML elemzést
  • Apache Solr – egy vállalati kereső szerver
  • ElasticSearch – egy vállalati kereső szerver
  • Compass – egy Java keresőmotor keretrendszer

Felhasználók

Azon cégek listáját, melyek használják a Lucene-t, lásd a Lucene 'Power By' oldalát.[6] Többek közt a Twitter is használja a Lucene-t a valós idejű keresésekhez.[7]

Kapcsolódó szócikkek

Jegyzetek

  1. Release 10.1.0, 2024. december 20. (Hozzáférés: 2024. december 21.)
  2. Lucene implementációk
  3. Better Search with Apache Lucene and Solr, 1920. november 7. . (Hozzáférés: 2012. április 27.)
  4. Perner, Petra. Machine Learning and Data Mining in Pattern Recognition: 5th International Conference. Springer, 387. o. (2007). ISBN 978-3-540-73498-7 
  5. GNU/Linux Semantic Storage System. . (Hozzáférés: 2010. május 15.)
  6. PoweredBy
  7. Twitter uses Lucene

Irodalom

Külső hivatkozások

Fordítás

Ez a szócikk részben vagy egészben a Lucene című angol Wikipédia-szócikk ezen változatának fordításán alapul. Az eredeti cikk szerkesztőit annak laptörténete sorolja fel. Ez a jelzés csupán a megfogalmazás eredetét és a szerzői jogokat jelzi, nem szolgál a cikkben szereplő információk forrásmegjelöléseként.