background preloader

NoSQL

Facebook Twitter

Welcome to Scriptella ETL Project. Big Data, Business Analytics & BI | Pentaho. Apache Solr und ElasticSearch im Streitgespräch | heise Developer. Lange Zeit war Apache Solr unter den quelloffenen Suchtechniken gesetzt. Seit einiger Zeit hat das Projekt jedoch Konkurrenz durch ElasticSearch bekommen. Fürsprecher der jeweiligen Suchplattform diskutieren in einem fiktiven Interview ihre Vor- und Nachteile.

Doch lassen wir zuerst den Moderator des Gesprächs zu Wort kommen. Moderator: Wenn ich mir den Open-Source-Markt im Bereich Suche und Suchtechnologie ansehe, scheinen ihn derzeit Apache Solr und ElasticSearch zu dominieren. Beide Produkte haben in den letzten 15 Monaten erhebliche Fortschritte gemacht. Ihre Beliebtheit liegt nicht zuletzt an der liberalen Apache-2-Lizenz, die den Download, die Nutzung und die Anpassung der Software kostenlos erlaubt. Beide nutzen Apache Lucene als Indexstruktur. These 1: Easy to use – nicht mit Solr!

Moderator: Lassen sich Solr und ElasticSearch überhaupt miteinander vergleichen? ElasticMAN: Klar gibt es Unterscheide zwischen ElasticSearch und Solr! These 2: ElasticSearch setzt Trends. Abfragen und Schemafreiheit | heise Developer. Abfragen von Statusinformation Läuft ElasticSearch, lassen sich JSON-Dokumente mit einem HTTP-POST- oder HTTP-PUT-Befehl zur Indizierung übergeben. Um beispielweise eine deutsche Post-Adresse als Dokumententyp man im Index addresses zu indizieren, reicht der unten zu sehende cURL-Befehl. Jede Ressource in ElasticSearch lässt sich über eine REST-konforme URL angesprechen. So setzt sich die URL für ein in ElasticSearch abgelegtes Dokument dabei nach folgendem Schema zusammen: ElasticSearch quittiert den Aufruf mit dem im Beispiel aufgeführten Dokument, aus dem sich der Erfolg der Operation, der Name des verwendeten Index und Dokumententyps sowie ID und Version des Dokuments entnehmen lässt.

Da das Dokument mit POST und ohne Angabe einer ID übergeben wurde, erzeugt ElasticSearch selbst eine. Da jedes Dokument einen eindeutigen Bezeichner hat, lässt sich ElasticSearch je nach Anwendungsfall auch als Key-Value-Store nutzen. Cassandra vs MongoDB vs CouchDB vs Redis vs Riak vs HBase vs Couchbase vs Hypertable vs ElasticSearch vs Accumulo vs VoltDB vs Scalaris comparison :: Software architect Kristof Kovacs.

While SQL databases are insanely useful tools, their monopoly in the last decades is coming to an end. And it's just time: I can't even count the things that were forced into relational databases, but never really fitted them. (That being said, relational databases will always be the best for the stuff that has relations.) But, the differences between NoSQL databases are much bigger than ever was between one SQL database and another.

This means that it is a bigger responsibility on software architects to choose the appropriate one for a project right at the beginning. In this light, here is a comparison of Open Source NOSQL databases: The most popular ones # Redis # Best used: For rapidly changing data with a foreseeable database size (should fit mostly in memory). For example: To store real-time stock prices. Cassandra # Best used: When you need to store data so huge that it doesn't fit on server, but still want a friendly familiar interface to it. MongoDB # ElasticSearch # CouchDB # Accumulo #