background preloader

Full-Text Search

Facebook Twitter

PostgreSQL Full Text Search

Apache Solr. Understanding Full-Text Indexing in SQL Server. Full-text indexing in SQL Server has been quietly improving as Microsoft have worked on it over the last few years, making this a good time to look at what it offers.

Understanding Full-Text Indexing in SQL Server

Who better to give us that look than Robert Sheldon, in the first of a series. The most commonly used indexes in a SQL Server database are clustered and nonclustered indexes that are organized in a B-tree structure. You can create these types of indexes on most columns in a table or a view, except those columns configured with large object (LOB) data types, such as text and varchar(max). Although this limitation is not a problem in many cases, there will be times when you’ll want to query such column types.

However, without indexes defined on the columns, the query engine must perform a full table scan to locate the necessary data. Open Source Search Server. MySQL full-text search optimization. A while ago we where developing a classified ads site for one of our most important clients.

MySQL full-text search optimization

In this site, every ad belongs to a region (city, country) and a category (e.g. vehicles>buy/sell>cars). When the visitor accesses the homepage, the region is determined from their IP address so only the ads for that region are displayed (the visitor can change the region) and every search is performed only for the ads on that region as well. At first everything was working great, but when some regions started to have more than 500.000 ads, that’s when we started to get nervous.

Every search on these regions took more than 30 seconds, which is obviously unacceptable. Les Taxonomies de navigation – La recherche à facettes : Définition, utilisation, objectifs, mise en œuvre. L’utilisation du web pour donner accès à des contenus riches et structurés est de plus en plus courant : - accès à un catalogue de produits - accès à de la documentation technique, juridique, administrative - accès à de la documentation scientifique : brevets, articles - accès à des bases de connaissance : économiques, R&D, people, patrimoine … Les informations mises à disposition dans ces sites web sont qualifiées par de nombreuses données : caractéristiques du produit, lieu géographique, taille, prix, âge, sujets traités, … qui doivent pouvoir être accessibles aux utilisateurs pour filtrer les informations et trouver une liste de réponses correspondant à leurs attentes.

Les Taxonomies de navigation – La recherche à facettes : Définition, utilisation, objectifs, mise en œuvre.

Chaque type d’attribut correspond à un axe de recherche, à une facette de la recherche. La recherche et le filtrage de l’offre par différents niveaux de choix permettent de guider progressivement l’utilisateur en fonction du contexte de la recherche. Taxonomies dynamiques Des taxonomies adaptées aux publics visés Conclusion. 11.9 Full-Text Search Functions. Peter_zaitsev: Full Text Search with MySQL. During recent months I had some performance engagements, spoke to people and was dealing with support cases, which had one problem in common -MySQL Full Text search does not perform well on large data sets It looks like the problem which is not solved even by pretty smart people.

peter_zaitsev: Full Text Search with MySQL

For example LiveJournal does not have full text search itself, while I would guess this is feature which a lot of people would like. Or Wikipedia offering Google or Yahoo search instead of their own full text search. If you could just plug in "MATCH (text) AGAINST ("phrase")" and enjoy I guess it would be long done already. I've been playing with FullText search a lot but simply could not make it to perform well even in best scenario (fully sorted index) when data size issignificant.

My felling is - it just can't be done without serious changes in FullText architecture, which would lose some of its benefits, for example live index updates. Here is benchmark sample: Full-text en Sql Server (2000 et 2005) Tout site qui se veut complet et qui comporte beaucoup d'informations se doit d'avoir une fonctionnalité de recherche simple d'utilisation et performante.

Full-text en Sql Server (2000 et 2005)

Les pages de recherche doivent être simples, un peu à l'image de Google. L'interface est minimal avec un simple champ pour y mettre les critères, un bouton et de simples textes en résultats. La rapidité de la réponse est plus importante que la mise en page des résultats dans ce type de page. Cette recherche s'appuie sur Sql Server pour ce qui est de la base de données. Dans ce document, nous allons voir la manière d'implémenter cette recherche au sein de la version 8.0 de Sql Server, plus connue sous le nom de Sql Server 2000. La technologie full-text permet de créer des indexes sur base de mots non parasites et d'utiliser ces indexes pour des recherches (avec support linguistique) ainsi que des recherches de proximité. Les mots parasites sont les mots de liaisons, les pronoms, … tels que " je ", " de ", " car " et bien d'autres.