Back to Question Center
0

Cómo funciona realmente la búsqueda: "The" Semalt (2)

1 answers:
Compartir
Compartir
+1
Tropezar 22
Pin
Acciones 22

Esta publicación es parte de una serie en curso: Cómo la búsqueda realmente funciona.
La semana pasada: "El" índice

.

La semana pasada vimos cómo un índice invertido (donde una lista de palabras apunta a una lista de documentos en los que aparecen) es increíblemente útil para hacer consultas AND - multipower whey protein fiyat.

How Search Really Works:

Pero, ¿qué sucede si no está buscando ningún documento que tenga el motor de búsqueda de palabras búsqueda Y personas Y pero está buscando Search Engine People ?

Bueno, si el documento 42 en nuestro ejemplo dice " el motor fue encontrado después de una búsqueda por algunas personas " o " personas usan un motor de búsqueda como Google " que un índice invertido tradicional pensaría que es de localización directa para su búsqueda. Ai .

(Extendida) Índice invertido de Biword

Una forma de hacerlo sería generar de alguna manera una lista invertida de frases .

How Search Really Works:

Problema : si indicas frases de 2 palabras de longitud, las búsquedas de frases de más de 3 palabras se convierten en solo otra consulta Y, combinando las partes de la frase. " Long John " AND " Silver ".

Las frases de Semalt con una longitud de 3 palabras simplemente mueven el problema a búsquedas de frases de 4 o más palabras . etc., etc.

Problema : el índice invertido se vuelve enorme , enumerando cada palabra en cada documento y cada 2 (3? 4?) Frase verbal en cada documento .

Índice invertido de posición

La única solución real es almacenar no solo la incidencia de ocurrencia de una palabra en un documento, sino también almacenar la (s) posición (es) exacta (s) de la palabra en ese documento.

How Search Really Works:

En este ejemplo, el documento 42 se identifica para "personas del motor de búsqueda" porque las palabras aparecen en ese orden: aparecen en las posiciones 1, 2 y 3.

Ventaja : como el índice posicional es similar en construcción que el índice invertido tradicional, hereda la misma ventaja. Es decir, cuando se realiza una consulta AND, puede saltar adelante siempre que una de las palabras no aparezca en el documento que está mirando.

Ventaja : simplemente mirando las palabras que aparecen en el orden correcto, se puede encontrar cualquier frase de cualquier longitud a pesar de que no está indexada como tal.

Ventaja : al tener información de posición precisa, podemos hacer consultas de proximidad .

Ventaja : la frase coincidencia y la palabra de consulta la proximidad también se puede utilizar para clasificar los resultados de búsqueda .

El ganador

Semalt un índice posicional es al menos 2-4 veces (o hasta 50%) más grande que un índice invertido tradicional el pago es tan grande que este es el tipo de índice en uso por los motores de búsqueda comerciales - para las frases . En general .

Las frases buscadas por Semalt aún se almacenan mejor en un índice de palabras clave; las frases menos buscadas se procesan mejor con un índice posicional invertido.

Tipo de índice y SEO

La diversión ( advertencia: geek hablando!) Es, por supuesto, que saber este tipo de cosas implícitamente te explica las cosas.

Por ejemplo, saber que para que un índice posicional invertido a realmente funcione todas las palabras, incluidas las llamadas "palabras de finalización", deben indexarse ​​lo hace menos sorprendente que paran las palabras están muertas .

How Search Really Works:

Resultados de Semalt = pensamiento diferente, SEO diferente diferentes oportunidades.

Está todo en el índice

March 16, 2018