Tag Archives: buscadores

2.2 Metabuscadores

13 Oct

La red está formada por más de un millón de páginas web, y se calcula que un buscador puede localizar aproximadamente un 15% del contenido de toda la red.

Para solucionar este difícil escollo, se crearon los Metabuscadores, conocidos en inglés como Meta Search Engines.

Permiten realizar una búsqueda en varios buscadores a la vez. Uno de sus inconvenientes, es que no suele ser posible precisar la búsqueda, ya que cada uno de los motores que engloba tiene sus propias características de búsqueda.

Su funcionamiento se concentra en el momento en el que el usuario lanza la búsqueda, donde el metabuscador la dirige a sus motores asociados, devolviendo una lista de resultados que se pueden ordenar según la relevancia. Esta relevancia re refleja al lado de cada enlace en forma de porcentaje.

Podemos encontrar distintos tipos de metabuscadores: aquellos que se pueden agrupar y los que no lo permiten.

Ejemplo de metabuscadores son:

  • Copernic.
  • Dogpile.
  • Vivismo.
  • Metacrawler C4.
  • Ixquick Metasearch.
  • Profusion.
Anuncios

2.1.2 Estrategias de búsqueda

13 Oct

Buscar en internet es una tarea difícil por la gran cantidad de información, la ausencia de clasificaciones consistentes, las diferentes herramientas de búsqueda, los diversos modos de buscar y las presiones comerciales.

Para conseguir llevar a cabo una buena búsqueda son necesarios tres aspectos fundamentales:

  1. Diseñar un perfil de búsqueda adecuado; es decir hay que tener la habilidad de emparejar, con exactitud los términos que se eligen para construir el perfil de búsqueda, con los que están ubicados en los documentos cuya información se quiere encontrar.
  2. Conocer el tamaño y contenido de la herramienta de búsqueda que se elige.
  3. Conocer las posibilidades que ofrecen las diferentes herramientas de búsqueda para recuperar los contenidos de su base de datos.

El sistema más usual para la búsqueda son los motores de búsqueda trabajados con base a una estrategia sobre su manejo adecuado.

La mayoría de los motores de búsqueda, y también los directorios que permiten buscar en su propia base de datos, permiten la utilización de operadores lógicos booleanos que establecen la relación entre los términos de búsqueda. Estos operadores tomados del álgebra del matemático inglés George Boole, permiten combinar los términos de búsqueda de acuerdo con nuestras necesidades.

Los operadores utilizados son:

  • OR
  • AND
  • NOT

El uso de la lógica booleana en internet presenta algunas peculiaridades.

  • Presencia: el operador de presencia especifica que las palabras deben aparecer en el resultado, es decir, el término debe estar presente. Por lo general, se añade al inicio de la palabra clave el signo de sumar (+) sin espacio, para indicar al buscador que la palabra que sigue se incluirá obligatoriamente en la información recuperada.

Por ejemplo: +estadística.

  • Ausencia: en la estrategia de búsqueda, puede indicarse la ausencia de alguna palabra clave, de forma tal que si estuviera presente, se excluya de la lista de resultados devueltos por el buscador.

Por ejemplo: hepatitis -alcohólica

En este ejemplo nos presentara todos los documentos que contengan la palabra hepatitis pero excluirá el termino alcoholica.

  • Truncado: el truncamiento de palabras claves hacia la derecha es, tal vez, el más utilizado y admitido en los buscadores, pero también es posible al inicio o en el medio de la palabra clave. Generalmente se utiliza para truncar el símbolo de asterisco (*), pero algunos buscadores admiten otros símbolos como ($, # y ?).

En este caso hay que tener en cuenta que algunos buscadores no admiten este tipo de búsqueda en la utilización del truncamiento como función de búsqueda.

El truncamiento permite conocer cuáles son las formas en que puede presentarse el término o palabra que se trunca. Recuperando documentos que contengan la palabra clave, pero también aquellas en la que la palabra sea raíz o sufijo. El asterisco, reemplaza una serie indeterminada de letras.

Por ejemplo: hipert* se recuperan documentos sobre hipertensión, hipertiroidismo, hipertonía, etcétera.

  • Frases literales entre comillas: el uso de frases entre comillas indica la intersección de palabras en la búsqueda, que además, aparecen adyacentes.

Es muy parecido al and pero exige que la secuencia de palabras sea idéntica en el resultado de la búsqueda, la frase debe aparecer en el texto recuperado. Se aconseja indicar frases cortas que contengan términos que aparecen con frecuencia en los documentos consultados de la temática.

Por ejemplo: “sangramiento digestivo alto”

  • Los paréntesis: Se utilizan de la misma forma que en las ecuaciones matemáticas, limitando y ordenando las relaciones entre variables. Se utilizan para agrupar términos cuando se combinan operadores booleanos, e indican el orden en que deben aplicarse las relaciones dentro de la estrategia de búsqueda. El uso más común del paréntesis es para encerrar dos posibles palabras claves separadas por un operador or, y luego enlazando aquellas palabras incluidas con otro criterio usando and.

Por ejemplo: física and termodinámica and not (mecánica or oscilaciones).

En este ejemplo se nos presentaran las textos (artículos) de física pero se excluirán los términos mecánica y oscilaciones.

Física and termodinámica and (mecánica or oscilaciones)

En este ejemplo le estamos solicitando al sistema de búsqueda que nos encuentre textos (artículos) de física que contengan los términos de mecánica y oscilaciones.

Los operadores de proximidad permiten: definir la posición de las palabras dentro de las páginas o documentos en la estrategia de búsqueda.

Es muy importante revisar la ayuda del buscador elegido o la opción de búsqueda avanzada para conocer si éstos operadores son válidos para la bds. (bases de datos)

Ejemplos de operadores de proximidad:

  • Near: significa “cerca“ con él se solicita al buscador recuperar documentos que contengan las palabras clave indicadas, pero no separadas por más de 10 palabras o 100 caracteres entre sí. Se parece al and. En algunos buscadores, puede sustituirse por el símbolo “~” o por corchetes [ ] para encontrar palabras juntas. El operador near es especialmente útil para buscar nombres y apellidos. Su uso implica que ambos argumentos han de estar relativamente cerca.
  • Adj: este operador significa “junto” y se utiliza para recuperar conjuntos de búsqueda adyacentes. Se parece al and pero exige que entre ambas palabras no exista otra, es decir, que los términos aparezcan juntos, sea el orden que sea. En algunos buscadores, pueden encerrarse entre comillas ambas palabras para obtener resultados similares.
  • Far: con este operador se localizan documentos en los que las palabras claves de búsqueda indicadas aparezcan con 25 palabras o más de distancia.
  • Before: este operador funciona como el and, significa “antes de”. Difiere del and en que los términos o palabras indicadas deben aparecer en el orden que se especifique, pero pueden encontrarse a cualquier distancia en el mismo documento.
  • Followed by: este operador significa en español “seguido de”. Los resultados que se obtienen son muy parecidos a los del operador near, pero marca claramente el orden de las palabras claves. No es utilizado por muchos buscadores.


2.1.1 Cómo funcionan

13 Oct

El motor de búsqueda más popular, Google, contiene más de 3.000.000.000 sitios web. Cuando introduces una frase o palabra, el motor buscará en su base de datos y devolverá resultados en un orden que estará determinado por su propio algoritmo.

El uso de estos programas denominados buscadores se basa en un sistema llamado “araña”, que rastrea y localiza páginas web en los servidores de todo el mundo y con ellas forman su base de datos.

En el momento de crear estas bases de datos, las arañas saltan de una página a otra, a través de los enlaces. Cuando el “robot o araña” localiza una página, esta recibe como entrada el texto localizado y produce como salida in índice invertido. En este índice se almacenan las raíces de las palabras y se excluyen los términos vacíos.

A la hora de realizar la búsqueda intervienen varios elementos: el formulario de búsqueda, la máquina que evalúa la búsqueda y la hace coincidir con las palabras indicadas, y los resultados de dicha búsqueda. Lo más importante y significativo de un buscador es, cómo calcula la relevancia que se da a una determinada página y que influirá en el orden en el que aparece en la lista de resultados.

Por pasos:

araña web

  1. Una araña visita tu página Web.
  2. La araña lee el contenido de tu página Web.
  3. La araña lleva toda la información a una central, donde un sistema la procesa y la almacena.
  4. El sistema crea un índice con las palabras que utilizas en tu Web y las ordena por relevancia.
  5. El sistema intenta descubrir si eres una buena página o no (en realidad comprueba cuanta gente recomienda tu Web y cuán importante es la gente que recomienda tu Web).
  6. Cuando alguien realiza una búsqueda, el sistema muestra todas las webs que contienen la palabra o frase buscada.

2.1 Buscadores

13 Oct

Existen dos métodos para localizar información en internet: uno puede ser a través de la navegación y el otro buscando. Navegar es el proceso de seguir enlaces de hipertexto creados por otros usuarios.

Sin embargo, buscar depende de un programa que se encarga de hacer coincidir las palabras calve que el usuario indica en la búsqueda con los documentos más relevantes que existen en la Red. Este método requiere conocer el uso de las herramientas de búsqueda.

Hoy en día internet se ha convertido en una herramienta para la búsqueda de información rápida, para ello han surgido los buscadores (browser), que son un motor de búsqueda que nos facilita encontrar información rápida de cualquier tema de interés, en cualquier área de las ciencias, y de cualquier parte del mundo.

Se clasifican en dos tipos:

  • Índices temáticos o Directorios: Son sistemas de búsqueda por temas o categorías jerarquizados, aunque también suelen incluir sistemas de búsqueda por palabras clave. Se trata de bases de datos de direcciones Web elaboradas “manualmente”, es decir, hay personas que se encargan de asignar cada página web a una categoría o tema determinado.
  • Motores de búsqueda: Son sistemas de búsqueda por palabras clave. Son bases de datos que incorporan automáticamente páginas web mediante “robots” de búsqueda en la red. Su función es localizar documentos de hipertexto.

Los buscadores más habituales para localizar información son:

  • Google: Considerado el número uno de los buscadores, se ha afianzado en los últimos años como líder mundial del sector. Además de que cuenta con otros servicios.
  • Yahoo: Uno de los portales pioneros en internet, ha desarrollado una tecnología de búsqueda muy similar a la de Google, aunque según los expertos, por debajo de ésta.
  •  MSN search de Microsoft: Aporta búsquedas a través de la enciclopedia Encarta.
  • Amazón (A9): Con un nuevo servicio local interesante que permite ver fotografías y datos de los establecimientos comerciales (solo en Estados Unidos).

Otros buscadores:

  • Clusty Beta de Vivisimo.
  • Ask Jeeves. Con Teoma.
  • Mooter- Web Search.
  • Grokker de Groxis, lo tienes que descargar a tu equipo: visualiza el mapa de una búsqueda.
  • Kartoo, con mapa conceptual de un site y otros muchos servicios de búsqueda.
  • Pubsub. Suscripciones a términos de búsqueda en tiempo real.
  • AlltheWeb.com de Overture, adquirido por Yahoo.
  • Altavista.
  • Fast.
  • Nothem Lighr.
  • WiseNut.