domingo, 3 de abril de 2011

Arana (spiders)

Los motores de búsqueda emplean el uso de arañas para recopilar la información de los sitios web. Las arañas rastrean los sitios web recopilando datos y sigue los enlaces que hay en las páginas. Las arañas rastrean internet casi continuamente, recolectando las páginas nuevas y actualizadas de la web para mantener resultados al día. 

Tratamiento de datos


Los datos que las arañas extraen son tratados de forma diferente por los diversos motores de búsqueda. Los motores de búsqueda ponen el peso en diferentes componentes de un sitio web y en cómo se integra en la web.


De esta manera determinan el orden en el que los sitios web deben aparecer en los resultados de una búsqueda SERPS (Search Engine Result Pages)

Entrando

La mayoría de los motores de búsqueda ponen al día sus bases de datos al menos una vez al mes con la información recopilada por sus arañas. Esto es importante saberlo cuando se tiene un sitio web relativamente nuevo si pones tu sitio web por primera vez en la red al final de un 'rastreo' y las arañas no lo encuentran, tendrás que esperar hasta la actualización siguiente para entrar a formar parte de la base de datos. Una vez el sitio web entra la base de datos todavía llevará una o dos actualizaciones más antes de que el nuevo sitio web se estabilice en los resultados de las
búsquedas.

Motores de búsqueda


Otras herramientas que permiten buscar y recuperar información en Internet a través de la utilización palabras clave y combinaciones de ellas son los denominados motores de búsqueda. En realidad, existen motores de búsqueda para la mayoría de los protocolos de Internet, pero aquí nos vamos a centrar de los que se ocupan del WWW que acceden a la mayoría de los recursos de Internet independientemente del protocolo de acceso.

Los motores de búsqueda surgieron como consecuencia de la gran cantidad de información que ofrece Internet y la falta de catalogación de la misma ya referida. La solución que ofrecen es parcial. En realidad no buscan en Internet sino que son bases de datos de páginas accesibles a través de Internet que han sido recogidas por un programa (el robot), y que son indizadas a partir de algunos datos de estos archivos (título, encabezamientos, texto completo, tamaño, dirección). No suele haber criterio de selección para la adición de nuevas páginas a la base de datos de los motores. Como resultado las bases de datos contienen información de muy diversa calidad. Además hay que tener en cuenta que las bases de datos de cada motor de búsqueda no son coincidentes.

Los motores de búsqueda nos permiten introducir en su entorno de búsqueda un perfil, habitualmente con la utilización de operadores booleanos. El resultado que obtenemos tras la búsqueda es una o varias páginas con enlaces a los documentos que cumplen el perfil de búsqueda especificado. Cada enlace cuenta con información variada según el motor (título, resumen o algunas líneas de texto, tamaño, fecha de la última actualización, porcentaje de adecuación con respecto a la petición, etc.)

Siempre que sea posible hay que utilizar las posibilidades de búsqueda avanzada que ofrecen los motores de búsqueda. Es necesario saber manejarlas bien. Hay que evitar que el proceso de búsqueda de como resultado una frustrante lista de miles de páginas que apenas tiene que ver con nuestra necesidad de información. Para ello se recomienda leer detenidamente las ayudas de los motores de búsqueda.

Existen cientos de motores de búsqueda con los que se puede conectar.

Nos vamos a ocupar sólo muy someramente de los más importantes:

*AltaVista es una buena opción de inicio. Fue en otro tiempo el motor más usado y todavía es una opción a considerar si lo que se quiere buscar es muy específico.

*Google es un motor de búsqueda de muy fácil manejo, recomendado cuando se quiere hacer una primera búsqueda sobre un tema sobre el que no se conoce demasiado. Se distingue por su sistema de ordenar las respuestas basadas en las veces que las páginas web encontradas son enlazadas por páginas de calidad contrastada, junto con factores como la proximidad en el documento de las palabras clave o de las frases introducidas como palabras clave. Es uno de los motores de segunda generación que persiguen mejorar y hacer más pertinente el modo de presentar los resultados al usuario. Para muchos es hoy día el mejor motor existente, además de ser el más grande. Otras características que lo hacen recomendable es su 'búsquedas difusas' que permiten buscar sinónimos, definiciones, páginas similares y relacionadas, etc. Además posee motores específicos como el académico Scholar Google, o el motor de búsqueda en libros Print Google. En la misma línea de ofrecer motores específicos ha surgido dentro de la gama de productos de Windows Live Search, Academic Live Search.

*Alltheweb es hoy en día uno de los motores de búsqueda generalista más grande que existen, con centenares de millones de páginas web en su base de datos. También es de los más rápidos. Es además fácil de usar aunque ofrece capacidades de búsqueda sofisticada limitadas. Es por ello adecuado cuando se quiere buscar sobre un tema sobre el que no se conoce demasiado.

*Ask.com en un motor de búsqueda más pequeño que otros en cuanto a número de páginas. Su sencillez y su capacidad de priorizar los resultados, en función de la especificidad de los buscado y la popularidad dentro de la misma materia, hacen de este motor de búsqueda una opción interesante.

Como ya hemos señalado con anterioridad las fronteras entre motores de búsqueda y directorios están muy difuminadas. Con frecuencia los motores de búsqueda presentan clasificaciones temáticas de los recursos que controlan en sus bases de datos, e incluso a la hora de presentar los resultados de la búsqueda combinan lo que han obtenido en su base de datos con recursos de directorios.
Qué es un Motor de Búsqueda

Un motor de búsqueda es un programa software que busca sitios web basándose en palabras clave (keywords) designadas como términos de búsqueda.

Los Motores de Búsqueda y los Directorios Web no son lo mismo, aunque a menudo se utiliza el término de manera indistinta. Los motores de búsqueda crean listados de sitios web utilizando arañas (spiders) que rastrean (crawl) las páginas web, indexan su información y siguen los enlaces desde ellas hacia otras páginas. Las arañas regresan con frecuencia a los sitios ya rastreados para comprobar actualizaciones o cambios, todo lo que encuentran queda reflejado en la base de datos del motor de búsqueda.

Un Directorio Web organiza los sitios web por temas, y normalmente se mantienen por personas y no mediante software, por lo que sus bases de datos son menores que las de los motores de búsqueda. El usuario accede a las páginas web organizadas por categorías y menús.

Todos los motores de búsqueda siguen el siguiente proceso al realizar una búsqueda, pero al utilizar algoritmos de búsqueda diferentes, los resultados de las búsquedas también lo son.

·         El usuario teclea una pregunta en el motor de búsqueda.

·         El software del motor de búsqueda recorre literalmente millones de páginas de su base de datos para encontrar correspondencias a la pregunta.

·         Los resultados de la búsqueda se muestran listados en orden de relevancia.

Los motores de búsqueda buscan en sus propias bases de datos para encontrar lo que el usuario busca. Los motores de búsqueda son complejos, utilizan detallados procesos y metodologías que son actualizados continuamente.

Los motores de búsqueda son un elemento fundamental de Internet por lo que debemos tenerlos muy en cuenta a la hora de diseñar una página web. Suelen ser la principal fuente de tráfico, por lo que el ranking que asignen a un sitio web marcará de manera decisiva el éxito o el fracaso de este.
Historia

El primer buscador fue "Wandex", un índice (ahora desaparecido) realizado por la World Wide, Web Wanderer, un robot desarrollado por Mattew Gray en el MIT, en 1993. Otro de los primeros buscadores, Aliweb, también apareció en 1993 y todavía está en funcionamiento. El primer motor de búsqueda de texto completo fue Web Crawler, que apareció en 1994. A diferencia de sus predecesores, éste permitía a sus usuarios una búsqueda por palabras en cualquier página web, lo que llegó a ser un estándar para la gran mayoría de los buscadores. Web Crawler fue también el primero en darse a conocer ampliamente entre el público. También apareció en 1994 Lycos (que comenzó en la Carnegie Mellón University).


Muy pronto aparecieron muchos más buscadores, como Excite, Infoseek, Inktomi, Northern Light y AltaVista. De algún modo, competían con directorios (o índices temáticos) populares tales como Yahoo!. Más tarde, los directorios se integraron o se añadieron a la tecnología de los buscadores para aumentar su funcionalidad.

Antes del advenimiento de la Web, había motores de búsqueda para otros protocolos o usos, como el buscador Archie, para sitios FTP anónimos y el motor de búsqueda Verónica, para el protocolo Gopher.

En la actualidad se aprecia una tendencia por parte de los principales buscadores de Internet a dar el salto hacia entornos móviles creando una nueva generación de buscadores: los buscadores móviles.



Como no tiene una página con el nombre exacto de (Trovit).



  • Puedes buscar páginas sobre (Trovit), ver todas las páginas desde este título o solicitar su creación.
  • Para crear un artículo enciclopédico, utiliza nuestro asistente.
  • Si has seguido un enlace rojo, no estás obligado a introducir un texto aquí. Puedes volver atrás y seguir en el artículo anterior.
  • Puedes pedir información en Consultas, porque si lo haces aquí tu petición será borrada sin previo aviso.
  • Si quieres hacer pruebas, por favor, utiliza la Zona de pruebas.
  • Si ya habías creado una página con este nombre, limpia la caché de tu navegador. También puede haber sido borrada.


    Buscadores especializados en un sector concreto, lo que les permite analizar la información con mayor profundidad, disponer de resultados más actualizados y ofrecer al usuario herramientas de búsqueda avanzadas. Es importante resaltar que utilizan índices especializados de esta manera acceder a la información de una manera más específica y fácil. Ejemplos de este tipo de buscadores son: Trovit, Nestoria. No apto para trabajos escolares.
    Meta Buscador

    Permite lanzar varias búsquedas en motores seleccionados respetando el formato original de los buscadores. Lo que hacen, es realizar búsquedas en auténticos buscadores, analizan los resultados de la página, y presentan sus propios resultados, según un orden definido por el sistema estructural de la meta buscador.
    Directorios

    Una tecnología barata, ampliamente utilizada por gran cantidad de scripts en el mercado. No se requieren muchos recursos de informática. En cambio, se requiere más soporte humano y mantenimiento.

    • Los algoritmos son mucho más sencillos, presentando la información sobre los sitios registrados. No recorren los sitios web ni almacenan sus contenidos. Solo registran algunos de los datos de nuestra página, como el título y la descripción que se introduzcan al momento de registrar el sitio en el directorio.

    • Los resultados de la búsqueda, estarán determinados por la información que se haya suministrado al directorio cuando se registra el sitio. En cambio, a diferencia de los motores, son revisadas por operadores humanos, y clasificadas según categorías, de forma que es más fácil encontrar páginas del tema de nuestro interés.

    • Más que buscar información sobre contenidos de la página, los resultados serán presentados haciendo referencia a los contenidos y temática del sitio.

    • Su tecnología es muy barata y sencilla.

    Ejemplos de directorios: Antiguos directorios, Open Directory Project, Yahoo!. Terra. Ahora, ambos utilizan tecnología de búsqueda jerárquica, y Yahoo! conserva su directorio. La mayoría de motores hispanos son directorios.

    BUSCADORES JERARQUICOS (ARAÑAS O SPDIDERS)

    Recorren las páginas recopilando información sobre los contenidos de las páginas. Cuando se busca una información en los motores, ellos consultan sus bases de datos y presentan y que representan resultados, de las webs los buscadores pueden almacenar desde las páginas de entrada, a todas las páginas que residan en el servidor.

    *Si se busca una palabra por ejemplo Ordenadores. En los resultados que ofrecerá el motor de búsqueda aparecerán páginas que contengan esta palabra en alguna parte de su texto



    *Si consideran que un sitio web es importante para el usuario, tienden a registrarlas todas. Si no la consideran importante, sólo almacenan una o más páginas.

    *Cada cierto tiempo, los motores revisan los sitios, para actualizar los contenidos de su base de datos, por lo que no es infrecuente que los resultados de la búsqueda estén desactualizados.

    *Los buscadores jerárquicos tienen una colección de programas simples y potentes con diferentes cometidos. Se dividen en tres partes. Los programas que exploran la red -arañas (spiders), los que construyen la base de datos y los que utiliza el usuario, el programa que explota la base de datos.

    *Se puede aparecer en las primeras páginas de resultados, aunque los principales buscadores delimitan estos resultados e indican al usuario que se trata de resultados esponsorizados o patrocinados. Ejemplos de arañas: Google, Bing, Hotbot.

    Como operan en forma automática, los motores de búsqueda contienen generalmente más información que los directorios.

    Estos últimos también han de construirse a partir de búsquedas o bien a partir de avisos dados por los creadores de páginas.

    Los buenos directorios combinan ambos sistemas, hoy en día el internet se ha convertido en una herramienta, para la búsqueda de información, rápida, para ello se han sugerido los buscadores que son un motor que búsqueda que nos facilita encontrar información rápida para cualquier área de las ciencias y de cualquier parte del mundo.
    INDICES TEMATICOS
    Son los sistemas de búsqueda por temas o categorías jerarquizados. Se trata de bases de datos de direcciones Web elaboradas Manualmente y que hay personas especialmente encargadas de asignar cada sitio Web a una categoría o tema determinado.


    MOTORES DE BUSQUEDA Y BUSQUEDA AVANZADA

    BIENBENIDOS A NUESTRO BLOG
    BUENO PARA EMPEZAR ESTOS TIPOS SON LOS CEADORES DEL BLOG Y TAMBIEN EL...




    EL TEMA QUE A NUESTROEQUIPO NOS TOCO EXPONER FUE EL DE BUSQUE DA Y BUSQUEDA AVANZADA PORFAS COMONTEN EN NUESTRO BLOG A VER QUE TAL ESTA LA INFORMACION Y QUIEN SABE A LO MEJOR LES SIRVE DE ALGO

    MOTORES DE LA BUSQUEDA


    Un motor de búsqueda es un sistema informativo que busca archivos almacenados en servidores web gracias a su spider. Un ejemplo son los buscadores de internet pero otros buscan además en noticias, cuando se pide la información de un tema. La búsqueda se hace con palabras clave o con los arboles jerárquicos por temas el resultado de la búsqueda es un listado de direcciones web en los que se mencionan temas relacionados con las palabras clave buscadas.