Proyecto Cuasar - Creación de un buscador similar a Google. X)
Autor: David C.M
web del buscador: http://www.cuasar.com/spider_beta/
Trabajando en: Preparando el formulario de añadir web.
 

Lunes, 28 febrero 2005
Mantenimiento de CUASAR .

En unas horas colocaré una versión mejorada del spider, mucho más estable, más rápido y con nuevas posibilidades.
Para ello se está eliminando TODA la base de datos de urls.

Enviar comentario, crítica, sugerencia o error al autor de la noticia.

Miércoles, 23 febrero 2005
Nuevo comando, site:.

El spider cuasarBot se encuentra visitando la web las 24 horas del día en busca de nuevas páginas.

¿Quieres saber si cuasarBot ha visitado tu web y qué páginas ha encontrado?, tan sencillo como poner el comando site:

Ejemplo:

http://www.cuasar.com/spider_beta/search.php?q=site:http://www.smsafilia.com

Los resultados pueden ser:
· URL: La url está preparada para ser visitada por cuasarBot
· Título y descripción: La url ha sido visitada y en espera para la indexación.

Enviar comentario, crítica, sugerencia o error al autor de la noticia.

Lunes, 21 febrero 2005
Status interno del spider cuasar.

El Spider de cuasar.com consta de 3 niveles (filtro/normalizador, captura y extractor).

Filtro: Se encarga normalizar las urls y comprobar si son correctas.
Captura: El robot CuasarBot se encarga de visitar las páginas y almacenarlas en cache-html.
Extractor: Analiza el contenido HTML en busca de nuevos enlaces.

Para conocer el estado interno del spider cuasar.com se ha colocado una página que muestra de manera gráfica el nivel de carga de cada nivel. Un informe muy interesante para saber como responde el spider ante nuevos algoritmos de captura.

http://www.cuasar.com/blogs/status.php

Muy pronto se añadirá un nuevo nivel: Idiomas.

Enviar comentario, crítica, sugerencia o error al autor de la noticia.

Martes, 15 febrero 2005
Calculadora Cuasar (similar a Google), comando calc:

Como todos sabemos Google ofrece la posibilidad de operar con cálculos matemáticos, cuasar.com no va a ser menos, por lo que se ha creado la posibilidad de introducir en el cuadro de búsqueda operaciones matemáticas.
Ejemplos:
http://www.cuasar.com/spider_beta/search.php?q=10-30*pow(2)
http://www.cuasar.com/spider_beta/search.php?q=(100*8)/9

Enviar comentario, crítica, sugerencia o error al autor de la noticia.

Lunes, 14 febrero 2005
Cuasar ofrece Geolocalización IP, comando geo:

¿Necesitas saber la región geográfica de una dirección IP o de un dominio?
Tan simple como utilizar el comando GEO: de cuasar, en unos segundos conocerás los siguientes datos; país, provincia y ciudad. En algunos casos se muestra un mapa mundi con un punto rojo que indica la posición exacta.

Ejemplos:
http://www.cuasar.com/spider_beta/search.php?q=geo:http://www.cuasar.com
http://www.cuasar.com/spider_beta/search.php?q=geo:217.127.98.230

Gracias a la herramienta GEO el buscador cuasar.com estará preparado para la versión Local, segmentando los resultados del buscador en función de la procedencia del visitante.

Enviar comentario, crítica, sugerencia o error al autor de la noticia.

Viernes, 11 febrero 2005
Cuasar contra el SPAM, integración rel=nofollow

Uno de los grandes problemas que han surgido en muchas páginas web a raíz del creciente interés en el posicionamiento en buscadores, es el 'spam' que muchos webmasters generan intentando conseguir de esta manera enlaces hacia sus sitios web.

Para solucionar este problema los principales buscadores (Google, MSN y Yahoo) filtran los enlaces que contengan el atributo "rel=nofollow".
Cuasar no va a ser menos y como proyecto de buscador se suma a la iniciativa, a partir del día 12 de febrero el spider CuasarBot ignorará los enlaces que contengan el atributo "rel=nofollow".

Modo de uso:
Enlace normal: <a href="http://www.cuasar.com">Cuasar</a>
(Interpretado por los buscadores).

Enlace nofollow: <a hreg="http://www.cuasar.com" rel=nofollow>Cuasar</a>
(Ignorado por los buscadores).

Enviar comentario, crítica, sugerencia o error al autor de la noticia.

Miércoles, 9 febrero 2005
Mayor prioridad de indexación a URLs de primer nivel

Cuasar sigue capturando páginas y buscando nuevos enlaces. Para que la captura sea más eficaz se ha decidido que las urls se clasifiquen por niveles, una url con nivel más bajo será visitada antes que una url de mayor nivel.
El nivel se calcula en función del número de directorios que contenga.

Ejemplo:
Url1 a visitar: http://www.cuasar.com (nivel 0)
Url2 a visitar: http://www.cuasar.com/demo/demo.html (nivel 1)

Según el criterio la Url1 será visitada e indexada antes que la url2.
Resumiendo: las urls de nivel 0 tienen más prioridad.

Enviar comentario, crítica, sugerencia o error al autor de la noticia.

Lunes, 7 febrero 2005
Cuasar registra los dominios que comparten una IP

Una dirección IP puede ser compartida entre varios dominios, es una manera muy útil y a la vez sencilla de ahorrar direcciones IP (son muy caras).
El spider cuasarBot rastrea los dominios en busca de datos, y a la vez registra la dirección IP.

¿Necesitas conocer los dominios que se encuentran compartiendo el servidor de tu dominio?.
Para ello haz lo siguiente:

Paso 1. Ir al spider cuasar: http://www.cuasar.com/spider_beta/
Paso 2. Buscar: ip:http://www.tudominio.com
Ejemplo:
http://www.cuasar.com/spider_beta/index.php?q=ip%3Awww.cuasar.com&p=es

a los pocos segundos se mostrarán los dominios alojados en el servidor del. En el caso de que no aparezcan dominios ponte en contacto conmigo, envíame un mensaje con el dominio, y así poder comprobar si el spider ha visitado correctamente la veb.

Enviar comentario, crítica, sugerencia o error al autor de la noticia.

Jueves, 3 febrero 2005
El Spider CuasarBot ya detecta 6 idiomas

El spider cuasarBot obtiene el texto que puede ser indexado, pero como proceso previo intenta identificar el idioma del texto para su posterior clasificación, los idiomas que cuasarBot detecta:

· Español · Inglés · Francés · Catalán / Valenciano · Gallego · Euskera

Agradecimientos a Inforsol por su colaboración en la detección del Euskera.

Enviar comentario, crítica, sugerencia o error al autor de la noticia.

Miércoles, 2 febrero 2005
Nace el spider "CuasarBot"

A las 10.23h del día 2 de febrero de 2005 ha comenzado a funcionar el robot CuasarBot, cuya misión es rastrear todas las páginas de internet en busca de información. Suena bien, ¿verdad?
El spider se pasa las 24h del día visitando páginas y extrayendo urls de las páginas a las que visita. Descarta las urls visitadas y se centra en visitar las no conocidas, y así sin parar, hora tras hora, día tras día...

Para que os hagais una idea de lo que ve un spider cuando visita una web he colocado un simulador del spider CuasarBot en:

http://www.cuasar.com/spider_beta/

Características del spider:

· Normaliza la URL
· Asigna un identificador único
· Obtiene IP del Host
· Intenta detectar el país
· Muestra el estado de la URL
· Muestra cabecera HTTP
· Detecta tipo de documento
· Muestra enlaces encontrados
· Convierte URL absolutas
· Muestra URL que se filtran
· Muestra el texto a indexar
· Intenta identificar el idioma

El spider analiza el fichero robots.txt y filtra las urls.


Enviar comentario, crítica, sugerencia o error al autor de la noticia.

Martes, 1 febrero 2005
Nace el proyecto "buscador cuasar.com"

Cada vez aparecen menos buscadores en la red, incluso algunos de los que ya hay están pasando al olvido. Muchos son los factores implicados para que una empresa decida no investigar en la realización de un nuevo buscador, factores como: coste de realizar un buscadores, el "monopolio de Google", ingresos no asegurados (alto riesgo), crecimiento exponencial de la red, ... y un sin fin de impedimentos.

Es por ello que se decide crear el proyecto "cuasar.com", el objetivo es desarroolar un buscador modular, sencillo de usar y muy rápido. Para conseguir el objetivo se ha tomando como referencia el mejor buscador por ahora, el todopoderoso "Google". Otro objetivo no menos importante es la posibilidad de que los webmasters conozcamos de manera interna el funcionamiento de un buscador, pudiendo aprovechar estos conocimientos para desarrollar nuevas técnicas de posicionamiento.

En este blog se dará a conocer todos los detalles de cuasar, para que la comunidad webmaster pueda probar los nuevos algoritmos y aportar sugerencias e ideas.

Enviar comentario, crítica, sugerencia o error al autor de la noticia.

 

¿Qué es cuasar?
Proyecto sin ánimo de lucro que pretende crear un buscador con la misma potencia de los grandes buscadores como Google, Altavista, Yahoo... utilizando los mínimos recursos.

Herramientas cuasar:
· Spider beta
· Status Cuasar
· Comando IP:
· Comando GEO:
· Comando CALC:
· Comando SITE:

Colaboradores:
· Nebay. Indexación.
· Ocrum. PageRank

Archivo mensajes:
· Abril 2005
· Marzo 2005
· Febrero 2005

Mis enlaces diarios:
· Google dirson
· Forosdelweb
· Searchengineshowdown
·




2005 cuasar.com Proyecto ideado por David C.M