<?xml version="1.0" encoding="utf-8"?>
<rss version="2.0">
   <channel>
      <title>Proyecto Cuasar</title>
      <link>http://www.cuasar.com</link>
      <description>Desarrollo de un buscador de Internet paso a paso</description>
      <language>es-es</language>
      <docs>http://www.causar.com/rss.php</docs>
      <generator>BookBlog</generator>
      <item>
         <title>Ciclo de vida del proyecto Cuasar</title>
         <link>http://www.cuasar.com/tema-ciclo-de-vida/</link>
         <description>&lt;p&gt;Proyecto Cuasar sigue un ciclo de vida basado en 6 etapas:&lt;/p&gt;&lt;ul&gt;&lt;li&gt;Planificación y especificación&lt;/li&gt;&lt;li&gt;Diseño del proyecto&lt;/li&gt;&lt;li&gt;Tratamiento de excepciones&lt;/li&gt;&lt;li&gt;Implementación&lt;/li&gt;&lt;li&gt;Pruebas&lt;/li&gt;&lt;li&gt;Calidad del proyecto&lt;/li&gt;&lt;/ul&gt;&lt;p&gt;En la &quot;planificación y especificación&quot; se detallan los aspectos relativos a plazos de desarrollo de cada subsistema y el objetivo a conseguir con el buscador. Al ser un proyecto personal y sin compromiso temporal, los intervalos de tiempo serán&amp;#160; aproximados, siempre en función del tiempo libre disponible para dedicarlo al proyecto.&lt;br /&gt;El objetivo es evidente, conseguir un buscador semántico e inteligente. Se detallan más detalles en el apartado correspondiente.&lt;/p&gt;&lt;p&gt;&quot;En diseño&quot; se detallan los algoritmos que hacen funcionar al buscador, así como la arquitectura de sistemas y gestión de base de datos.&lt;/p&gt;&lt;p&gt;&quot;Tratamiento de excepciones&quot;, se detallan las relaciones entre los algoritmos, control de errores y gestión de cualquier incidencia.&lt;/p&gt;&lt;p&gt;&quot;Implementación&quot;, desarrollo a nivel de código y puesta en marcha de la plataforma tecnológica según lo detallado en &quot;Diseño&quot;.&lt;/p&gt;&lt;p&gt;&quot;Pruebas&quot;, una vez en producción, se da acceso al buscador por invitación a usuarios que acepten testear los algoritmos de búsqueda.&lt;/p&gt;&lt;p&gt;&quot;Calidad de proyecto&quot;, responder a la pregunta, ¿los enlaces sugeridos a una búsqueda son coherentes?&lt;/p&gt;		</description>
         <pubDate>Fri, 09 Mar 2012 00:00:00 +0100</pubDate>
         <guid isPermaLink="false">http://www.cuasar.com/tema-ciclo-de-vida/</guid>
      </item>
      <item>
         <title>Buscadores de noticias</title>
         <link>http://www.cuasar.com/tema-clases/vertical/buscador-noticias/</link>
         <description>&lt;p&gt;Buscadores verticales existen de todas las temáticas, los principales buscadores genéricos (Yahoo!, Bing y Google) ofrecen la posibilidad de buscar noticias. En realidad lo que hacen es redireccionar a un buscador especializado. Éstos tienen una infraestructura diferenciada del buscador genérico, la misión de estos crawlers es rastrear los sitios web que ofrezcan noticias.&lt;/p&gt;&lt;p&gt;Por lo general, el listado de las fuentes información suelen revisarse y añadirse utilizando interveción humana.&lt;/p&gt;&lt;p&gt;Las funciones de los buscadores de noticias se pueden resumir en:&lt;/p&gt;&lt;ul&gt;&lt;li&gt;Rastreo de los principales medios online&lt;/li&gt;&lt;li&gt;Identificar los enlaces de las noticias&lt;/li&gt;&lt;li&gt;Captura de titulares&lt;/li&gt;&lt;li&gt;Captura de los textos informativos&lt;/li&gt;&lt;li&gt;Clasificación de la noticia (Social, Internet, Economía, ...)&lt;/li&gt;&lt;li&gt;Otras funciones (noticia del día, noticias más destacadas, ...)&lt;/li&gt;&lt;/ul&gt;&lt;p&gt;Es importante indicar que los buscadores de noticias no deben mostrar la noticia completa, simplemente indicar el titular y una pequeña entradilla que motive al navegante a pinchar sobre la fuente, para acceder a la noticia completa.&lt;/p&gt;&lt;p style=&quot;font-weight: bold;&quot;&gt;Proyecto cuasar.com ya tiene un potente &lt;a title=&quot;Buscador de noticias&quot; href=&quot;http://www.cunoticias.com&quot;&gt;buscador de noticias&lt;/a&gt;&lt;/p&gt;&lt;p&gt;Así es, desde el 2008 se rastrean las principales fuentes de información online a través del sitio web &lt;a title=&quot;Buscador de noticias&quot; href=&quot;http://www.cunoticias.com&quot;&gt;cunoticias.com&lt;/a&gt;, por lo que el proyecto Cuasar.com ya tiene algo visible y operativo conocido por todos.&lt;/p&gt;	</description>
         <pubDate>Thu, 19 Jan 2012 00:00:00 +0100</pubDate>
         <guid isPermaLink="false">http://www.cuasar.com/tema-clases/vertical/buscador-noticias/</guid>
      </item>
      <item>
         <title>Buscador semántico</title>
         <link>http://www.cuasar.com/tema-clases/semantico/</link>
         <description>&lt;p style=&quot;font-style: italic;&quot;&gt;Buenas tardes, señores. Soy un computador HAL 9000, comencé a funcionar 
en la fábrica HAL en Verbana, Illinois el 12 de enero de 1992...&lt;br /&gt;
HAL 9000 - Ordenador de &quot;Una odisea del espacio&quot;&lt;/p&gt;&lt;p&gt;Existe cierta confusión en definir un buscador semántico,&amp;#160; se habla de web semántica, buscadores semánticos, términos semánticos entre una larga lista de términos similares. Al final, el usuario puede estar confuso entre tanta algarabía.&lt;/p&gt;&lt;p style=&quot;font-weight: bold;&quot;&gt;¿Para Cuasar qué es un buscador semántico?&lt;/p&gt;&lt;p&gt;Para Cuasar un buscador semántico es aquel que &quot;entiende el significado&quot; de:&lt;/p&gt;&lt;ul&gt;&lt;li&gt;La información rastreada por los spiders&lt;/li&gt;&lt;li&gt;Lo que pretende buscar el usuario&lt;/li&gt;&lt;/ul&gt;&lt;p&gt;Cuasar tiene características de buscador semántico, la información se descompone en conceptos relacionados para reconocer el contexto correcto de las palabras rastreadas o términos introducidos por los usuarios.&lt;/p&gt;&lt;p&gt;Buscador semántico es sinónimo de inteligencia artificial, el cerebro de Cuasar se basa en una compleja red neuronal cuyos parámetros se realimentan con lógica borrosa (Fuzzy Logic). Las neuronas de Cuasar admiten cierta incertidumbre, ¿incertidumbre en la información?, ... relaciones entre distintas disciplinas del saber, ... ¿?&lt;/p&gt;&lt;p&gt;Las ventajas son muchas, pero la más importante para desarrollar un buscador con los mínimos recursos, es que se indexan conceptos y no palabras. Interesante, ¿verdad?, poco a poco, se irá publicando más detalles de los algoritmos.&lt;/p&gt;				</description>
         <pubDate>Wed, 26 Oct 2011 00:00:00 +0200</pubDate>
         <guid isPermaLink="false">http://www.cuasar.com/tema-clases/semantico/</guid>
      </item>
      <item>
         <title>Buscador vertical</title>
         <link>http://www.cuasar.com/tema-clases/vertical/</link>
         <description>	&lt;p&gt;&quot;Un buscador vertical, es un buscador especializado en un sector o nicho 
concreto, lo que le permite analizar la información con mayor 
profundidad que un buscador genérico, disponer de resultados más 
actualizados y ofrecer al usuario herramientas de búsqueda avanzadas.&quot; - Wikipedia&lt;/p&gt;&lt;p&gt;Un buscador genérico rastrea tantos dominios y páginas internas como le sea posible, mientras que un buscador vertical rastrea páginas de una misma temática. En principio, los sitios web de un buscador vertical son introducidos manualmente por el webmaster.&lt;/p&gt;&lt;p&gt;Ejemplos:&lt;/p&gt;&lt;ul&gt;&lt;li&gt;Buscadores genéricos: Bing, Yahoo!, Google, Ask, ...&lt;/li&gt;&lt;/ul&gt;&lt;ul&gt;&lt;li&gt;Buscadores temáticos: &lt;a title=&quot;Buscador de retroinformática&quot; href=&quot;http://www.curetro.com&quot;&gt;cuRetro&lt;/a&gt; (de retroinformática), &lt;a title=&quot;Buscador de noticias&quot; href=&quot;http://www.cunoticias.com&quot;&gt;cuNoticias&lt;/a&gt; (buscador de noticias), ...&lt;/li&gt;&lt;/ul&gt;&lt;p style=&quot;font-weight: bold;&quot;&gt;¿Cuasar es un buscador genérico o vertical?&lt;/p&gt;&lt;p&gt;Ambas cosas, el spider principal (el módulo encargado de rastrear Internet) analiza el contenido de todos los dominios, posteriormente la información se categoriza y un módulo auxiliar comprueba si el contenido debe pertenecer a un buscador especializado.&lt;/p&gt;&lt;p&gt;Por ejemplo, si buscas enCuasar un hotel te redireccionará a un buscador especializado de turismo.&lt;/p&gt;&lt;p&gt;No es una novedad exclusiva de Cuasar, los grandes buscadores ya lo vienen haciendo desde hace tiempo, buscador de vuelos, buscador de hoteles, ...&lt;/p&gt;	</description>
         <pubDate>Mon, 17 Oct 2011 00:00:00 +0200</pubDate>
         <guid isPermaLink="false">http://www.cuasar.com/tema-clases/vertical/</guid>
      </item>
      <item>
         <title>Directorios</title>
         <link>http://www.cuasar.com/tema-clases/directorio/</link>
         <description>&lt;p&gt;&quot;Un directorio web es un tipo de sitio web que contiene un directorio organizado de enlaces a otros sitios web, con una estructura de categorías y subcategorías. Habitualmente, los directorios web permiten a los webmasters o creadores de sitios web que informen de su sitio para que sea incluido, y después los editores autorizados revisan esas solicitudes antes de incluir sus enlaces para comprobar que se adecúan a los requisitos de aceptación determinados por el directorio web.&quot; - Wikipedia&lt;/p&gt;&lt;p&gt;Los directorios pueden ser de dos tipos:&lt;/p&gt;&lt;ul&gt;&lt;li&gt;Directorio general (todo tipo de categorias)&lt;/li&gt;&lt;li&gt;Directorio temático (especializado en una categoría)&lt;/li&gt;&lt;/ul&gt;&lt;p&gt;El webmaster debe enviar la información de su sitio; título, descripción, url y categoría. Posteriormente el administrador del directorio revisará la información y decidirá si acepta el sitio web para su publicación. Es un proceso manual.&lt;/p&gt;&lt;p&gt;¿Y Cuasar? ¿Qué relación tiene Cuasar con un directorio?&lt;/p&gt;&lt;p&gt;Mucha, uno de los módulos de Cuasar se dedica a categorizar los sitios web rastreados. Es decir, de manera automática detecta la categoría a la que pertenece la información y va creando un directorio interno que ayuda a la indexación. También, es útil para detectar si el sitio web debe formar parte de un buscador temático.&lt;/p&gt;&lt;p&gt;En otros apartados comentaré con más detalles la importancia del directorio interno.&lt;/p&gt;		</description>
         <pubDate>Sat, 15 Oct 2011 00:00:00 +0200</pubDate>
         <guid isPermaLink="false">http://www.cuasar.com/tema-clases/directorio/</guid>
      </item>
      <item>
         <title>Clases de buscadores</title>
         <link>http://www.cuasar.com/tema-clases/</link>
         <description>&lt;p&gt;Estamos acostumbrados a utilizar Internet de manera instintiva, probablemente la primera toma de contacto con Internet sea la de buscar información utilizando cualquiera de los buscadores más conocidos (Bing, Yahoo!, Google). Para la mayoría de los usuarios Internet es información y en segundo lugar comunicación.&lt;/p&gt;&lt;p&gt;Ahora bien, la información está distribuida en millones de ordenadores y es imposible encontrarla sin ayuda de los buscadores. Tras realizar una búsqueda el usuario obtiene de manera instantánea los resultados, sin ser consciente de la ingente cantidad de recursos necesarios para mostrar los resultados. Es un trabajo muy complejo y cada buscador funciona de manera diferente a pesar de mostrar resultados similares.&lt;/p&gt;&lt;p&gt;En este punto, deseo mostrar las distintas clases de buscadores y comentar el tipo de buscador Cuasar.&lt;/p&gt;&lt;p&gt;Existen buscadores que rastrean Interner en busca de nuevos dominios, analizan el contenido y extraen nuevos dominios. Otros buscadores se limitan a rastrear un grupo de sitios web que comparten la misma temática. Existen diferentes tipos de buscadores, a grosso modo se pueden clasificar en:&lt;/p&gt;&lt;ul&gt;&lt;li&gt;Índices temáticos: Son buscadores especializados en temas concretos. Existe una parte manual, un administrador acepta o rechaza la fuente.&lt;/li&gt;&lt;li&gt;Motores de búsqueda: 100% automáticos, rastrean Internet e indexan la información utilizando complejos algoritmos. Cada vez más se asocia la inteligencia artificial a estos buscadores.&lt;/li&gt;&lt;/ul&gt;&lt;p style=&quot;font-weight: bold;&quot;&gt;Clases de buscadores&lt;/p&gt;&lt;p&gt;&lt;strong&gt;Buscadores jerárquicos: &lt;/strong&gt; Son los motores de búsqueda que disponen de los spiders más potentes, rastrean Internet, buscando información e indexándola palabra por palabra. A esta clase pertenecen los buscadores: Bing, Yahoo! y Google.&lt;/p&gt;&lt;p&gt;&lt;strong&gt;Directorios:&lt;/strong&gt; Son pequeños buscadores, es nacesario la participación humana. Tienen la ventaja de que la información es clasificada y ordenada de manera jerárquica. El directorio más conocido es DMOZ&lt;/p&gt;&lt;p&gt;&lt;strong&gt;Metabuscadores: &lt;/strong&gt;Son buscadores sin un motor de búsqueda propio, lanzan la consulta a varios buscadores jerárquicos y los resultados son obtenidos de éstos.&lt;/p&gt;&lt;p&gt;&lt;strong&gt;Buscador verticales: &lt;/strong&gt;Son buscadores especializados en una temática concreta, tienen su propio motor de búsqueda pero limitado a ciertas categorías. El spider no rastrea Internet en busca de dominios, éstos son introducidos por un administrador que acepta y rechaza según ciertos criterios. Dos ejemplos, el buscador de &lt;a title=&quot;Buscador de noticias&quot; href=&quot;http://www.cunoticias.com&quot;&gt;noticias&lt;/a&gt; &lt;a title=&quot;Noticias&quot; href=&quot;http://www.cunoticias.com&quot;&gt;Cunoticias.com&lt;/a&gt; y el buscador de &lt;a title=&quot;Retroinformática&quot; href=&quot;http://www.curetro.com&quot;&gt;retroinformática&lt;/a&gt; &lt;a href=&quot;http://www.curetro.com&quot;&gt;cuRetro&lt;/a&gt;.&lt;/p&gt;&lt;p&gt;&lt;strong&gt;Buscadores semánticos:&lt;/strong&gt; Es la última generación de buscadores, realizan la búsqueda atendiendo al significado del grupo de palabras. Es decir, un buscador inteligente.&lt;/p&gt;&lt;p style=&quot;font-weight: bold;&quot;&gt;Buscador Cuasar&lt;/p&gt;&lt;p&gt;Cuasar es un híbrido de buscador jerárquico y semántico, realiza las funciones propias de un completo buscador al estilo de Google. Rastrea Internet en busca de nuevos dominios, manipula la información; clasifica, ordena, categoriza, &lt;em&gt;comprende la información&lt;/em&gt; y muestra resultados.&lt;/p&gt;&lt;p&gt;Además, Cuasar tiene características propias de buscador vertical. Para ciertas búsquedas se transforma en un completo buscador especializado, ¿cómo? poco a poco lo iremos viendo.&lt;/p&gt;&lt;p&gt;Por último, destacar que Cuasar también tiene cierta relación con los directorios, la información es categorizada pero a diferencia de que dicho proceso es 100% automático e independiente de la intervención humana.&lt;/p&gt;&lt;p&gt;Poco a poco iré destripando el cerebro de Cuasar y mostrando las distintas fases de desarrollo.&lt;/p&gt;			</description>
         <pubDate>Thu, 13 Oct 2011 00:00:00 +0200</pubDate>
         <guid isPermaLink="false">http://www.cuasar.com/tema-clases/</guid>
      </item>
      <item>
         <title>Buscadores jerárquicos</title>
         <link>http://www.cuasar.com/tema-clases/jerarquico/</link>
         <description>&lt;p&gt;Cuasar tiene características de buscador jerárquico, con los siguientes detalles:&lt;/p&gt;&lt;ul&gt;&lt;li&gt;Rastrea Internet en busca de dominios e indexa por separado la página principal y los subcontenidos. En otro punto se detallará la razón de ésta diferencia.&lt;/li&gt;&lt;li&gt;En los resultados del buscador se mostrarán páginas que están relacionadas con el término buscado.&lt;/li&gt;&lt;li&gt;Analizará la importancia del sitio web y en función de una escala procederá a un tipo de indexación. Más adelante se comentará la escala y los tipos de indexación.&lt;/li&gt;&lt;li&gt;Cada cierto tiempo, el buscador comprobará el estado del sitio web. Tanto a nivel de actualización como de actividad.&lt;/li&gt;&lt;li&gt;Obtiene información técnica y social del sitio rastreado (por ejemplo, número de dominios que comparten misma IP, Geolocalización, ...)&lt;/li&gt;&lt;li&gt;Panel de control para webmasters.&lt;/li&gt;&lt;/ul&gt;&lt;p&gt;Cabe recordar que Cuasar es un híbrido, entre jerárquico, directorio y semántico. Pero la base del spider es propia de un buscador jerárquico, dejando para niveles superiores los algoritmos semánticos y de categorización.&lt;/p&gt;		</description>
         <pubDate>Thu, 13 Oct 2011 00:00:00 +0200</pubDate>
         <guid isPermaLink="false">http://www.cuasar.com/tema-clases/jerarquico/</guid>
      </item>
   </channel>
</rss>
