Técnica de extracción de datos: Araña Web

La técnica de búsqueda por medio de araña web(Ver algoritmo [*]), nos permite extraer información general de páginas web, o específica sobre ciertas páginas creadas bajo un mismo modelo.


\begin{algorithm}
% latex2html id marker 99\par
\caption{Araña Web
}
\par
\beg...
..., de lo contrario
fin.}\end{singlespace}\par
\end{enumerate}\par
\end{algorithm}

La expansión de la Web2.0 ha traído una interacción de una gran parte de los usuarios de Internet, antes excluidos de la generación de contenidos con la creación de páginas propias como blogs y una vida activa en las comunidades virtuales. La posibilidad de extraer información real, de personas reales, nos genera grandes perspectivas en el estudio de las dinámicas sociales que se dan en torno a estos servicios y a diversos temas de interés, además de poder obtener las interacciones entre diversos segmentos sociales. La araña obtiene información lo más real posible sobre la vida diaria de los nativos americanos residentes en Estados Unidos, tomando en cuenta las limitaciones y buscando superar éstas. Debemos recalcar que la información más cercana a la realidad que una encuesta directa, ya mejora en gran medida la autenticidad de los datos.

Se concentran los gustos y preferencias de los usuarios de MySpace a través de un sistema de información, con el cual se controla y concentra una cantidad significativa de cuentas contenidas en MySpace, suficientes para la realización de un estudio. Por lo tanto buscamos extraer la cantidad adecuada de datos, que permita acercar al investigador al comportamiento real de un sector de individuos usuarios de MySpace.



Subsections
julio 2010-03-26