Limitaciones generales del método de recolección de datos para efectos
de veracidad de los datos obtenidos.
- Internet es una red, en la cual no es posible llevar un control riguroso
de los datos. Por lo cual, debemos tomar como ciertos los datos generados
en las diversas páginas, tomando en cuenta que esta afirmación nos
puede llevar a extraer resultados falsos en relación con la verdadera
persona que creó estas páginas. Sin embargo, una página que contiene
una cantidad de información adecuada para ser tomada en consideración
por la araña, en la mayoría de los casos, contiene información valiosa
acerca de un autor.
- Otro sesgo que debemos tomar en cuenta, que limitará los resultados
obtenidos por el programa es la edad promedio de los usuarios de servicios
de Internet, principalmente sociales como MySpace, que oscilan entre
los 15 y 30 años. Los datos obtenidos de las páginas personales de
los miembros tribales serán limitados a las edades antes señaladas
en la mayoría de los casos.
Limitaciones técnicas a tomar en cuenta:
- La variedad de formatos y diseños creados por MySpace hace
difcil la tarea de recolección de datos. Se analizará el tipo de código
más frecuente basado en tablas (en oposición a las etiquetas DIV).
La información puede estár oculta para usuarios anónimos o que no
pertenecen a la lista de amigos de la persona dueña de la página.
Por lo tanto tendremos una cantidad importante de información no recuperable.
- A su vez, un gran número de personas no especifica el origen étnico
o raza dentro de las preferencias. Esto implicará la pérdida mas importante
de información. Dado el bajo nivel de recaudación de información,
es necesario guiar la búsqueda, limitando indexar links sólo
de amigos de nativos americanos, y aumentar la cantidad de búsquedas.
julio
2010-03-26