lunes, 26 de mayo de 2008

Vínculos por un día de los diarios más destacados del país

En el post de la semana anterior ya les conté que quiero analizar una red vinculada a los medios de comunicación. Con esa idea, traté de llevar algo la clase pasada y al final no lo comparti, así que lo publico ahora.

Lo que hice no es parte del trabajo práctico, es sólo una prueba con herramientas que encontré y quise poner en funcionamiento para ver que salía.

Use un "robot" para rastrear los vínculos salientes desde los diarios más importantes de nuestro país, el día martes 21 de mayo.

Para revisar las páginas use el programa UrlNet, que es una serie de librerias Python para analizar los links en Internet.


Para graficar use el programa Pajek, que sirve para análisis y visualización de grandes redes.

Y para generar el reporte use el siguiente código Python

# urlforest1.py
from urlnet.urltree import UrlTree

diarios_urls = (
'http://www.lanacion.com.ar/',
'http://www.clarin.com/',
'http://www.infobae.com/interior/home.html',
'http://www.criticadigital.com/index.php',
'http://www.perfil.com/',
'http://www.pagina12.com.ar/diario/principal/index-2008-05-21.html')

net = UrlTree(_maxLevel=2)
success = net.BuildUrlForest(Urls=diarios_urls)
if success:
net.WritePajekFile('urlforest1', 'urlforest1')

Todo esto por si a alguno le interesa la parte mas técnica.

Lo importante es que el resultado está en el gráfico que sigue. Prometo algún análisis en posts siguientes.


Clickear sobre la imagen para verlo en pantalla completa.

No hay comentarios: