Lista de empresas de buses

@fdelapena ¿cuál fue el xls que me enseñó que tenía la lista de empresas de buses?

http://aresep.go.cr/tarifas aqui filtrando por buses devuelve un enlace a un excel con todas las rutas y las empresas que las operan pero no estan los telefonos, el que vi era otro o lo han cambiado

en la columna “fecha gaceta” viene el nombre de la empresa

sí, ese es el que veo y está bien feo.

@fdelapena ¿usted sabe R? podríamos empezar sacando algunos datos de ahí.

no, no he tocado R todavía

hay uno histórico de 2015 que pesa más de 6 megas :sweat_smile: http://aresep.go.cr/images/documentos/TRANSPORTE/1.Tarifas/Tarifas_Autobus_2015-05-22.xlsx

guarde lo que esté haciendo en libreoffice antes de abrirlo

pero no trae nada adicional aparentemente, en algo se debe estar yendo el tamaño

leo prueba pandas

http://pandas.pydata.org/

sería bastante sencillo pasar de ese xlxs a una estructura que pandas pueda usar

pyexcel puede leer de forma fácil el xlxs

https://pythonhosted.org/pyexcel/

yo lo abrí con libreoffice y no me dió problema

yo pensaba hacer el tratamiento de datos con R.

@luisza14 pero si usted se apunta y prefiere python, lo puedo empezar con eso.

primero que está pensando hacer, así se si me puedo apuntar, se que es relacionado con la actividad del fin de semana, pero no estaba en la parte de dateros y no se en que quedaron de hacer

r tiene sentido si quiere procesar datos y generar estadísticas, pero a lo que me acuerdo iban a hacer un repo de datos no ?

para lista con cédulas jurídicas he encontrado esto: http://aresep.go.cr/images/noticias/Copia_de_ReporteValidarVF.xlsx

ok, en la seccion estadisticas deberia aparecer tambien

mientras alguien organiza el equipo y asigna responsabilidades, solo quiero escribir código para procesar los datos del xls que luego sean útiles para lo que sea que vayamos a hacer.

no sé cómo se llega a este documento, el sitio web es un lío http://aresep.go.cr/images/documentos/TRANSPORTE/3.Estadisticas/INFORME_FINAL-SITUACION_DE_OPERADORES_I-2015.xlsx

suena yo me apunto, haga un repo y yo me agrego como colaborador y me apunto a procesar los datos

ja, es pésimo. Podríamos enlazar los dos primeros documentos para sacar los nombres y las cédulas jurídicas de san josé.

ese último parece más decente. Pero dice 2015, el de tarifas es de 2016

bingo, teléfonos: http://aresep.go.cr/autobus/index.php?option=com_content&view=article&id=1545&catid=106&Itemid=315

aislando el iframe y mostrando 1000 registros parece útil

sí, podemos bajar el html y luego procesarlo igual.

@luisza14 ok, pero no entendí, python o R?

sí, todo.

lo que podemos hacer es una página de wiki en el github del proyecto, y echar todo ahí.

o podría ser en el wiki the osm, como @elotrojames está haciendo.

A mi me gusta mas python

Yo no se R la verdad

ok, python entonces.

yo me apunto a aprender lo que sea q vayan a hacer jaja

Ok por la noche les envió ejemplos de como procesar xlxs, igual pueden leer la doc de pyexcel

si alguien más quiere participar y aun no está en el grupo en github, que pase el usuario.

@luisza14 suba los ejemplos a github de una vez :+1: