Chileabolsa.com/blog
Loading

No estas registrado.

#661 28-04-19 12:02

Pontifex
Moderador
Calificacion :   107 

Re: PriceDownloader_Generic: El downloader todo terreno (y en 3 clics)

aers...


"LASCIATE OGNI SPERANZA, VOI CH’ENTRATE" Dante " La divina Comedia"

Desconectado

#662 28-04-19 14:08

asdfgh
Miembro
Calificacion :   11 

Re: PriceDownloader_Generic: El downloader todo terreno (y en 3 clics)

con este post empecé mis rutinas para obtener info:

https://stackoverflow.com/questions/270 … -using-vba

Desconectado

#663 29-04-19 09:51

get free
Miembro
Calificacion :   133 

Re: PriceDownloader_Generic: El downloader todo terreno (y en 3 clics)

Hace años alguien preguntó lo mismo y escribí un breve resumen explicando por donde partir aprendiendo.
Es el post #194 de ese mismo tema:
http://www.chilebolsa.com/foro/viewtopi … 23#p209323

Para el caso especifico de web scraping. Hay dos tecnicas distintas para lograr eso.

Una es usando una cosa llamada XPath.
Usando el lenguaje de programacion de tu eleccion, tienes que:
1. Bajar el HTML de la pagina web que tiene los datos
2. Usar XPath para extraer lo datos desde ese HTML
3. Guardar lo datos en un archivo o base de datos o donde sea que los necesites

La otra tecnica es usando selectores CSS.
Igualmente, usando el lenguaje de programacion de tu eleccion, tienes que:
1. Abrir una instancia oculta de un navegador web (normalmente Internet Explorer, pero tambien puede ser Chrome, aunque es mas complicado)
2. Invocar la ejecucion de codigo javascript dentro la pagina web ya procesada por el navegador.
3. Ese codigo javascript debe hacer uso de selectores CSS para extraer la informacion de la pagina web
4. Cerrar la instancia oculta del navegador
5. Guardar los datos en un archivo, BD o donde sea.

Dependiendo del leguaje que escojas, es más facil una u otra tecnica.
Por ejemplo usando tecnologias Microsoft (JScript, VBS, VBA, Excel) es mas facil la segunda técnica porque esos lenguajes están pensados para interactuar con otros productos Microsoft como Internet Explorer.

Si escojes otro lenguaje como Python o PHP, es mas facil (y preferible) usar la primera técnica que no requiere iniciar una instancia del navegador (lo cual siempre es lento) y ademas tiene la ventaja que XPath es superior en funcionalidad a los selectores CSS.

Por supuesto, todas estas siglas y nombres no te van a decir nada en un principio. Pero son una guía para saber por donde partir googleando.


Existen 10 clases de traders: los que entienden binario y los que no.

Desconectado

#664 02-05-19 05:35

Pontifex
Moderador
Calificacion :   107 

Re: PriceDownloader_Generic: El downloader todo terreno (y en 3 clics)

Muchas gracias por tomarte el espacio y responder, la verdad la bolsa esta algo fome y generalmente en momentos como este me pongo "creativo" (reinstalo linux por ejemplo, o me pongo a cacharrear con C) es eso o ponerme a jugar star citizen y SC no me da lucas, al contrario me las quita.

saludos!
Px


"LASCIATE OGNI SPERANZA, VOI CH’ENTRATE" Dante " La divina Comedia"

Desconectado

#665 20-05-19 10:54

Ultra
Miembro
Calificacion :   

Re: PriceDownloader_Generic: El downloader todo terreno (y en 3 clics)

Hola, consulta, me ensamble una version del Meta11 portable en disco D (todas las rutas en duro). Mucho editor hex, todas las dlls metidas. Unzip en el disco y listo, ideal para maquina sin permisos de admin.
El que quiere probar, va por su cuenta y riesgo, sin soporte y menos por aca.

PD: Creo que es un offtopic, no?

Desconectado

Pie de página

Powered by FluxBB