Discussion:
Leer sitio web desde php
(demasiado antiguo para responder)
+mArkO+
2009-10-03 17:33:13 UTC
Permalink
Estimados, necesito leer un contenido de un sitio web con un script en php
que hice. intenté con fopen y con file, pero con un sitio en especifico no
me funciona y se llega al maximo tiempo de ejecucion sin obtener resultados.
(el sitio web desde el navegador puedo verlo sin problemas)

¿a que se deberá esto?
¿alguna sugerencia para lograrlo?

gracias
José Miguel Santibáñez
2009-10-03 20:38:51 UTC
Permalink
Post by +mArkO+
Estimados, necesito leer un contenido de un sitio web con un script en
php que hice. intenté con fopen y con file, pero con un sitio en
especifico no me funciona y se llega al maximo tiempo de ejecucion sin
obtener resultados. (el sitio web desde el navegador puedo verlo sin
problemas)
¿a que se deberá esto?
¿alguna sugerencia para lograrlo?
Usa snoopy: sourceforge.net/projects/snoopy/
eso te permite emular mucho mejor un browser...
(por el tema de los headers, user-agents y afines)
--
Jose M. Santibañez A.
<***@nivel5.cl>
<http://caos.cl/jms>
+mArkO+
2009-10-04 20:07:27 UTC
Permalink
está buenísima. pero ese sitio que necesito no lo leyó.

no cachó que onda

www.sportQpress.Qcom/Qstats/es/

quitar las "Q" ...

si alguien tiene alguna luz al por qué no lee.
Post by José Miguel Santibáñez
Post by +mArkO+
Estimados, necesito leer un contenido de un sitio web con un script en
php que hice. intenté con fopen y con file, pero con un sitio en
especifico no me funciona y se llega al maximo tiempo de ejecucion sin
obtener resultados. (el sitio web desde el navegador puedo verlo sin
problemas)
¿a que se deberá esto?
¿alguna sugerencia para lograrlo?
Usa snoopy: sourceforge.net/projects/snoopy/
eso te permite emular mucho mejor un browser...
(por el tema de los headers, user-agents y afines)
--
Jose M. Santibañez A.
<http://caos.cl/jms>
José Miguel Santibáñez
2009-10-05 17:45:42 UTC
Permalink
Post by +mArkO+
está buenísima. pero ese sitio que necesito no lo leyó.
no cachó que onda
www.sportQpress.Qcom/Qstats/es/
quitar las "Q" ...
si alguien tiene alguna luz al por qué no lee.
Al menos a mi, desde firefox 3.5 e internet deplorer 8, saliendo por tie,
simplemente no me carga, así que imagino que hay algo "mal" en el sitio
mismo...

eso...
--
Jose M. Santibañez A.
<***@nivel5.cl>
<http://caos.cl/jms>
Marious
2009-10-04 00:24:13 UTC
Permalink
Post by +mArkO+
Estimados, necesito leer un contenido de un sitio web con un script en php
que hice. intenté con fopen y con file, pero con un sitio en especifico no
me funciona y se llega al maximo tiempo de ejecucion sin obtener resultados.
(el sitio web desde el navegador puedo verlo sin problemas)
¿a que se deberá esto?
¿alguna sugerencia para lograrlo?
gracias
Utiliza libCurl
http://cl.php.net/curl
Daniel V
2009-10-05 20:29:00 UTC
Permalink
Post by Marious
Post by +mArkO+
Estimados, necesito leer un contenido de un sitio web con un script en php
que hice. intent? con fopen y con file, pero con un sitio en especifico no
me funciona y se llega al maximo tiempo de ejecucion sin obtener resultados.
(el sitio web desde el navegador puedo verlo sin problemas)
?a que se deber? esto?
?alguna sugerencia para lograrlo?
gracias
Utiliza libCurl
http://cl.php.net/curl
Estimados,

Alguna vez tuve un problema similar, y resulto ser que el servidor donde
estaba alojado no permitia hacer estas llamadas remotas.
(no recuerdo si probe con fopen o libCurl, pero nada funcionaba...)
Instale el script en un servidor con menos restricciones y todo funciono
ok.., asi que yo probaria lo mismo en otro lado para descartar que el
servidor te este bloqueando la llamada.

Saludos,
Daniel
Marious
2009-10-05 23:32:54 UTC
Permalink
Post by +mArkO+
Post by Marious
Post by +mArkO+
Estimados, necesito leer un contenido de un sitio web con un script en php
que hice. intent? con fopen y con file, pero con un sitio en especifico no
me funciona y se llega al maximo tiempo de ejecucion sin obtener resultados.
(el sitio web desde el navegador puedo verlo sin problemas)
?a que se deber? esto?
?alguna sugerencia para lograrlo?
gracias
Utiliza libCurl
http://cl.php.net/curl
Estimados,
Alguna vez tuve un problema similar, y resulto ser que el servidor donde
estaba alojado no permitia hacer estas llamadas remotas.
(no recuerdo si probe con fopen o libCurl, pero nada funcionaba...)
Instale el script en un servidor con menos restricciones y todo funciono
ok.., asi que yo probaria lo mismo en otro lado para descartar que el
servidor te este bloqueando la llamada.
Saludos,
Daniel
Para que fopen lea un documento remoto, php debe tener habilitado
allow_url_fopen.

Para que libCurl funcione debe... estar instalado libCurl.

Si el servidor no tiene ninguna de esas no se podrá hacer. la gracia
de usar libCurl es que puedo enviar postdata, y falsear mi user-agent
http header para pasar por una visita cualquiera ante el otro servidor.
c***@gmail.com
2009-11-18 15:34:39 UTC
Permalink
Post by Marious
Para que libCurl funcione debe... estar instalado libCurl.
Sabias palabras... jaja
ShEnZy
2009-10-04 06:05:38 UTC
Permalink
mmmm dejame buscar un script que hice alguna vez para leer los datos desde
tesoreria.cl
lo que hace mi script es poder ingresar un numero de rol inicial y uno final
y entregar una tabla con todos los datos obtenidos de cada rol ..., pero los
datos los saca "leyendo" la pagina web...
Post by +mArkO+
Estimados, necesito leer un contenido de un sitio web con un script en php
que hice. intenté con fopen y con file, pero con un sitio en especifico no
me funciona y se llega al maximo tiempo de ejecucion sin obtener resultados.
(el sitio web desde el navegador puedo verlo sin problemas)
¿a que se deberá esto?
¿alguna sugerencia para lograrlo?
gracias
ShEnZy
2009-10-04 06:10:01 UTC
Permalink
intentaste con: file_get_contents() ?, yo utilice eso mas una funciona
llamada html2txt() que encontre por ahi en la web...
Post by +mArkO+
Estimados, necesito leer un contenido de un sitio web con un script en php
que hice. intenté con fopen y con file, pero con un sitio en especifico no
me funciona y se llega al maximo tiempo de ejecucion sin obtener resultados.
(el sitio web desde el navegador puedo verlo sin problemas)
¿a que se deberá esto?
¿alguna sugerencia para lograrlo?
gracias
Javier
2009-12-02 21:28:33 UTC
Permalink
Es reviejo el post, pero igual dejo una ayuda por si sirve a alguien con
algun caso similar.

El problema parece ser que el sitio requiere un request HTTP mas completo.
Particularmente me da la impresion de que necesita que se indique un
user-agent "valido"

Al bajar la pagina usando telnet, si solo hacia el "GET" no me mandaba
nada, pero si hago el request mas completo, si baja la pagina.

$ telnet www.sportpress.com 80
GET /stats/es/ HTTP/1.1
Host: www.sportpress.com
User-Agent: Mozilla/4.0 (compatible; MSIE 7.0; Windows NT 5.1)

(un salto de linea en blanco al final)

Es decir, debes usar un metodo que pueda simular un navegador de mejor
manera, donde puedas indicar un user-agent al menos.

Saludos,

Javier

Loading...