Python을 사용하여 웹 사이트의 HTML 소스 코드를 다운로드하려고 하는데이 오류가 발생합니다.
Traceback (most recent call last):
File "C:\Users\Sergio.Tapia\Documents\NetBeansProjects\DICParser\src\WebDownload.py", line 3, in <module>
file = urllib.urlopen("http://www.python.org")
AttributeError: 'module' object has no attribute 'urlopen'
나는 여기에 가이드를 따르고 있습니다 : http://www.boddie.org.uk/python/HTML.html
import urllib
file = urllib.urlopen("http://www.python.org")
s = file.read()
f.close()
#I'm guessing this would output the html source code?
print(s)
파이썬 3을 사용하고 있습니다.
답변
이것은 Python 2.x에서 작동합니다.
파이썬 3의 경우 문서를 살펴보십시오 .
import urllib.request
with urllib.request.urlopen("http://www.python.org") as url:
s = url.read()
# I'm guessing this would output the html source code ?
print(s)
답변
Python 2 + 3 호환 솔루션은 다음과 같습니다.
import sys
if sys.version_info[0] == 3:
from urllib.request import urlopen
else:
# Not Python 3 - today, it is most likely to be Python 2
# But note that this might need an update when Python 4
# might be around one day
from urllib import urlopen
# Your code where you can use urlopen
with urlopen("http://www.python.org") as url:
s = url.read()
print(s)
답변
import urllib.request as ur
s = ur.urlopen("http://www.google.com")
sl = s.read()
print(sl)
Python v3에서 “urllib.request”는 자체 모듈이므로 “urllib”는 여기서 사용할 수 없습니다.
답변
얻으려면 ‘ DATAX을 = urllib.urlopen (URL) .read () ‘파이썬에서 작업 3 (이 파이썬에 대한 올바른했을 것이다 2 ) 당신은 그냥이 작은 일들을 변경해야합니다.
1 : urllib 문 자체 (중간에 .request 추가) :
dataX = urllib.request.urlopen(url).read()
2 : 앞에 나오는 import 문 ( ‘import urlib’에서 다음으로 변경 :
import urllib.request
그리고 그것은 python3에서 작동해야합니다 🙂
답변
import urllib.request as ur
filehandler = ur.urlopen ('http://www.google.com')
for line in filehandler:
print(line.strip())
답변
파이썬 3의 경우 다음과 같이 시도하십시오.
import urllib.request
urllib.request.urlretrieve('http://crcv.ucf.edu/THUMOS14/UCF101/UCF101/v_YoYo_g19_c02.avi', "video_name.avi")
비디오를 현재 작업 디렉토리로 다운로드합니다
답변
Python3 용 솔루션 :
from urllib.request import urlopen
url = 'http://www.python.org'
file = urlopen(url)
html = file.read()
print(html)