반응형 웹크롤링2 [웹크롤링] 랜덤 uger-agent, 랜덤 Proxy IP 우회 class from http_request_randomizer.requests.proxy.requestProxy import RequestProxy from fake_headers import Headers import requests class RANDOM_PROXY: def __init__(self): self.proxy = self.proxy_crate() self.crawling() def proxy_create(self): """ 무작위로 프록시를 생성해서 가져오는 코드 """ self.req_proxy = RequestProxy() proxy = self.test_proxy() # 잘 작동되는 프록시 선별 return proxy def test_proxy(self): """ 가져온 프록시중에서 실제로 작.. 2020. 11. 12. [웹크롤링] beautifulsoup 없이 하드코딩으로 60배 빠르게 웹크롤링하기 2020/11/11 - [python/python 성능개선] - [python] 라인마다 걸리는 시간을 체크해주는 line_profiler [python] 라인마다 걸리는 시간을 체크해주는 line_profiler 라인 프로파일러를 설치하는 방법은 간단하다. pip install line_profiler 하지만 나는 위 방법으로 자꾸 안깔려서 Anaconda navigator 에서 직접 파일을 검색해서 깔았더니 됬다. (windows) 실행하는 방법은 실 sulung-sulung.tistory.com 이전글에서 beautifulsoup 의 html.parser 가 너무 많은 시간을 잡아 먹는다는것을 알았다. 어떻게 이방식을 알았을까? html 같은 경우 bytes 파일로 떨어지는데 이걸 먼저 슬라이싱해서.. 2020. 11. 11. 이전 1 다음 반응형