네이버 이미지 웹크롤링

import urllib.request
from  bs4 import BeautifulSoup
from selenium import webdriver
from selenium.webdriver.common.keys import Keys
import time
binary = 'chromedriver.exe'
options = webdriver.ChromeOptions()
options.add_experimental_option('excludeSwitches', ['enable-logging'])
browser = webdriver.Chrome(options=options)

browser.implicitly_wait(10)
browser.get("https://search.naver.com/search.naver?where=image&amp;sm=stb_nmr&amp;")

elem = browser.find_element_by_id('nx_query')
elem.send_keys("경복궁")
elem.submit()
for i in range(1, 5):
    browser.find_element_by_xpath("//body").send_keys(Keys.END)
    time.sleep(10)
time.sleep(10)
html = browser.page_source
soup = BeautifulSoup(html, "lxml")
def fetch_list_url():
    params = []
    imgList = soup.find_all("img", class_="_img")
    for im in imgList:
        try :
            params.append(im["src"])
        except KeyError:
            params.append(im["data-src"])
    return params
def fetch_detail_url():
    params = fetch_list_url()
    for idx,p in enumerate(params,1):
        urllib.request.urlretrieve(p, "C:/naver/" + str(idx) + ".jpg")
fetch_detail_url()
browser.quit()

밑에 저장할 폴더를 설정하고 이미지 크롤링할 검색어를 설정해준다.

크롬드라이버를 설치하고 실행하면 된다.

그럼 폴더에 이렇게 저장된다.

저작자표시 (새창열림)

'python' 카테고리의 다른 글

[google drive api] python으로 구글 드라이브에 xlsx 파일 업로드 (0)	2021.03.12
넘파이 끼리 곱연산이 안됨 (0)	2020.11.10
string 앞에 0채우기 (6자리) (0)	2020.11.10

Growth Learning

네이버 이미지 웹크롤링

'python' 카테고리의 다른 글

댓글

티스토리툴바

네이버 이미지 웹크롤링

'python' 카테고리의 다른 글

관련글

댓글

티스토리툴바