| 일 | 월 | 화 | 수 | 목 | 금 | 토 |
|---|---|---|---|---|---|---|
| 1 | 2 | 3 | 4 | 5 | 6 | |
| 7 | 8 | 9 | 10 | 11 | 12 | 13 |
| 14 | 15 | 16 | 17 | 18 | 19 | 20 |
| 21 | 22 | 23 | 24 | 25 | 26 | 27 |
| 28 | 29 | 30 |
- 데이터엔지니어
- 힙정렬
- 생성형 인공지능
- Transformer
- 알고리즘
- 트랜스포머
- Python
- RDBMS
- python기초
- 데이터 시각화
- 자연어처리
- dementional reduction
- RNN
- 객체지향
- 랭그래프
- CLIP
- TTS
- CNN
- SQL
- 기초
- 머신러닝
- 딥러닝
- ASR
- 에이전트
- UMAP
- 캐글
- 정보처리기사
- python 기초
- LangGraph
- 소프트웨어 개발
- Today
- Total
수달이네 기술 블로그
먼저 필요한 요소를 import한다.import timefrom selenium import webdriverfrom selenium.webdriver.common.keys import Keysfrom selenium.webdriver.common.by import By import pandas as pdimport openpyxl리뷰를 담을 리스트를 만들고, 크롬으로 리뷰를 가져온다.def crawl_yanolja_reviews(name, url, max_scroll=100): review_list = [] driver=webdriver.Chrome() driver.get(url) time.sleep(3)리뷰 확인리뷰사이트를 확인해보니 여러 리뷰가 있는데, 스크롤을 해야 새로운 리..
이미지 크롤링from selenium import webdriverdriver = webdriver.Chrome()url = ''driver.get(url)이미지 사이트에 들어감(크롬으로 url을 검색해서 들어가줌)from selenium.webdriver.support.ui import WebDriverWaitimage_xpath = '/html/body/div[1]/div[1]/div/div[2]/div[3]/div/div/div/div[2]/div/a/img' #이미지 자체의 xpathwait = WebDriverWait(driver,10) #최대 10초까지 기다려image_element = wait.until(EC.presence_of_element_located((By.XPATH, im..
셀레니움(selenium)셀레니움은 셀레니움은 브라우저를 사람이 직접 조작하는 것처럼 자동으로 제어할 수 있게 해주는 웹 자동화 도구이다.from selenium import webdriverwebdriver:웹 드라이버 관련 메서드들 포함driver = webdriver.Chrome()driver.get('')웹드라이버를 chrome으로 선택한 후 해당 드라이버에서 해당 url을 불러온다.웹에서 내가 찾고 싶은 객체에 우클릭 > 검사그러면 해당 객체에 해당하는 html을 찾아준다.여기서 name, 즉, 해당 객체를 부르는 별명을 찾은 후search = driver.find_element("name","q")find_element(key, value): 를 이용하여 객체를 찾아준다.search.send_..