본문 바로가기

beautifulsoup6

[파이썬 크롤링] 06 - 이중 크롤링(?) 안녕하세요~ 일호15 입니다~ 오늘은 발렌타인데이를 기념하고자, 파이썬 크롤링을 한단계 업그레이드하는 시간을 가져보겠습니다! 지난 포스팅들 참고하셔서, 크롤링에 대한 감을 잡아보신다면 이중 크롤링도 문제없이 헤쳐나갈 수 있겠습니다. from bs4 import BeautifulSoup import requests url = 'https://dlfgh15.tistory.com/category/%EA%B3%A0%EB%93%B1%EC%88%98%ED%95%99' selector = 'div.inner span.title' #HTML과 CSS를 알아야 제목 정보를 고를 수 있다. R = requests.get(url) B = BeautifulSoup(R.content, 'html.parser') titles =.. 2023. 2. 14.
[파이썬 크롤링] 05 - select, select_one 안녕하세요! 일호15 입니다! 이 포스팅에 담겨있을 내용을 기대하셨다면 좋겠습니다. 야무지게 준비했거든요. 바로 가시죠! from bs4 import BeautifulSoup import requests url = 'https://dlfgh15.tistory.com/category/%ED%8C%8C%EC%9D%B4%EC%8D%AC%20%EC%B2%AB%EA%B1%B8%EC%9D%8C%3A/a%20%3D%20%27%EA%B0%9C%EB%85%90%27' selector = 'div.inner span.title' #HTML과 CSS를 알아야 제목 정보를 고를 수 있다. R = requests.get(url) B = BeautifulSoup(R.content, 'html.parser') titles = B... 2023. 1. 31.
[파이썬 크롤링] 04 - BeautifulSoup 안녕하세요~ 일호15 입니다! 제목에 BeautifulSoup이 두번이나 들어가있네요. 지난 배경설명 글들에 이어, 드디어 다룰 때가 되었음을 의미하는 것만 같네요. from bs4 import BeautifulSoup import requests url = 'https://dlfgh15.tistory.com/category/%ED%8C%8C%EC%9D%B4%EC%8D%AC%20%EC%B2%AB%EA%B1%B8%EC%9D%8C%3A/a%20%3D%20%27%EA%B0%9C%EB%85%90%27' selector = 'div.inner span.title' #HTML과 CSS를 알아야 제목 정보를 고를 수 있다. R = requests.get(url) B = BeautifulSoup(R.content, '.. 2023. 1. 16.
[파이썬 크롤링] 03 - requests 안녕하세요! 글을 쓰는 지금은 2023년 새해가 밝은 시점인데요. 지금의 저는 감회가 새로우니, 우리 다함께 requests에 대해 알아보겠습니다. from bs4 import BeautifulSoup import requests url = 'https://dlfgh15.tistory.com/category/%ED%8C%8C%EC%9D%B4%EC%8D%AC%20%EC%B2%AB%EA%B1%B8%EC%9D%8C%3A/a%20%3D%20%27%EA%B0%9C%EB%85%90%27' selector = 'div.inner span.title' #HTML과 CSS를 알아야 제목 정보를 고를 수 있다. R = requests.get(url) B = BeautifulSoup(R.content, 'html.parse.. 2023. 1. 3.
[파이썬 크롤링] 02 - HTML/CSS 안녕하세요! 산뜻한 마음으로 크롤링을 배워볼 시간입니다. 원활한 파이썬 크롤링을 위해, HTML과 CSS도 알아두면 좋은데요. 파이썬 배우는것만 해도 머리아픈데, HTML이랑 CSS도 알아야 한다니요. 어쩔 수 없죠. 산뜻한 마음으로 HTML/CSS를 알아봅시다. 처음부터 >> [파이썬 크롤링] 01 - 개요 1 웹페이지 더보기 웹페이지는 HTML, CSS 등으로 이루어져 있는데요. 이는 우리가 웹페이지를 만들고자 할 때 HTML과 CSS를 익힐 가치가 있음을 의미하며, 홈페이지를 만든 선배들은 HTML과 CSS를 배우고 익혀 홈페이지를 만들어냈음을 의미할 수 있겠죠. 우리는 후배 된 도리로서, 선배님들의 홈페이지를 털어볼건데요. HTML/CSS를 간단하게나마 알고 있으면 좋습니다. 보물을 털려면 보물지.. 2022. 12. 17.
[파이썬 크롤링] 01 - 개요 안녕하세요! 파이썬 크롤링 첫번째 시간입니다! 파이썬 크롤링.. 좋아보이긴 하는데 공부하기는 어려운.. 가볍게 크롤링 활용 예제로 시작할게요! 아래 사진은 제 블로그의 수학 카테고리인데요. 글의 제목들을 긁어오는 영상과 함께 시작해보겠습니다! 아하 파이썬 크롤링! 용어 정리부터 해볼게요. 크롤링(crawling). 기어다닌다는 뜻인데요. 우리가 알고있는 크롤링은, 사실 웹 스크래핑이라는 용어가 더 맞는 것 같아요. 진짜 크롤링은, 사이트 사이사이를 기어다니며 모든 사이트를 찾아내는 작업이거든요. 1 크롤링 더보기 그럼에도 불구하고, 저는 우리에게 친숙한 '크롤링'이라는 용어를 사용하여 설명을 진행하겠습니다. 웹 스크래핑을 설명드린 이유는, 우리가 하는 작업이 웹을 스크랩하는 작업이기 때문이에요. 신문 스.. 2022. 12. 2.