써 보면서 공부하는 걸 추천드립니다.
이 장에서는 네이버 첫 페이지의 데이터를 받아오는 크롤링을 한 번 보여드리겠습니다.
파이썬을 실행해 봅시다. 파이썬을 설치 안 하신 분들은 파이썬 3.x 버전을 설치하시고 오시길 바랍니다. 파이참도 가능합니다.
크롤링을 하는 프로그램을 '크롤러'라고 합니다.
결과는 다음과 같습니다.
이 텍스트를 웹 브라우저에서 해석해서 초록색으로 배치가 잘 된 네이버의 화면을 우리에게 보여주는데요 웹은 대부분 HTML형태로 되어 있씁니다. HTML 텍스트를 받아온 다음에 여기에서 우리가 필요한 정보들을 파싱할 수 있습니다.
다음 내용은 뷰티풀솝 사용 해서 파싱하는 것을 보여드리겠습니다.
'파이썬' 카테고리의 다른 글
크롤링 하기5 - 네이버에서 특정 글자 추출 및 네이버 파싱 (0) | 2020.03.25 |
---|---|
크롤링 하기4 - beautifulsoup 사용 방법 (0) | 2020.03.22 |
크롤링 하기3 - 뷰티풀솝 사용 및 설치 (0) | 2020.03.22 |
크롤러 만들기1 (파이썬 설치 하신 분들만) (0) | 2020.03.22 |
웹 기초 (0) | 2020.03.22 |