[파이썬] 뉴스 기사 수집하기(feat. 코드 포함)

[업무 자동화]/파이썬

[파이썬] 뉴스 기사 수집하기(feat. 코드 포함)

시간 확보러 2024. 10. 27. 08:00

파이썬을 통한 뉴스기사 수집하는 건 평소에 필요하지 않는다.

그 이유는 굳이 할 필요가 없기 때문이다.

하지만 뉴스기사를 분석해야 한다면??

꼭 필요한 기술이다.

수백 개의 URL을 일일이 눌러가면서 작업을 하기에는 시간이 많이 소요가 된다.

이번 연습사례는 뉴스기사를 크롤링 하는데 유용한 사례이다.

□파이썬 코드

import requests
from bs4 import BeautifulSoup
code = requests.get(f"http://underkg.co.kr/news")
soup = BeautifulSoup(code.text, "html.parser")
title = soup.select("h1.title > a")
for i in title:
    print(f"제목 : {i.text}")
    news_url=i.attrs['href']
    print(f"링크 : {news_url}")
    code_news=requests.get(news_url)
    soup_news=BeautifulSoup(code_news.text, "html.parser")
    content = soup_news.select_one("div.read_body")
    print(content.text)
    print(content.text.replace("\n", "").strip())
    print("------------------------------------------")

저작자표시 비영리 변경금지

'[업무 자동화] > 파이썬' 카테고리의 다른 글

[파이썬] CGV 영화정보 엑셀에 저장하기(feat. 건설업 부적합 정리) (1)	2024.11.03
[파이썬] 네이버 지식인 여러페이지 수집하기(feat. 코드 포함) (2)	2024.10.20
[파이썬] 네이버 연관검색어 수집하기(feat. 코드 포함) (2)	2024.10.13
[파이썬] 네이버 환율정보 수집하기(feat. 코드 포함) (2)	2024.10.06
[파이썬] 무비 차트 수집하기(feat. 코드 포함) (2)	2024.09.29

현재글[파이썬] 뉴스 기사 수집하기(feat. 코드 포함)

내 블로그 - 관리자 홈 전환	`Q` `Q`
새 글 쓰기	`W` `W`

글 수정 (권한 있는 경우)	`E` `E`
댓글 영역으로 이동	`C` `C`

이 페이지의 URL 복사	`S` `S`
맨 위로 이동	`T` `T`
티스토리 홈 이동	`H` `H`
단축키 안내	`Shift` + `/` `⇧` + `/`

경제적 독립 세팅 中