728x90

[업무 자동화]/파이썬 12

[파이썬] CGV 영화정보 엑셀에 저장하기(feat. 건설업 부적합 정리)

이미지, 개봉일, 예매율 등 CGV에 올라온 영화정보를 엑셀에 저장하는 실습이다. 건설업에서는 부적합 사진을 정리하는 일에 많은 시간이 소요된다.이때 찍은 사진을 한 폴더에 넣고 일시 등의 정보를 가져올 수 있다면많은 시간을 아낄 수 있을것으로 보인다.   □ 파이썬 코드import requestsfrom bs4 import BeautifulSoupimport urllib.request as reqimport osimport openpyxlfrom openpyxl.drawing.image import Imagefrom PIL import Image as PILImagebook = openpyxl.Workbook()sheet=book.activecode = requests.get("http://www.cg..

[파이썬] 뉴스 기사 수집하기(feat. 코드 포함)

파이썬을 통한 뉴스기사 수집하는 건 평소에 필요하지 않는다.그 이유는 굳이 할 필요가 없기 때문이다. 하지만 뉴스기사를 분석해야 한다면??꼭 필요한 기술이다.수백 개의 URL을 일일이 눌러가면서 작업을 하기에는 시간이 많이 소요가 된다.이번 연습사례는 뉴스기사를 크롤링 하는데 유용한 사례이다.  □파이썬 코드import requestsfrom bs4 import BeautifulSoupcode = requests.get(f"http://underkg.co.kr/news")soup = BeautifulSoup(code.text, "html.parser")title = soup.select("h1.title > a")for i in title:    print(f"제목 : {i.text}")    news_..

[파이썬] 네이버 지식인 여러페이지 수집하기(feat. 코드 포함)

인터넷에 접속하여 자료 조사를 하다 보면, 페이지가 여러개가 있는 경우가 있다. 그럴 경우 페이지를 순서대로 하나씩 눌러가면서 자료를 확인한다.10개미만이면 하겠지만, 수백개가 되면 하나하나 하기에는 한계가 있다. 그래서 파이썬이 필요하다.이번에는 네이버 지식인에서 여러 페이지를 한번에 수집하는 것을 실시해 보겠다. 인터넷 상에서는 페이지 등은 특정번호만 바뀌는 것이기에for문으로 묶어주면 어렵지 않게 구현할 수 있다.  ※ 파이썬 코드import requestsfrom bs4 import BeautifulSoupkeyword = input("키워드 입력 >> ")for page_num in range(1,11):    code = requests.get(f"https://kin.naver.com/sea..

[파이썬] 네이버 연관검색어 수집하기(feat. 코드 포함)

네이버에 키워드를 검색하면 연관검색어를 알 수 있는데, 일일이 접속하지 않고파이썬 코드를 사용하여 수집해보자. 이런 코드는 나중에 안전 관련 키워드를 검색했을 때현재 어떤 연관검색어가 나오는지 알 수 있고 이를 통해 Trend를 확인하는데 도움이 될것으로 판단된다.  ※ 파이썬 코드import requestsfrom bs4 import BeautifulSoupkeyword = input("키워드 입력 >> ")code = requests.get(f"https://search.naver.com/search.naver?ie=UTF-8&sm=whl_hty&query={keyword}")soup = BeautifulSoup(code.text, "html.parser")title=soup.select("div.r..

[파이썬] 네이버 환율정보 수집하기(feat. 코드 포함)

이번에는 네이버 환율정보 수집하는 코드를 작성해 보려고 한다.인터넷에 접속하여 일일이 확인할 필요가 없어서,나중에 ESG나 선진사의 사고 정보 등 정보를 수집하는데 도움이 될 것으로 보인다.  ※ 파이썬 코드import requestsfrom bs4 import BeautifulSoupcode=requests.get("https://finance.naver.com/marketindex")soup=BeautifulSoup(code.text, "html.parser")price=soup.select("ul#exchangeList span.value")for i in price:    print(i.text)

[파이썬] 무비 차트 수집하기(feat. 코드 포함)

저번에 음원 차트를 실시하고 이번에는 무비 차트 수집이다. 이 책이 정말 좋은게 설명이 자세하다.저자가 말씀한것과 같이,"누군가에게 원리부터 차근차근 설명을 들었더라면 실수를 줄이고 더 재미있게 공부했을 텐데 그러지 못했다. 독자느 ㄴ필자처럼 시행착오를 겪지 않도록 필자의 지식을 모두 전수하려고 한다." 먼저 결과를 공유하면 아래와 같이 구할 수 있다.  아래와 같이 파이썬 코드를 전체 공유하니, 필요하신 분들은 활용하시기 바랍니다. ※ 파이썬 코드import requestsfrom bs4 import BeautifulSoupcode = requests.get("http://www.cgv.co.kr/movies/?lt=1&ft=0")print(code.text) soup=BeautifulSoup(code..

[파이썬] 음원 차트 수집하기(feat. 코드 포함)

나의 경쟁력을 키우기 위해 파이썬을 공부하고 있는 직장인입니다. 파이썬의 문법을 공부하기 보다는, 활용에 치중을 두고 있습니다.(저는 전문가가 아니기 때문에..) 이런 사유로 책을 고를 때도 실용위주로 선정하곤 합니다.그래서 이번에 선정한 책은 "커리어 스킬업 파이썬 업무 자동화"입니다.  책은 크게 3단계로 구분되어 있다.1단계 : 파이썬 기초2단계 : 파이썬 크롤링3단계 : 파이썬 업무 자동화 1단계 파이썬 기초에서는 기초적인 문법을 알 수 있다.해당 내용은 알고있었지만, 저자가 쉽게 설명을 해줘서 좀 더 깊게 이해를 할 수 있었다. 2단계부터는 실제로 사용할 수 있는 코드를 작성한다. 처음에는 맛보기로 음원 차트 수집 코드를 실행해 본다.(코드는 저자가 올려놓은 깃허브에서 다운받을 수 있다.) 코드..

[파이썬] 명함 만들기 자동화

명함과 같이 양식은 동일한데 성함, 전화번호 등만 변경하는 업무가 있을 수 있다.10개 미만이면 그냥 하는 것이 빠를 텐데, 수천개로 늘어나는 순간 일일이 하기가 어렵다. 이번 실습에서 했던 명함만들기 자동화는 업무 하는데 큰 도움이 될 것으로 보인다.(책에서 언급하는대로 진행하면 오류없이 끝까지 할 수있다.)  ※작성 코드!pip install xlrd import pandas as pddf=pd.read_excel('명함제작용data.xls')df.head() width=int(90*96/25.4)height=int(50*96/25.4)print(width,height) from PIL import Imageimg_basic = Image.open("명함기본샘플(90mm-50mm).jpg")img_b..

[파이썬] MS office 자동화 실습(feat. 엑셀, PPT, 워드클라우드)

이번 실습은 여러 자료를 엑셀 취합하고, 워드클라우드 등을 통해 각각 상품별 PPT 작성이다.책에서 언급하고 있는 대로 실습을 하면 크게 오류는 없다.결과물은 아래와 같이 각각 상품별로 PPT가 자동 만들어 진다.각 상품별 최신 트렌드를 아래와 같이 정리하기에는 좋을 것으로 보인다. 예를 들어, 비트코인, 미국 주식 등의 트렌드를 한번에 파악 할 수 있을 것으로 보인다.  ※ 작성 코드import openpyxlwb=openpyxl.Workbook()wb.create_sheet('car',0)wb.create_sheet('semiconductor',0)wb.create_sheet('metaverse',0)wb.create_sheet('battery',0)wb.save('product_info.xlsx')..

[파이썬] 데이터 처리 자동화(feat. pandas, 오류 해결)

챕터4에서는 데이터 처리 자동화(데이터 관리&편집)에 대해 실습을 하였다. 실무자 입장에서정리해야 하는 파일이 10개 미만이거나, 편집해야하는 행이 100개 미만이면엑셀이 훨씬 수월하고 빠르다. 하지만, 파일이 100개가 넘어가고행이 몇천개가 되는 순간 엑셀로 작업하기에는 시간이 오래걸려 적합하지 않다. 점점 데이터화 되어가는 시대에 앞으로 몇년이내에는 파이썬을 기본으로 사용하는 날이 오지 않을까 생각된다. 이번 챕터 실습을하면서 오류는 생각보다 적었다.하지만 다른분들에게 도움이 되고자 내용을 기록해 본다. 1. pandas 설치오류pandas는 1.4.3을 넣으면 오류가 나서 버젼 삭제하고 돌리니까 정상 작동함 2. 지정된 경로를 찾을 수 없습니다. 'new_data2'아마도 바탕화면이 기본으로 세팅이..

반응형