backend/데이터분석 6

02_1. 사람인, 스펙업(네이버 까페) 인턴 정보 통합 시스템 (selenium, python)

*selenium을 통해 스펙업 (네이버 까페)과 사람인의 인턴 정보를 크롤링하는 기능을 구현할 것이다. *기본 기능1. 기본적인 제목 + url을 올라오지 않은 순서대로 업데이트여 블로그 (네이버 or tistory)에 매일 기재하는 것 *추가 기능-마감 달력/ 기업 이름을 뽑아서 마감 달력으로 기재 -> 해 내용은 자소설 닷컴같은 사이트에서 따오는게 나을수도...-키워드별 검색 기능 추가 -서버로 연계하여 매일 클릭 없이도 진행되었으면 좋겠다.-jupyter 가 아닌 atom / vim으로 만들기 ~12/15 현재~12.16. 네이버 블로그 글쓰기 완료 (모바일 / 웹)티스토리 블로그 글쓰기 완료 (웹)크롤링해서 네이버/티스토리에 글쓰기 완료 (웹)

selenium을 통한 중고나라 크롤링

중고나라 *selenium 활용한 크롤링 +frame 변환까지 *중고나라 키워드(+page)를 입력하면 키워드별 제목, url, 가격 등을 표로 일목요연하게 정리해서 보여주기... -11.23~ 현재 중고나라 맥북 프로의 글 제목만 크롤링 완료 추후 url, 가격 등의 정보 (+사진이 있으면 사진도)를 표로 (pandas 활용) 만들어서 업로드? ------------------------------------------ # vim 파일 활용해서 from selenium import webdriver driver = webdriver.Firefox() driver.get("https://nid.naver.com/nidlogin.login") # id 입력 id_input_element = driver.f..

project02.까페알바

*구현하고자 하는 기능-알바천국, 알바몬-조건; 사이트/블로그 등재 (날짜순)-특정 조건; 주2-3회, 위치, 일하는 시간 12-18시간;-위치; 이대, 신촌, 서울대입구, 봉천동, 서강대, 대흥, 아현 일대 -11/20~알바천국, 알바몬 각각 URL 따고 제목/url 따기; 현재 함수 이전까지 완료/ -for문 활용해서 함수로 만들고-각 url로 들어가서 일하는 시간 뽑아내기 => 시간을 기준으로 12-18시간? -제목/url/시간/위치 => 웹페이지 or mail로+웹페이지 활용하면 네이버지도 api- 집에서의 거리까지 분석 *그냥 페이지 말고 모바일 페이지의 api를 따올 수는 없을까? -12/3 기준본문 + url을 뽑아서 txt 파일로 만들어주고, txt 파일을 읽어서 없는 내용만 따로 추가. ..

project01. dios 구글 크롤링/ 11.19

dios 관련 크롤링 *구현하고자 하는 기능def google_search(keyword, n): -11.19=>해당 페이지까지의 제목 뽑아서 text로 저장하는 기능까지 구현하는 def 만들기 /11.19까지 / 완료!, Crawling/Google 폴더에 저장*검색어를 입력할 때 whitespace(띄어쓰기)를 %20으로 처리하는 함수도 넣어줘야함; 일단은 그냥 whitespace로 들어가도 제대로 반응함/+ 더 해야할일*vim으로 파일을 만들어서 실행시킬수 있게(jupyter 말고도)완료*이를 서버로 돌리는 방법*제목 말고 다른것들 추출하는 방법 (+추후에 이를 alarm/ email로 보내는 방법까지도... -selenium?)-------------------------# 11.19 완료된 코드..

파이썬 데이터 라이브러리 - 수찬님 강의 1일차 복습 (1/2), 파이썬 기초

11월 7일(월)부터 3일간 tacademy로 파이썬 강좌를 들으러 간다.대단한 실력자라고 귀에 못이 박히게 들은 수찬님의 강좌를 듣게 되서 매우 영광이다. 첫 날 배운 내용 중 의미있는 내용들을 간단히 정리해 보았다.아직 정확히 모르는 부분은 다음에 더 찾아 넣고 두고두고 복습해야 할 듯 하다. - 외부 파일 오픈, 자동 닫기-----------------------------------------with open("hello.txt", "r") as fp: data = fp.read() print(data)---------------------------------------- -students.csv 파일 불러와서 편집하기: 동 경로에 있는 csv 파일을 불러와 dic 방식으로 정리하는 함수를 만들..