본문 바로가기
반응형

파이썬/주식25

Python, multiprocessing으로 좀 더 빠른 Naver Finance 크롤러 만들기 / multiprocessing crawling 지난번 포스팅에서는 Naver Finance에 있는 한 기업의 재무제표를 크롤링하는 과정을 담았습니다. 하지만 코스피/코스닥에 상장된 모든 기업의 정보를 받아와 파싱한다고 하면 어떨까요? 2천여개의 기업 정보를 파싱하는 것은 그렇다치지만 정보를 받아오는 과정, requests를 하나씩 보내고 받는 일련의 과정에 시간이 많이 듭니다. 이 여러 번의 작업을 나눠서 병렬처리를 통해 빠르게 해주는 것이 Python multiprocessing 패키지입니다. multiprocessing은 기본 내장 패키지로 Python이 설치되어 있다면 따로 설치할 필요가 없습니다. multiprocessing is a package that supports spawning processes using an API similar.. 2019. 11. 27.
Python, BeautifulSoup4으로 Naver Finance 정보 크롤링 네이버 기업실적 크롤링 오늘은 BeautifulSoup4으로 finace.naver.com 에 있는 기업의 재무정보를 크롤링하는 법을 포스팅해보겠습니다. 준비물 : BeautifulSoup4, lxml 크롤링할 대상은 기업마다 존재하는 아래 기업실적분석 정보입니다. BeautifulSoup을 이용해서 위의 정보를 받아오려면 크롤링할 페이지의 URL그리고 긁어올 부분의 html tag를 알아야 합니다. 위 테이블의 tag를 보기 위해서는 크롬기준 F12를 눌러 해당 tag의 class를 확인합니다. 확인해보니 div tag의 class명은 cop_analysis입니다. 이 정보를 바탕으로 크롤링 해보겠습니다. import requests from bs4 import BeautifulSoup import pandas as pd i.. 2019. 11. 24.
Python으로 종목코드(코스피/코스닥) 엑셀로 저장/읽기 Python, Pandas를 이용해서 코스피, 코스닥에 상장된 기업 코드를 가져와 Excel로 저장/읽기가 가능한 코드를 첨부하겠습니다. 그 전에 선행작업으로는 pandas와 openpyxl, xlrd가 모두 설치되어 있어야 합니다. import pandas as pd df = pd.read_html('http://kind.krx.co.kr/corpgeneral/corpList.do?method=download&searchType=13', header=0)[0] df.종목코드 = df.종목코드.map('{:06d}'.format) #6자리로 맞추기 #df에 속한 column 목록 Index(['회사명', '종목코드', '업종', '주요제품', '상장일', '결산월', '대표자명', '홈페이지', '지역'.. 2019. 11. 17.
Python으로 보조지표 MACD 구하기 MACD Oscillator 구하기 Python으로 MACD 및 MACD Oscillator 구하기 편입니다. MACD란 이동평균수렴확산지수 (Moving Average Convergence & Divergence)입니다. Gerald Appel이 개발하였으며 이동평균선끼리의 차이를 통해 주가 흐름을 알아보는데 쓰이는 지표입니다. Convergence은 모인다는 뜻이고 Divergence은 흩어진다는 뜻으로 단기/장기이동평균선이 멀어졌다가 다시 가까워지는 정도를 표시하는 지표입니다. MACD, MACD Oscillator의 계산 방법으로부터 의미를 더 살펴 보겠습니다. MACD : 12일 지수이동평균선 - 26일 지수이동평균선 MACD Signal = MACD의 9일 단순이동평균선 MACD Oscillator = MACD Signal 값을.. 2019. 11. 10.
Python으로 RSI(Relative Strength Index) 구하기 이번에는 Python으로 RSI(Relative Strength Index)을 계산해보겠습니다. 먼저 RSI의 의미를 간단히 알아보면 아래와 같이 정의할 수 있습니다. RSI (Relative Strength Index)는 주식, 선물, 옵션 등의 기술적 분석에 사용되는 보조지표이다. RSI는 가격의 상승압력과 하락압력 간의 상대적인 강도를 나타낸다. 1978년 미국의 월레스 와일더(J. Welles Wilder Jr.)가 개발했다. -출처:위키백과- 요약해 말하면 일정기간 동안 가격 상승폭과 하락폭 중 어느 쪽이 더 높냐를 나타내는 것으로 0에 가까울 수록 하락 강도가 강하다는 뜻이고 반대의 경우는 상승 강도가 강하다는 뜻입니다. 이런 의미를 가진 RSI 계산 방법은 이렇습니다. 가격이 전일 가격보다 .. 2019. 11. 6.
반응형