금융퀀트/프로그램기초
-
파이썬 : 웹스크레핑 홈페이지 구조파악(네이버파이낸스)금융퀀트/프로그램기초 2021. 7. 4. 21:48
검사기능 이해 인터넷에서 데이터를 끌어오려면 인터넷의 문서들이 어떻게 생겨먹은지를 알아야 한다. 우리가 접하는 화면을 넘어서 홈페이지의 속 뼈대를 파악해야 실제 인터넷 문서들에서 데이터를 끌어올 수 있다. 우리가 사용하는 대부분의 익스플로러에서 홈페이지의 속 모습을 파악할 수 있는 기능을 제공하는데 그것이 "검사" 기능이다. 개인적으로 구글 크롬을 쓰는데, 홈페이지에서 마우스 우클릭을 해서 "검사" 버튼을 누르면 무언가 추가적인 창이 생긴다. 그중 "Elements" 텝을 클릭해보면, 홈페이지가 어떻게 코딩되어 있는지 상세하게 나온다. 홈페이지 구조 파악 HTML 문서의 구조 웹데이터를 수집하기 위해서 홈페이지 코딩까지는 확인은 쉽게 할 수 있을 것이다. 하지만 이다음부터가 쉽지는 않다. 보통 홈페이지 ..
-
파이썬 : 가상환경 구축 (Windows)금융퀀트/프로그램기초 2021. 6. 3. 01:15
가상 환경의 개념 우리 같은 문돌이들은 "가상 환경"하면 막 홀로그램 날아다니고 그런 것 밖에 안 떠올라서 파이썬 가상 환경이라는 말을 들으면 뭔가 거창하게 느껴진다. 하지만 아나콘다라는 큰 범주 안에 또 다른 폴더를 만들어서 그 안에 파이썬을 또 설치한다고 생각하면 된다. 즉 아래 그림과 같이 보면 된다. 기본적으로 아나콘다를 깔면 (Base) 라는 폴더 안에 라이브러리 등을 깔고 그 안에서 놀게 된다. 거기에 가상 환경을 추가하면, 그 안에 또 파이썬이 깔리고 그 안에 라이브러리 등을 깔게 된다. 가상 환경 구축 방법 아나콘다 프롬프트 실행 아나콘다 프로그램은 아나콘다 Navigator 외에 아나콘다 Prompt를 지원한다. 아나콘다 Prompt는 아나콘다의 cmd 창이라고 생각하면 된다. 직접 명령..
-
파이썬 라이브러리 설치(Windows)금융퀀트/프로그램기초 2021. 6. 3. 01:12
파이썬의 라이브러리의 기능 라이브러리는 사전에 어렵게 정의되어 있는데, 그냥 도구라고 생각하면 된다. 우리가 못 박을 때 망치 쓰고, 무엇인가를 자세히 볼 때, 돋보기를 쓰듯이 프로그램에서 특정 기능을 쉽게 구현하기 위해서 라이브러리들을 용도에 맞게 갖다 쓴다. 자동매매 프로그램에서 앞으로 쓸 대표적인 라이브러리를 용도별로 나열하면 아래와 같다. requests : Web에 요청을 보내는 도구 / 웹 스크래핑에서 사용 BeautifulSoup : Web의 데이터를 쓸 수 있게 하는 도구 / 웹 스크래핑에서 사용 pandas : 행과 열의 객체를 만드는 기능을 하는 도구 / 데이터 분석 시에 사용 pymysql : DB에서 데이터를 뽑아내는 SQL 문의 전달 / 데이터 분석 시에 사용 selenium : ..
-
아나콘다, 파이썬, 비주얼 스튜디오 사용(Windows)금융퀀트/프로그램기초 2021. 6. 3. 01:10
기본 언어 소개: 왜 파이썬인가? 우리 같은 문송한 투자자들은 전문가들처럼 프로그램 개발하는데, MacBook 같은 장비들은 필요 없다. 일반 컴퓨터에 일반 Windows 에서 그냥 개발하면 된다. 그리고 고민 없이 파이썬으로 개발하면 된다. 일단 쓰는 사람이 많아서 구글링 하면, 답이 바로바로 나온다. 그리고 갖다 쓸 수 있는 라이브러리도 많아서 쉽게 개발이 가능하다. 여기서 라이브러리는 도구라고 생각하면 된다. 완성된 도구를 내 프로그램에 심어서 쓰는 것이다. 마지막으로 즉시 내 작업 결과 확인이 가능하다. 컴파일링 없이 바로 내 코딩을 돌려 볼 수 있는 것이다. 파이썬 설치 파이썬은 https://www.python.org/ -> download -> 최신 버전 다운 받으면 된다. 아나콘다 파이썬 ..
-
(OpenAPI)DART Open API 사용법3: 기업데이터 가공 in python금융퀀트/프로그램기초 2021. 2. 11. 13:52
1. OpenAPI로 XML 형식의 기업 데이터 단순 추출의 한계 우리는 DART 에서 제공하는 OpenAPI를 python을 이용해서 아래 코드를 사용하면 ""가 덕지덕지 붙어있는 XML 파일을 아래와 같이 얻을 수 있었다. ( 자세한 내용은 (OpenAPI)DART Open API 사용법2: 기업데이터 추출 in python 참조 ) 1) 데이터조회 코딩 #라이브러리 읽어오는 부분---------------------------------------------------------- import requests from bs4 import BeautifulSoup #URL을 조합하는 부분--------------------------------------------------------------- ..
-
(OpenAPI)DART Open API 사용법2: 기업데이터 추출 in python금융퀀트/프로그램기초 2021. 2. 11. 13:08
1. 기본 라이브러리 설치 OpenAPI는 다양한 언어로 활용할 수 있을 텐데, 이하에서는 파이썬을 이용해 보도록 하겠다. 아나콘다 파이썬 환경에서 파이썬을 이용해서 DART Open API를 이용하려면, "requests" 라이브러리와 "BeautifulSoup" 라이브러리 정도가 필요하다. 이 설치를 위해서 anaconda cmd를 실행시키고, 아래 명령어를 통해서 라이브러리를 설치하면 된다. pip install requests pip install beautifulsoup4 참고로 anaconda cmd 에 어떤 라이브러리가 있는지 확인하려면, 아래와 같이 리스트를 검색하면 리스트가 쭉 나온다. conda list 아래는 내가 설정해 놓은 python 가상 환경 "py37_64"에 requests..
-
(OpenAPI)DART Open API 사용법1: 인증키 발급금융퀀트/프로그램기초 2021. 2. 11. 10:53
1. DART Open API 란? 금융감독원에서는 기업공시시스템(DART)을 운영하고 있다. (dart.fss.or.kr/) 각종 기업 공시자료가 모여있는 곳인데, 우리들이 쓰는 HTS, 인포맥스 등도 여기에서 자료를 가져와서 보여주는 경우가 많을 것이다. 그런데 2020.04.20부터 이 홈페이지에서 OpenAPI를 제공하고 있고, 사용자의 입맛에 맞게 데이터를 받아서 여러 가지 작업을 하는 것이 가능해졌다. 이번에는 기업공시시스템의 OpenAPI 를 이용해서 "기업개황"을 추출해 보도록 하겠다. 2. API 키 발급 절차 1) 오픈 API 화면 들어가기 기업공시시스템(DART)의 OpenAPI를 이용하기 위해서는 먼저 회원가입 및 인증키 발급절차를 진행해야 한다. 메인 홈페이지에서 아래 그림에 표시..
-
통계프로그램 설치 : R with anaconda금융퀀트/프로그램기초 2021. 1. 2. 00:57
1. 일반적인 R의 설치 우리가 아는 대표적인 통계 프로그램이 Rstudio이다. R은 그냥 다운로드하여서 깔면 되는 프로그램이다. cran.r-project.org/ 위 사이트 접속만 하면 더 들어갈 것도 없이 홈피 메인에 운영체제별로 다운로드하도록 해 놓았다. 위 사이트에서 받기 싫으면 검색해서 나오는 수없이 많은 사이트 중에서 한 사이트 들어가서 다운로드 하면 된다. 2. Anaconda를 통한 R의 설치 개인적으로 추천하는 것은 Anaconda 라는 프로그램을 통한 R의 설치이다. Anaconda 도 그냥 구글에 아나콘다 다운로드 들어가서 설치하면 된다. 아나콘다 홈페이지 들어가서 product에 individual edition 선택하고 들어가서 아래쪽으로 스크롤 내리면 운영체제에 맞는 프로그램..