분류 전체보기
-
[4장]ISL with R : 로지스틱 회귀(회귀계수의 계산2: 최적해 도출)기초지식/ISL with R(통계학) 2023. 4. 9. 07:24
경사하강법을 통한 회귀계수 찾기 [4장]ISL with R : 로지스틱 회귀(회귀계수의 계산1: 우도함수와 경사하강법)에서 우리는 아래 식과 같은 로그우도함수의 미분값(경사)을 구했다. 이제 b_j 회귀계수를 조금씩 늘려나가면서 최적의 경사를 찾으면 된다. 아래 그림 1과 같은 과정을 거치는 것이다. 여기서 경사값이 더 이상 줄거나 늘지 않는 상태를 만드는 b_j 계수 값이 최적값이 된다. 경사하강법에서 b_j 계수의 초기값은 보통 0으로 설정한다. 0부터 b_j 값을 조금씩 늘려나가면서 최적의 경사를 찾게 되는데 이 "조금씩"을 학습률(Learning rate)이라고 한다. 위 그림 1의 화살표의 크기를 뜻한다고 보면 된다. 위 그림 1의 화살표의 크기가 너무 크면 최적값을 지나칠 수도 있고, 너무 작..
-
[4장]ISL with R : 로지스틱 회귀(회귀계수의 계산1: 우도함수와 경사하강법)기초지식/ISL with R(통계학) 2023. 4. 5. 08:10
우도함수 정의 로지스틱 회귀 함수의 회귀계수는 우도함수(Likelihood function)를 이용한 경사하강법(Gradient descent)을 통해서 계산할 수 있다. 먼저 우도함수를 보자. 우도함수는 각 데이터 포인트가 생성될 확률을 나타낸다. 그리고 최대우도법은(확률변수의 모수를 구하는 방법) 각 데이터 포인트가 생성될 확률을 최대로 만드는 확률분포를 찾는 과정이다. "[4장]ISL with R : 로지스틱 회귀(로지스틱 함수)"에서 말한 것처럼 아래 식 1 로지스틱 함수는 "x값에 따른 값이 집단 1에 분류될 확률"을 나타낸다. 위 식을 바탕으로 각 데이터 포인트가 생성될 확률을 생각해 보자. 데이터 결과를 y_i = 0 또는 y_i = 1로 분류 한다고 가정하면, y_i 가 1일 때는 데이터 ..
-
[4장]ISL with R : 로지스틱 회귀(로지스틱 함수)기초지식/ISL with R(통계학) 2023. 4. 4. 06:52
분류 분석과 로지스틱 회귀 분석 ISL with R 4 장에서는 분류분석을 소개한다. 분류 분석은 다양한 독립변수들을 통해서 이 사람은 암이냐(1) 아니냐(0), 이 기업을 망할 것이냐(1) 아니냐를(0) 0 또는 1 값으로 분류해 내는 분석이다. ISL with R 3 장에서 배운 아래 선형회귀 식을 분류분석에서도 사용할 수 있을까? 위 선형회귀 분석 기본 식을 보면 Zi는 0 또는 1 값 외에 다양한 값을 가지기 때문에 분류분석에는 적합하지 않아 보인다. 하지만 분류분석의 가장 기초인 로지스틱 회귀 분석은 이 선형회귀 식을 로지스틱 함수에 넣어서 분류분석을 위한 도구로 만든다. 로지스틱 함수 로지스틱 함수는 시그모이드 함수의 한 종류인데, 대략적으로 아래 오른쪽 그림과 같이 S자 형태라는 것만 알면 ..
-
(OpenAPI)ChatGPT OpenAPI 사용: 데이터 분석(KOSPI200지수 예측)금융퀀트/프로그램기초 2023. 3. 29. 07:16
분석용 데이터 준비 챗GPT에 데이터에 관련된 사항을 물어보면 불가능하다는 답변이 나온다. 하지만 우리가 데이터를 넣어주기만 한다면 그 분석 자체는 가능할 것이다. 그럼 챗GPT에게 코스피 200 지수 데이터를 넣고 분석을 시켜보자. 아래와 첨부된 것과 같이 "2020-01-02" ~ "2023-02-28" 약 3년 치 코스피 200 지수 데이터를 넣어줄 것이다. 데이터 수집 KRX 정보데이터시스템 활용 코스피 200 지수 데이터는 KRX 정보 시스템 통계 -> 기본통계 -> 주가지수 -> 개별지수 시세추이 에서 "코스피 200"을 검색해서 다운로드하면 구할 수 있다. 엑셀로 데이터 편집이 가능하다면, 다운로드 후 위에 업로드한 파일처럼 종가만 남기고 나머지 컬럼을 모두 삭제해 주면 된다. 그리고 챗GP..
-
[암호화폐]문송코인(블록체인 웹 구현)금융정보/04.대체투자(부동산, 코인 등) 2023. 3. 25. 07:56
문송한코인 ○ 블록ID ○ 직전 블록 ○ "0"의 개수(난이도) ○ 작업 수 ○ 해시값 해시값 생성 채굴작업 ○ 최대시도 수 NO 블록ID 직전블록 난이도 블록해시값 블록체인 및 암호화폐 기술을 이해하기 위한 문송한 코인을 만들었다. 먼저 문송한 코인에서 블록체인 기술을 직접 확인해보자. 문송한 코인을 보면 직전 해시값과 블록ID를 이용해서 새로운 블록을(해시값) 만들기 때문에 직전 해시값을 모르면 해시값을 복사하는 것이 불가능 하다. "채굴작업" 버튼을 통해서 블록을 늘릴 수록 블록끼리 연결이 되어서 해시값을 추정하는 것이 더욱 불가능해 지는 것을 알 수 있다. 문송한 코인 채굴은 "채굴작업" 버튼을 통해서 할 수 있다. [암호화폐]암호화폐 채굴 : 보상과 복잡성 에서 예시로 든 것처럼 "0"으로 시작..
-
(OpenAPI)ChatGPT OpenAPI 사용: 기본활용 예제(python)금융퀀트/프로그램기초 2023. 3. 24. 13:11
기본정보 확인 API 키 확인 API 키는 OpenAI 사이트(https://platform.openai.com/) 사용자 메뉴에서 발급 가능하다. 아래 그림 1에 표시된 "Create new secretkey"를 누르면 팝업이 뜨면서 발급되는데, 다시 확인하기가 힘드니 처음 팝업이 뜰 때 잘 저장해 두어야 한다. 엔진확인 API 사용을 위해서는 AI 엔진 정보도 알아야 하는데, OpenAI 사이트(https://platform.openai.com/) Documentation -> Models 부분을 확인하면 된다. OpenAPI 에 지원되는 대화형 AI 모델은 아래 그림 2에 표시된 "text-davinci-003" 나 "text-davinci-002"이다. API 실행 예제: "오늘 아침 뭐 먹을까?..
-
코코본드는 위험한 채권일까?금융정보/01.유가증권(주식 채권 등) 2023. 3. 23. 08:10
크레디트스위스 은행과 코코본드 크레디트스위스 은행 부실 이슈와 함께 문제가 되고 있는 것이 "코코본드"이다. 도대체 "코코본드"가 왜 문제가 되는 것일까? 본드면 채권이라는 소리고, 크레디트 스위스가 망한 게 아니라 UBS와 합병을 했는데 왜 채권이 "휴짓조각"이 된다는 것일까? 코코본드의 정의 코코본드(Contingent Convertible Bond)는 조건부자본증권이라고 하는데, 우발적인(Contingent) 상황이 발생하면 뭔가 조건이 전환되는(Convertible) 채권으로 이해하면 된다. 이 "우발적인 상황"과 "조건이 어떻게 전환되냐"에 따라서 크게 후순위채 코코본드와 신종자본증권 코코본드로 나눌 수 있다. KRX에서 운영하는 상장공시시스템(https://kind.krx.co.kr/)에서 금..
-
(OpenAPI)ChatGPT OpenAPI 사용: API 키 발급 및 요금금융퀀트/프로그램기초 2023. 3. 22. 08:08
ChatGPT 열풍과 API활용 챗GPT 열풍이다. 챗GPT로 글도 쓰고, 코딩도 하고 온갖 것을 다 한다. 챗GPT 관련 확장 프로그램도 많다. Bing 검색에는 아예 챗GPT가 대화형으로 바로 답변을 주는 모드가 제공되고, 크롬 웹 스토어에는 챗GPT 사용 시 한국어로 자동번역 해주는 "프롬프트 지니", 검색에 챗GPT 답변 결과를 같이 보여주는 "ChatGPT for google" 이라는 프로그램이 있다. 우리 문송한 투자자들은 챗GPT를 어떻게 투자에 활용할 수 있을까? 다양한 데이터 분석이 필요한 투자 영역에서 대화형으로 제공되는 챗GPT의 활용은 힘들다. 투자 분석을 위해서는 재무제표, 거시경제 데이터 등을 입력하고 그것을 분석 처리하는 과정이 필수적이지만, 대화창에 입력할 수 있는 것은 한계..