2020년 4월 2일 목요일

Day_03. Numpy & pandas

Why numpy?
--경제 대학원에서 numpy를 사용해야 하는이유?
---데이터 분석의 성능이 기존 R보다 더 뛰어나다
---특정 상황에 대한 modeling에서 더 쉽게 접근이 가능하기때문
---머신러닝에 대한 접근성이 뛰어나다


Black schools option pricing 에서의 numpy
--해당 model에서 numpy가 필요한 부분
----random number generate
--random number 생성시 random state 를 지정해 연산이 지속되고 같은 random number 가 생성된다

수식에서 주목할 부분은 마지막 z값으로 이부분을 random 으로 지정(하지만 state 를 지정했기 때문에 같은 값이 나옴)

import numpy as np
import pandas as pd
import matplotlib.pyplot as plt
import seaborn as sns; sns.set()

# simulation: normal distribution
rng = np.random.RandomState(123)
rng.standard_normal(10)
S0 = 100 # initial value
r = 0.05 # constant short rate/year
sigma = 0.25 # constant volatility ???
T = 2.0 # in years
I = 10000 # number of random draws
ST1 = S0 * np.exp((r - 0.5 * sigma ** 2) * T
+ sigma * np.sqrt(T) * rng.standard_normal(I))

plt.hist(ST1, bins=50)
plt.xlabel('index level')
plt.ylabel('frequency') plt.grid(True)

***모델의 한계***
연이율 r값과 sigma 값이 고정되어 있는데 이율이 매번 같이 나온다 이상하지 않나?
---맞음, 하지만 해당 모델은 추이를 보기 위함이라 변동성이 너무 많아지면 model 로의 가치가 하락 하기 때문에 통제 시킨거라 보면된다, 쉽게 이해하기 위한 참고 자료로 생각하면좋음
------참고 자료지만 알아야 하는 것








co skewness , co kurtosis ,black swan에 대한 연구
--중요한이유 ,금융시장의 변동성이 빈번하게 일어나기 때문,
--위험을 측정하기 용이함
--상단 붉게 그려진 leptokurtic 의 그래프를 보면 그래프의 형상이 중앙으로 모여있는 콘(corn) 형태
--정규분포보다 더 높은 첨도를 가지는 분포(더 뾰족하다는 이야기)
--정규분포는 3의 첨도를 가지나 leptokurtic은 3이상의 첨도를 가진다
--leptokurtic 분포는 tail 부분이 더 높은 수치를 가지거나 outlier (극단적으로 특이한 값)값을 더 많이 포함하는 경우가 많다
--https://www.investopedia.com/terms/l/leptokurtic.asp 참고하면 좋음
--black swan이란?----예상하지 못한 사태



What is pandas
--데이터의 수집과 분석에서 뛰어난 효율이 나오는 패키지 , 기반은 numpy
--데이터의 handling에서 loop 에 해당하는 명령어를 작성하지 않아도 결과를 산출


Pandas 의 data type 은 2가지
--serise – 1 column 짜리 matrix (행렬)
--data frame – multiple column matrix ,다중 컬럼 행렬

댓글 없음:

댓글 쓰기