목록etc (10)
on my way

머신러닝: 결정 트리와 앙상블 방법 쉽게 이해하기1. 지도 학습 - 분류분류(Classification)는 컴퓨터가 주어진 데이터를 보고 이 데이터가 어떤 종류(클래스)인지 예측하는 것을 말해요.예를 들어, 사진을 보고 고양이인지 강아지인지 맞추는 것이 분류의 한 예입니다.분류를 위해 사용하는 알고리즘(방법)에는 여러 가지가 있어요. 대표적인 분류 알고리즘나이브 베이즈(Naive Bayes): 통계를 사용해 데이터를 분류하는 방법입니다. 예를 들어, 이메일이 스팸인지 아닌지를 확률로 예측할 수 있습니다.로지스틱 회귀(Logistic Regression): 독립변수(설명 변수)와 종속변수(결과 변수) 간의 선형 관계를 이용해 데이터를 예측합니다.결정 트리(Decision Tree): 나무처럼 생긴 구조로 ..

포트폴리오와 리스크포트폴리오: 리스크 (High Risk - High Return)포트폴리오는 여러 투자 자산으로 이루어진 그룹을 말한다.리스크: 투자에서의 리스크는 투자 결과가 불확실한 정도를 말한다. 일반적으로 높은 리스크를 감수하면 높은 수익을 기대할 수 있어요. 이걸 High Risk - High Return이라고 해요.리스크의 측정: 분산과 공분산분산 (Variance): 하나의 자산이 평균 수익률에서 얼마나 변동하는지를 나타내는 값이에요. 변동성이 클수록 리스크가 큰 거예요.공분산 (Covariance): 두 자산이 함께 움직이는 정도를 나타내는 값이다. 두 자산이 함께 오르고 내리면 공분산이 양수, 반대로 움직이면 공분산이 음수이다.포트폴리오 최적화최적화: 포트폴리오의 리스크와 수익을 조절하..

RNN 이해 및 실습1. 시계열 데이터시계열 데이터는 시간에 따라 변하는 데이터를 의미합니다. 예를 들어, 주식 가격, 날씨 데이터 등이 있습니다.예제 시계열 만들기import numpy as npimport matplotlib.pyplot as plt# 배열 만들기xarr = np.array([100,200,300,400])yarr = np.array([1,2,3,4])cond = ([True, False, True, False])# 조건에 따라 xarr 또는 yarr 선택np.where(cond, xarr, yarr) # cond가 True면 xarr, False면 yarr# 랜덤 시드 설정np.random.seed(2020)시계열 데이터 시각화plt.figure(figsize=(10, 5))plt..

1. ANN from Scratch이제 우리가 간단한 인공 신경망(ANN)을 만들어보자. 우리가 할 일은 데이터를 이용해 모델을 학습시키고, 그 모델을 사용해 새로운 데이터를 예측하는 것이다.1.1 라이브러리 불러오기import numpy as np여기서는 numpy라는 라이브러리를 사용한다. numpy는 숫자 계산을 도와주는 도구이다.1.2 데이터 정의# 독립 변수 (입력 데이터)input_set = np.array([[0,1,0], [0,0,1], [1,0,0], [1,1,0], [1,1,1], [0,1,1], ..

포트폴리오와 리스크포트폴리오: 리스크 (High Risk - High Return)포트폴리오는 여러 투자 자산으로 이루어진 그룹을 말한다.리스크: 투자에서의 리스크는 투자 결과가 불확실한 정도를 말한다. 일반적으로 높은 리스크를 감수하면 높은 수익을 기대할 수 있어요. 이걸 High Risk - High Return이라고 해요.리스크의 측정: 분산과 공분산분산 (Variance): 하나의 자산이 평균 수익률에서 얼마나 변동하는지를 나타내는 값이에요. 변동성이 클수록 리스크가 큰 거예요.공분산 (Covariance): 두 자산이 함께 움직이는 정도를 나타내는 값이다. 두 자산이 함께 오르고 내리면 공분산이 양수, 반대로 움직이면 공분산이 음수이다.포트폴리오 최적화최적화: 포트폴리오의 리스크와 수익을 조절하..

AI - ML - data -> task - DL규칙 패턴군집 분석 (Clustering)과 주성분 분석 (PCA)의 차이군집 분석과 주성분 분석은 데이터 분석에서 매우 중요한 두 가지 기법이지만, 목적과 방법에서 큰 차이가 있습니다.군집 분석 (Clustering)목적:데이터를 유사한 특성을 가진 그룹(군집)으로 나누는 것.각 그룹 내의 데이터는 유사성이 높고, 그룹 간의 데이터는 유사성이 낮도록 함.방법:대표적인 방법으로 K-Means, 계층적 군집 분석, DBSCAN 등이 있음.K-Means의 경우, K라는 군집의 수를 미리 정하고, 각 데이터를 가장 가까운 군집 중심(centroid)으로 할당하여 군집화함.사용 사례:고객 세분화: 고객을 유사한 구매 패턴이나 성향을 가진 ..