본문 바로가기

분석6

[코딩 알고리즘 기본 정리] 알고리즘이란? 알고리즘 분석?이란 알고리즘이란? 어떤 문제를 풀기 위한 절차나 방법 어떤 문제를 풀기 위한 절차나 방법 주어진 '입력'을 '출력'으로 만드는 과정 각 단계는 구체적이고 명료해야 함 알고리즘 분석이란? 알고리즘의 성능이나 특징을 분석하는 것 알고리즘을 푸는 여러 가지 방법이 있음 여러 가지 알고리즘 중에 상황에 맞는 적당한 알고리즘을 골라 문제를 풀 수 있음 그러기 위해서는 어떤 알고리즘이 어떤 특징을 지니고 있으며 얼마나 계산이 빠르고 편한지 알아야 함 알고리즘 평가하기 1) 계산 복잡도 평가하기 코드 실행시간을 확인하는 방법 참조 : https://camel-it.tistory.com/97 Python 코드 실행 시간 측정 (성능측정) python 코드의 순수 연산 시간과 전체 실행 시간을 측정하는 방법은 다음과 같습니.. 2022. 7. 17.
[스낵수학] 맞꼭지각, 수선, 수선의 발 개념 맞꼭지각(vertically opposite angles)이란? 점 O에서 만나는 두 직선에 의해 만들어지는 4개의 각 중에서, 꼭짓점과 두 변을 공유하며 서로 마주보고 있는 각 교각 : 두 직선이 한 점에서 만나서 생기는 네 개의 각 ➡ ∠a, ∠b, ∠c, ∠d 맞꼭지각 : 교각 중 서로 마주 보는 두 각 ➡ ∠a와 ∠c, ∠b와 ∠d 맞꼭지각의 성질 https://cleancode-ws.tistory.com/150 [스낵수학] 각(Angle) 개념과 종류, 심화 각이란? 한 점(O)에서 그은 2개의 반직선(OA와 OB)에 의하여 이루어지는 도형 각의 표현 방법 : ∠AOB, ∠BOA, ∠O, ∠a [심화] 공간도형에서는 직선과 평면, 평면과 평면이 만나 각을 이룰 수 있다. 직 cleancode-w.. 2021. 7. 18.
[스낵수학] 점, 선, 면 "도형의 기본 요소 알기" 개념 깊게 파고들기 점이란? 어떤 공간에서 위치만을 나타내는 0차원의 도형이다 따라서 한 점은 길이, 넓이, 부피가 모두 0이다. 선이란? 서로 다른 두 점 A, B를 지나는 직선이다. 점이 움직인 자리이다. 선은 위치와 방향성을 갖고 있으며, 일반적으로 1차원이다. (예외, 페아노 곡선, 힐베르트 곡선 처럼 공간을 채우는 곡선도 있다.) * 참고 * [유클리드의 원론 1권] 정의2 : 선은 길이가 있고 폭이 없는 것이다. [유클리드의 원론 2권] 정의3 : 선의 양끝은 점이다. 선의 종류는? 직선, 반직선, 선분, 곡선 등이 있다. 직선이란? 서로 다른 두 점 A, B를 지나는 선(참고: 선대칭의 직선) 반직선이란? 점 A에서 시작하여 점 B의 방향으로 곧게 뻗은 직선의 일부분 선분이란? 직선 AB에서 점 A에서 점 B까.. 2021. 7. 17.
[모델 선택하기] 머신러닝(지도학습,비지도학습,강화학습)/딥러닝 데이터 분석을 할 때, 가장 먼저 생각해야 하는 것이 분석의 목적과 목표, 그리고 그를 위한 변수와 모델을 설정하는 것이다. 여기서 모델을 정한다는 것은 목표를 도출하기 위해 머신러닝을 할지 딥러닝을 적용할지 그리고 머신러닝을 한다면 지도학습/비지도학습/강화학습 중 어떤 방식 선택할 것인지를 고민해 봐야 한다. 목표가 같다고 해도 적용하는 방법에 따라 결과들이 다르게 나올 수 있기 때문이다. 1. 머신러닝 데이터의 양이 적고 주로 정형데이터이며, 분석 목적과 목표 도출을 위해 파생변수를 도출해야 하며다양한 파라미터를 조정하여 성능평가를 할 수 있다. 1) 지도학습 조건) 지도학습은 입력데이터(이하 'x'데이터)와 출력데이터(y, 이하 라벨)가 있다. 목표) 라벨이 없는 신규 'x'데이터에 대하여 라벨값을.. 2018. 7. 19.
[데이터 분석] 의미있는 피처(컬럼) 선택 데이터의 피처(컬럼)이 많다고 해서 예측이 잘 되는 것은 아니다. y = ax + b 일 때, x값으로 y를 예측한다고 가정하면 a라는 가중치를 찾아내어 향후 X의 값이 들어오면 y를 예측할 수 있다. 하지만 y = aX1 + bX2 + cX3 + dX4 ..... + z 라고 할 때, x변수가 많다고 해서 y를 잘 예측하는 것도 아니다. 따라서 y를 예측하는데 필요한 x를 뽑는 것도 중요하다. 예를 들면 여름에 아이스크림 판매량(y)를 예측하는데 여름의 기온(x1), 아이스크림의 가격(x2), 겨울의 기온(x3)이 있다면, x3이 y를 예측하는데 영향력이 적을 것이다. 하지만 X3를 y값을 예측하기 위한 데이터에 포함하거나 비포함할 때의 차이는 클 수 있다. * 과대적합(overfitting)을 줄이고.. 2018. 5. 17.
[데이터 분석-전처리] 범주형 데이터_원핫인코딩 쉽게하기 범주형 데이터는 숫자의 차이가 의미가 없기 때문에 원핫인코딩/더미화 하여 데이터 처리를 해줘야 한다. 즉, 색상이 1. 빨강2. 노랑3. 파랑 인 경우를 본다면, 1,2,3의 순서나 크기가 데이터 분석에 영향을 줄 수 있기 때문이다. 따라서 빨강인이 아닌지에 대한 여부로 변수를 변경해야 한다. 이렇게 되면 색상 컬럼/변수 하나가 3개의 컬럼으로 증가하여 빨강인지 아닌지, 노랑인지 아닌지, 파랑인지 아닌지로 변경하게 된다. 이런 데이터 변경을 쉽게 해주는 코드들은 아래와 같다. 1. 기본 데이터 셋 만들기 import pandas as pddf = pd.DataFrame([['green', 'M', '10.1', 'class1'], ['red', 'L', '13.5', 'class2'], ['blue', .. 2018. 5. 17.
반응형