일 | 월 | 화 | 수 | 목 | 금 | 토 |
---|---|---|---|---|---|---|
1 | 2 | 3 | ||||
4 | 5 | 6 | 7 | 8 | 9 | 10 |
11 | 12 | 13 | 14 | 15 | 16 | 17 |
18 | 19 | 20 | 21 | 22 | 23 | 24 |
25 | 26 | 27 | 28 | 29 | 30 | 31 |
- 미래에셋 공모전
- 아셈듀오 선정
- 아셈듀오
- 제네바기숙사
- 아셈듀오 후기
- tableau
- 태블로 포트폴리오
- 텍스트분석 시각화
- 데이터 분석 포트폴리오
- 데이터공모전
- 데이터 포트폴리오
- MairaDB
- 공모전후기
- 교환학생
- 제네바주거
- 키워드시각화
- HEG
- 테이블계산
- 리뷰분석
- 교환학생주거
- 두잇알고리즘코딩테스트
- 태블로
- 무신사 데이터분석
- CRM
- 데이터 시각화 포트폴리오
- 교환학생 장학금
- 제네바
- 제네바경영대학교
- 패스트캠퍼스 #자료구조 #코딩테스트 #배열
- 파이썬
- Today
- Total
목록분류 전체보기 (102)
민듀키티
1. 알고리즘 연습 방법 연습장과 펜을 준비하자. 알고리즘 문제를 읽고 분석한 후에, 간단하게 테스트용으로 매우 간단한 경우부터 복잡한 경우 순서대로 생각해보면서, 연습장과 펜을 이용하여 알고리즘을 생각해본다. 가능한 알고리즘이 보인다면, 구현할 알고리즘을 세부 항목으로 나누고, 문장으로 세부 항목을 나누어서 적어본다. 코드화하기 위해, 데이터 구조 또는 사용할 변수를 정리하고, 각 문장을 코드 레벨로 적는다. 데이터 구조 또는 사용할 변수가 코드에 따라 어떻게 변하는지를 손으로 적으면서, 임의 데이터로 코드가 정상 동작하는지를 연습장과 펜으로 검증한다. 2. 버블 정렬 (1) 버블 정렬이란? : 앞에서부터 2개씩 비교해서, 정렬을 시킴 버블정렬 이해 참고자료 : https://visualgo.net/e..
1. 알고리즘 복잡도 표현 방법 (1) 알고리즘 복잡도 계산이 필요한 이유 : 하나의 문제를 푸는 알고리즘은 다양할 수 있음. 따라서, 다양한 알고리즘 중 어느 알고리즘이 더 좋은지를 분석하기 위해, 복잡도를 정의하고 계산함 (2) 알고리즘 복잡도 계산 항목 - 시간복잡도 : 알고리즘 실행 속도 (시간복잡도의 주요 요소는 반복문이 지배함) - 공간복잡도 : 알고리즘이 사용하는 메모리 사이즈 가장 중요한 시간 복잡도를 꼭 이해하고 계산할 수 있어야 함 (3) 알고리즘 성능 표기법 - 최악 ? 최상 ? 평균 ? Big O (빅-오) 표기법 O(N) - 알고리즘 최악의 실행 시간을 표기 - 아무리 최악의 상황이라도, 이정도의 성능은 보장한다는 의미 Ω(N) (오메가) 표기법 Ω(N) - 알고리즘 최상의 실행 ..
1. 배열(Array) (1) 배열(Array) 이란 ? - 데이터를 나열하고, 각 데이터를 인덱스에 대응하도록 만들어진 구조 - 파이썬에서는 리스트 타입이 배열 기능을 제공함 (2) 배열의 장단점 - 장점 : 같은 종류의 데이터를 효율적으로 저장할 수 있음, 순차적으로 접근 가능 - 단점 : 연관된 데이터의 추가 및 삭제가 어려움, 미리 최대의 길이를 지정해야 함 2. 큐(Queue) (1) 큐 구조란 ? - 줄을 서는 행위와 유사 - 가장 먼저 넣은 데이터를 가장 먼저 꺼낼 수 있는 구조임 (FIFO, LIFO) 방식으로 스택과 꺼내는 순서와 반대임 ! - 멀티 태스킹을 위한 프로세스 스케줄링 방식을 구현하기 위해 (운영체제에서) (2) 알아둘 용어 - Enqueue : 큐에 데이터를 넣는 기능 - ..
1. 들어가며 2021 미래에셋 금융 빅데이터 페스티벌 보험사 부분의 주제는 "변액보험 키워드 기반 시각화" 로 Python, Tableau 를 활용할 수 있었습니다. 따라서, 저희 팀은 "변액 펀드의 모든 것을 담은 All In One 시각화" 라는 주제를 선정하였습니다. "진단 - 추천 - 비교" 라는 소비자 행동 흐름에 따라 데이터 분석을 실시하고, 변액보험이라는 어려운 상품을 소비자가 쉽고 재미있게 느낄 수 있도록 Tableau를 이용하여 데이터 시각화로 인사이트를 전달했습니다. 2. 문제인식 변액보험은 투자 결정에 따라 수익률이 달라지므로 보험 가입 고객은 가입 이후 포트폴리오 조정 등 적극적으로 노력할 필요가 있는 상품입니다. 그러나, 변액 보험은 수익률 관리가 중요한 상품임에도 해당 서비스를..

1. 생물학적 뉴런에서 인공 신경망까지 (1) 생물학적 뉴런 - 세포체, 수상돌기, 축삭돌기, 시냅스 말단 등으로 구성 - 뉴런 하나는 단순하게 작동하지만, 수십억개로 구성된 거대한 네트워크가 모여 하나의 생물학적 신경망을 만듬 (2) 뉴런을 사용한 논리 연산 - 인공뉴런 : 단순히 입력이 일정 개수만큼 활성화되었을 때 출력을 내보내는 것 - 이 간단한 모델로, 어떤 논리 명제도 계산할 수 있음 ① 항등함수 : A 뉴런이 활성화되면, C 뉴런도 활성화 됨 ② 논리곱연산 : A, B가 활성화될 때, C 뉴런도 활성화 ③ 논리합연산 : A, B 중 하나가 활성화 될 때, C 뉴런도 활성화 ④ 뉴런 A가 활성화되고, 뉴런 B가 비활성화될 떄 뉴런 C가 활성화 됨 (3) 퍼셉트론 - 인공신경망 구조 중 하나 -..
- 결정트리는 분류, 회귀, 다중출력 작업까지 가능한 다재다능한 머신러닝 알고리즘임 - 복잡한 데이터 셋도 학습할 수 있다는 장점을 가지고 있음 - 랜덤 포레스트의 기본구성요소이기도 함 1. 결정 트리 학습과 시각화 [붓꽃 데이터셋에 DecisionTreeClassifier를 훈련시키는 코드] from sklearn.datasets import load_iris from sklearn.tree import DecisionTreeClassifier iris = load_iris() X = iris.data[:, 2:] # 꽃잎 길이와 너비 y = iris.target tree_clf = DecisionTreeClassifier(max_depth=2, random_state=42) tree_clf.fit(X..
1. 선형 SVM 분류 - SVM : 강력하고 선형이나 비선형 분류, 회귀, 이상치 탐색에도 사용할 수 있는 다목적 머신러닝 [SVM의 기본원리] - 선형 SVM분류 : 두 클래스가 직선으로, 선형적으로 구분됨 - 결정경계 : 오른쪽 그래프에 있는 실선 - 서포트 벡터 :도로 바깥쪽에 훈련 샘플을 더 추가해도 결정경계에는 전혀 영향을 미치지 않는 샘플 (1) 소프트 마진 분류 & 하드 마진 분류 - 하드 마진 분류 : 모든 샘플이 도로 바깥쪽에 올바르게 분류되어 있는 것 - 오른쪽 그래프의 결정계계는 하드마진을 찾을 수 없음 - 그렇기 때문에, 유연한 모델이 필요함 - 소프트 마진오류 : 도로의 폭을 가능한 넓게 유지하는 것과 마진오류 사이에 적절한 균형을 찾는 것 하이퍼 파라미터 설정 - C (하이퍼 ..
1. 선형회귀 간단한 선형회귀 모델의 예시 ▶ θ : 모델의 파라미터 ▶ 가중치의 합과 편향이라는 상수를 더해 예측을 만듬 이를 벡터형태로 표기한다면 ? ▶ θ와 x의 점곱으로 표현할 수 있으며, 벡터는 주로 열 벡터로 표기하기 때문에 θ를 전치시켜서 선형회귀 식을 표현 그러면, 최적의 θ을 찾는 방법은 ? ▶ RMSE를 최소화하는 θ를 찾아야 함 (1) 정규방정식 비용함수를 최소화하는 θ를 찾기 위한 해석적인 방법으로, 이를 정규방정식이라고 함 정규방정식 공식을 테스트하기 위한 코드 1) 데이터 생성하기 import numpy as np # 0에서 2까지의 크기의 행렬을 생성함 X = 2 * np.random.rand(100, 1) # noise 까지 더해주기위해 np.random.randn을 해줌..
1. MNIST - 딥러닝, 머신러닝 분야에서 예제 데이터 셋으로 많이 사용하는 것 중에 하나 - 손으로 쓴 70000개의 작은 숫자 이미지를 모은 데이터 셋임 (1) 사이킷런으로 데이터 읽기 : MNIST의 구조 from sklearn.datasets import fetch_openml mnist = fetch_openml('mnist_784', version=1, as_frame=False) mnist.keys() >>> dict_keys(['data', 'target', 'frame', 'categories', 'feature_names', 'target_names', 'DESCR', 'details', 'url']) data : 행,열로 구성된 data DESCR : 데이터셋을 설명하는 DESCR..
1. 날짜 데이터 처리 하기 (1) 모듈 로딩하기 import pandas as pd import numpy as np from datetime import datetime, timedelta (2) 현재 시간 다루기 today = datetime.now() today >>> datetime.datetime(2022, 3, 1, 18, 11, 43, 953212) today.year >>> 2022 today.month >>> 3 today.day >>> 1 (3) 날짜 연산 # 현재 날짜에 일(day) 기준으로 더하기 today + timedelta(days = 10) # 현재 날짜에 주(week) 기준으로 더하기 today + timedelta(weeks = 3) * 월을 기준으로는 더할 수 없음 (..