본문 바로가기

분류 전체보기154

[논문리뷰] Generative Adversarial Nets(GANs)의 이해 소개 Generative Adversarial Networks We propose a new framework for estimating generative models via an adversarial process, in which we simultaneously train two models: a generative model G that captures the data distribution, and a discriminative model D that estimates the probability that arxiv.org Adversarial의 사전적 의미는 적대적이라는 뜻을 갖습니다. 말 그대로 두 모델이 대립하면서 동시에 학습시킵니다. Fake Image를 만들어내는 Generator, 기.. 2022. 11. 8.
통계학이란? 통계학 불확실성이 내포된 데이터의 선택, 관찰, 분석 및 추정을 통하여 의사결정에 필요한 정보의 획득과 처리방법을 연구하는 학문 기술 통계 수집된 데이터로부터 평균, 분산 등의 요약 통계량이나 그래프를 이용해 체계적으로 정리/요약하는 기술 분포 모양 도수 분포: 도수, 상대도수, 누적도수 비대칭도(Skewness): 분포가 어느 한쪽으로 치우친 정도를 나타냄 첨도(Kurtosis): 분포 모양이 얼마나 뾰족한가 완만한가를 나타내는 정도 연속형데이터 나누어질 수 있고, 연속적으로 측정될 수 있는 것 제품중량, 온도, 강도 등 계량형 데이터 등간척도 같은 간격을 가지지만 진정한 영점이 없는 척도로 수치의 비율 관계가 성립하지 않는다. 관찰대상을 가지고 있는 속성 크기의 차이는 절대적 기준이 없어 상대적인 차.. 2022. 5. 22.
데이터 수집 및 정제 데이터 수집 분석에 필요한 데이터의 종류, 형태, 발생주기, 수집 기간 및 방법 등 데이터의 특성을 명확히 파악하고 정의하는 것 모든 사람들에게 동일한 의미를 제공하는 일관성과 신뢰성이 있는 데이터 확보 데이터의 항목, 속성, 발생 주기, 수집방법 및 기간 등의 특징/속성을 기술 데이터 명 형태 데이터 소스 발생주기 수집방법 수집기간 수집가능성 주요 특성 종점온도 연속형 전로조업실적 Charge당 담당자 요청 17/1/1~ O 자동 측정 발화점 범주형 ... .... .... ... ... ... 분석에 필요한 데이터의 항목, 저장위치, 발생주기, 수집 방법 및 기간, 속성등을 기술 샘플링 무작위(random) 샘플링: 무작위로 추출, 각 자료선택의 확률은 동일 층별화 샘플링: 유사 특성별 층별화하고, .. 2022. 5. 22.
판다스 정리 Pandas 패키지란? 데이터를 수집하고 정리하는 데 최적화된 도구 numpy 기반으로 작성된 라이브로리로 데이터 불러오기, 전처리, 통계 분석에 사용 Series 형태와 DataFrame 형태의 자료구조 존재 실무에서 접하는 엑셀 파일의 스프레드시트가 DataFrame 형태 데이터 분석에 있어서 필수적인 라이브러리로, 전처리시 대부분 pandas를 활용 시리즈(Series) 시리즈는 1차원 배열의 값에 각 값이 대응되는 인덱스를 가지고 있습니다. import pandas as pd s = pd.Series([1000, 2000, 3000], index=['a', 'b', 'c']) s a 1000 b 2000 c 3000 dtype: int64 index와 value로 이루어져 있으므로 접근할 수 있습.. 2022. 5. 18.