기초통계
-
[ML왕초보] 피처(feature), 독립변수, 종속변수머신러닝(ML) 2020. 8. 19. 14:40
데이터 분석에서의 독립변수와 종속변수에 대해서 쉽게 정리해 봅니다. 피처(feature) 데이터 분석을 관련 공부를 처음 할 때 가장 자주 접하는 단어가 바로 피처(feature) 입니다. 피처는 데이터의 특성을 나타내는 것으로 데이터 표에서 열(column)을 지칭합니다. 피처 분석(feature analysis), 피처 엔지니어링(feature engineering) 이라고 할 때의 피처가 바로 테이블에서의 컬럼을 뜻합니다. 피처(feature) 라는 용어와 함께, 변수(variable) 이라는 용어도 자주 혼용되어 사용되고 있습니다. 참고로, 데이터분석에서는 행(row) 을 관측치(observed valude) 라는 용어가 가장 많이 사용되고 있습니다. 아, 그리고,,,, 데이터분석에서 표는 데이터..
-
[ML왕초보] 데이터분석을 위한 완전 기초 통계용어 - 이것만 알고 시작하자머신러닝(ML) 2020. 8. 17. 16:37
머신 러닝 공부를 시작해 보려고 마음 먹고 나서 처음 부딪히는 좌절이 바로, 수학, 통계 일 것입니다. 그렇다고 데이터 분석과 머신러닝 공부해 보겠다고 다시 고등학교 수학책을 펼치고 통계 공부할 수는 없잖아요. 또, 완전히 무시할 수도 없는 것이, 아는 만큼 보인다고 하잖아요. 정말 필요한 기초 개념, 이것만이라도 우선 알고자 하는 마음에 정리해 봅니다. 모집단, 표본, 샘플링 모집단(population) : 원래 알고 싶은 데이터 전체, 그러나 현실적으로 이 데이터는 존재하지 않습니다. 표본(sample) : 모집단에서 일부만 뽑아낸 데이터 샘플링(sampling) : 모집단에서 표본을 뽑는 과정 표집수(N) : 샘플링한 데이터 개수 예를 들어, 우리나라 10대의 평균 키를 알아본다고 합시다. 그럼, ..