머신러닝(ML)
-
[ML왕초보] 피처(feature), 독립변수, 종속변수머신러닝(ML) 2020. 8. 19. 14:40
데이터 분석에서의 독립변수와 종속변수에 대해서 쉽게 정리해 봅니다. 피처(feature) 데이터 분석을 관련 공부를 처음 할 때 가장 자주 접하는 단어가 바로 피처(feature) 입니다. 피처는 데이터의 특성을 나타내는 것으로 데이터 표에서 열(column)을 지칭합니다. 피처 분석(feature analysis), 피처 엔지니어링(feature engineering) 이라고 할 때의 피처가 바로 테이블에서의 컬럼을 뜻합니다. 피처(feature) 라는 용어와 함께, 변수(variable) 이라는 용어도 자주 혼용되어 사용되고 있습니다. 참고로, 데이터분석에서는 행(row) 을 관측치(observed valude) 라는 용어가 가장 많이 사용되고 있습니다. 아, 그리고,,,, 데이터분석에서 표는 데이터..
-
[ML왕초보] 데이터분석을 위한 완전 기초 통계용어 - 이것만 알고 시작하자머신러닝(ML) 2020. 8. 17. 16:37
머신 러닝 공부를 시작해 보려고 마음 먹고 나서 처음 부딪히는 좌절이 바로, 수학, 통계 일 것입니다. 그렇다고 데이터 분석과 머신러닝 공부해 보겠다고 다시 고등학교 수학책을 펼치고 통계 공부할 수는 없잖아요. 또, 완전히 무시할 수도 없는 것이, 아는 만큼 보인다고 하잖아요. 정말 필요한 기초 개념, 이것만이라도 우선 알고자 하는 마음에 정리해 봅니다. 모집단, 표본, 샘플링 모집단(population) : 원래 알고 싶은 데이터 전체, 그러나 현실적으로 이 데이터는 존재하지 않습니다. 표본(sample) : 모집단에서 일부만 뽑아낸 데이터 샘플링(sampling) : 모집단에서 표본을 뽑는 과정 표집수(N) : 샘플링한 데이터 개수 예를 들어, 우리나라 10대의 평균 키를 알아본다고 합시다. 그럼, ..
-
[ML왕초보] 코딩 없이 머신러닝 앱 개발 해보기 (2) - 코딩야학 머신러닝 머신머신러닝(ML) 2020. 8. 16. 15:16
이번 포스팅에서는 앞서 구글의 Teachable Machine에서 생성한 모델을 이용하여, 애플리케이션을 만드는 방법을 소개합니다. Teachable Machine 에서 가위, 바위, 보 인식 모델 생성하는 법은 아래 포스팅에서 확인해 주세요. ↓↓↓↓ 2020/08/15 - [머신러닝(ML)] - [ML왕초보] 코딩 없이 머신러닝 앱 개발 해보기 (1) - Teaching Machine 으로 모델 만들기 고맙게도 코딩야학에서 Teachable Machine 에서 생성한 모델로 간단히 애플리케이션을 만들 수 있는 환경을 제공합니다. 아주 쉬우니까 그냥 따라해보세요. 순서는 다음과 같이 진행됩니다. 1. Teachable Machine 에서 다운로드 받은 모델 파일을 업로드 하기 2. 가위, 바위, 보를 ..
-
[ML왕초보] 코딩 없이 머신러닝 앱 개발 해보기 (1) - Teaching Machine 으로 모델 만들기머신러닝(ML) 2020. 8. 15. 18:14
코딩 전혀 몰라도 머신러닝을 이용한 어플리케이션을 개발(?), 경험 해볼 수 있는 것이 있더라구요. 한번 해볼까요? 우선 무엇을 개발할 것인지 고민해봅시다. 저는 가위, 바위, 보를 카메라가 인식해서 읽어주는 애플리케이션을 개발하려고 합니다. 그렇다면 크게 두 부분으로 나눌 수가 있는데요, 첫번째는 가위, 바위, 보를 머신러닝을 통해 학습 시키기와 둘째는 실제 가위, 바위, 보를 냈을 때 알려주는 부분 입니다. 우선, 가위, 바위, 보를 머신 러닝으로 학습시켜 봅시다. 가위, 바위, 보 학습 시키기 구글의 Teachable Machine 을 이용해서 학습을 시킬 겁니다. 일단 아래 사이트로 접속해 보세요. https://teachablemachine.withgoogle.com/ 위 화면에서 " Get S..
-
[ML왕초보] 머신러닝이란?머신러닝(ML) 2020. 7. 26. 23:13
올해 초 AI/Data 분야의 교육 기획/운영 업무를 맡게 되면서, 데이터분석, 머신러닝에 대한 공부를 시작했습니다. 그런데, 대부분의 책이나 과정들이 개념설명에 수학 공식도 많고, 사용하는 용어는 왜 이리 어려운 것인지, 완전 초보인 저로서는 이해없이 그냥 예제 코드 돌려보는 것 정도만 반복할 뿐이였어요. 6개월이 지난 지금에서야 아주 기초적인 개념을 파악한 듯 해요. 그래서 아주 쉽게 머신러닝에 대해서 정리해 보고자 합니다. 네, 맞습니다. 어느 분들에게는 정말 너무 쉬운 이야기 일 수도 있어요. 머신러닝에 대해서 처음 시작하시는 분들께 조금이나마 도움이 되면 좋겠습니다. 머신러닝이란? 머신러닝이 무엇인지 설명드리기 전에 우선 아래 표를 봐주세요. X : -1 0 1 2 3 4 5 Y : -2 1 4..
-
XGBoost (eXtra Gradient Boost) 설치머신러닝(ML) 2020. 7. 11. 08:08
XGBoost 도 아나콘다 환경이라면 Mac OS 든, Window 든 설치는 매우 간단하다. command 창에서 conda install -c anaconda py-xgboost 만 입력하면 된다. XGBoost 가 정상적으로 설치되었는지 Jupyter Notebook 을 열어서 아래 코드가 에러 메세지 없이 정상적으로 실행되는지 확인해 본다. 버전 정보가 출력되면 정상 설치 된 것이다. import xgboost as xgb from xgboost import XGBClassifier print(xgb.__version__) 이제 XGBoost 를 설치 했으니, 공부를 시작해볼까~
-
Mac OS 에서 Graphviz 설치머신러닝(ML) 2020. 6. 27. 17:27
요즘 파이썬으로 머신러닝을 공부하고 있다. 결정 트리 모델 시각화 부분에서 graphviz 가 설치가 안되어 있다고 계속 에러가 나와서 (에러 화면 캡처를 깜박 ^^;;;;) graphviz 를 설치하기 위해 검색에 들어갔다. 여러 가지 방법이 검색이 되었는데, 만약 anaconda 를 설치해 두었다면, command 창을 열어 conda install graphviz 만 입력하고 엔터! 그러면 알아서 설치할 목록들 찾아주고 'y' 한번 더 쳐주면 끝!