본문 바로가기

Machine learning3

[머신러닝] 평가 [파이썬 머신러닝 완벽 가이드 - 권철민] 책을 참고로 공부한 내용입니다. 머신러닝의 프로세스는 데이터 가공/변환, 모델 학습/예측, 그리고 평가로 구성된다. 머신러닝 모델은 여러 가지 방법으로 예측 성능을 평가할 수 있다. 그 중에서도 성능 평가 지표는 모델이 분류냐 회귀냐에 따라 여러 종류로 나뉜다. 이번에는 분류에 사용되는 성능 평가 지표에 대해 자세히 알아보려고 한다. 특히 이진 분류의 성능 평가 지표에 대해 집중적으로 알아보려고 하는데, 이진 분류에서는 정확도보다는 다른 성능 평가 지표가 더 중요시되는 경우가 많다. 분류의 성능 평가 지표부터 살펴보면 다음과 같다. 더보기 - 정확도 (Accuracy) - 오차행렬 (Confusion Matrix) - 정밀도 (Precision) - 재현율 (R.. 2021. 7. 27.
사이킷런으로 시작하는 머신러닝 실습 - 붓꽃 품종 예측/타이타닉 생존자 예측 [파이썬 머신러닝 완벽 가이드 - 권철민] 책을 참고로 공부한 내용입니다. 사이킷런이란? 파이썬 머신러닝 라이브러리 중 가장 많이 사용되는 라이브러리 특징 - 파이썬 기반의 다른 머신러닝 패키지도 사이킷런 스타일의 API를 지향할 정도로 쉽고 가장 파이썬스러운 API 제공 - 머신러닝을 위한 매우 다양한 알고리즘과 개발을 위한 편리한 프레임워크와 API를 제공 - 오랜 기간 실전 환경에서 검증됐으며, 매우 많은 환경에서 사용되는 성숙한 라이브러리임 아나콘다를 설치하면 기본으로 사이킷런까지 설치됨 1. 붓꽃 품종 예측하기 붓꽃 데이터 세트는 꽃잎의 길이와 너비, 꽃받침의 길이와 너비 피처(Feature)를 기반으로 꽃의 품종을 예측하기 위한 것 분류는 대표적인 지도학습 방법의 하나이다. 지도학습은 학습을 .. 2021. 7. 18.
머신러닝 개념 머신러닝이란? 애플리케이션을 수정하지 않고도 데이터를 기반으로 패턴을 학습하고 결과를 추론하는 알고리즘 기법 기존의 소프트웨어 코드만으로 해결하기 어려웠던 많은 문제점을 해결 가능 인간의 인지능력만이 해결 가능하다고 생각했던 분야에서 적용하며 발전하고 있음 (데이터 마이닝, 영상인식, 음성인식, 자연어 처리 등에 머신러닝 적용) 필요성 복잡한 문제를 데이터 기반으로 패턴을 인지해 해결 분류 지도 학습 비지도 학습 명확한 결정값이 주어진 데이터를 학습 분류 회귀 시각/음성 감지/인지 결정값이 주어지지 않는 데이터를 학습 군집화(클러스터링) 자원 축소 단점 - 데이터에 너무 의존적 - 실제 환경 데이터 적용 시 과적합 되기 쉬움 - 데이터만 집어 넣으면 자동으로 최적화된 결과를 도출해 내지 않음 (특정 경우.. 2021. 7. 11.
728x90