Programming/Deep Learning 6

Predict 예측을 위한 정밀도 / 재현율 구하기.

정밀도 / 재현율 정밀도와 재현율을 구현하기 위해서는 오차 행렬의 각 요소 ( FN, FP, TN, TP) 들이 정확하게 의미하는 바를 알아야한다. 오차행렬에서 각 요소에 기반하여 정밀도와 재현율을 표현하면 다음과 같다. 1. 정확도(Accuracy) : 실제데이터와 예측데이터가 얼마나 같은지를 판단하는 지표 정확도 = 예측 데이터가 동일한 데이터 건수 / 전체 예측 데이터 건수 직관적으로 모델 예측 성능을 나타내는 평가 지표이지만 이진 분류의 경우 데이터의 구성에 따라 모델 성능을 왜곡할 수 있음 가령, 타이타닉 예제에서도 여성의 생존률이 높았기 때문에, 특별한 알고리즘 없이 여성을 생존, 남성을 사망으로 분류해도 정확도는 높을 수 있음 ( 단순히 하나의 조건만 가지고 결정하는 알고리즘도 높은 정확도를..

[Tesorflow] GPU 설정 버전

Tensorflw gpu 버전을 설치할때 Cuda 와 Cudnn 에 대해 버전별로 맞추어야하는 상황이 자주발생하는데 Tensorflw 버전마다 아래와 같이 Cuda와 CuDnn 을 설치했던 내용을 정리한다. Cuda 10.1 + CuDNN 7.6.5 (normally > 7.6) + TensorFlow 2.2.0 (TF >= 2.1 requires CUDA >=10.1) Cuda 10.1 + CuDNN 7.6.5 (normally > 7.6) + TensorFlow 2.1.0 (TF >= 2.1 requires CUDA >= 10.1) Cuda 10.0 + CuDNN 7.6.3 + / TensorFlow 1.13/1.14 / TensorFlow 2.0. Cuda 9.0 + CuDNN 7.0.5 + Ten..

인공 신경망[ 구조 ]

인공신경망(Artificial Neural Network, ANN) 딥러닝에서 가장 기본이 되는 개념은 바로 신경망(Neural Network)입니다. 신경망이란 인간의 뇌가 가지는 생물학적 특성 중 뉴런의 연결 구조를 가리키며, 이러한 신경망을 본떠 만든 네트워크 구조를 인공신경망(Artificial Neural Network, ANN)이라고 부릅니다. 인간의 뇌에는 약 1,000억 개의 수많은 뉴런 즉 신경세포가 존재하며, 하나의 뉴런은 다른 뉴런에게서 신호를 받고 또 다른 뉴런에게 신호를 전달하는 단순한 역할만을 수행합니다. 하지만 인간의 뇌는 이러한 수많은 뉴런이 모여 만든 신호의 흐름을 기반으로 다양한 사고를 할 수 있게 되며, 이것을 컴퓨터로 구현하도록 노력한 것이 바로 인공신경망입니다 입력계..

Windows 10 아나콘다 설치

아나콘다란? 아나콘다는 기본적으로 파이썬뿐만 아니라 머신러닝을 위한 패키지(수학, 과학 분야의 패키지)인넘파이, 판다스, 맷플롯립, 시본 그리고 주피터 노트북까지 함께 설치가 가능하다. 최근 Tensorflow 또는 데이터분석을 위해 파이썬을 많이 사용하는데베이스로 아나콘다를 설치하고 시작이 이제는 필수가 되었다. 아나콘다 설치 경로 아나콘다 다운로드 경로 : https://www.anaconda.com/distribution/ 윈도우 64bit 버전 installer를 다운로드 해줍니다. 아나콘다 설치 다운이 완료되면, 다운로드 받은 installer를 실행해줍니다. 본인의 경우 SSD가 1TB라서 용량이 넉넉하여 C Drive에 설치했지만 설치경로는 본인의 임의에 따라 설치해도 아무 이상이 없다. 또..

[Kaggle] You must resolve errors before creating your dataset

Kaggle에서 Dataset을 업로드할때 다음과 같은 에러가 일어난다. 하지만, 이경우 https://www.kaggle.com/product-feedback/84968 You must resolve errors before creating your dataset​ | Data Science and Machine Learning Tell us what you love, hate, and wish for | Product Feedback www.kaggle.com 와 같이 여러 문제점에 대해 논의되고 있으나 명확한 해결법은 되지 않는다. 이와 같은 문제점에 대해 분석한 결과 한 계정으로 많은 데이터셋을 업로드하려고 하거나 ip 쪽에 문제가 있을경우 계정 자체에 lock이 걸리는것 같다. 그래서 필자의 경..

[Kaggle] Kaggle Kernels

Kaggle에서 데이터셋을 다운받고 결과를 제출은 Kernerls에서 제출한다. Kernerls에서는 Jupyter Notebook, Script 2가지 방법으로 제출이 가능하다. 선택 언어는 Python, R 2가지 언어를 사용하여 제출할 수 있다. Select new notebook Setting 새로운 노트북 생성1. Select new notebook Setting 새로운 노트북 생성 Kernels 생성 처음 Notebook 생성시 데이터셋 경로는 자동으로 생성이 된다. Settings를 통해 기본 설정을 변경할 수 있음 데이터셋 컴파일 및 소스코드를 실시간으로 컴파일 할 수 있음. 데이터셋 컴파일 테스트 결과 - Host의 데이터셋을 기본경로로 설정되어 있기 때문에 Host의 데이터셋과 잘 연동..