'딥러닝' 태그의 글 목록

딥러닝

hdf5 파일 형식이란? 2017.04.14
[머신러닝] lec 7-2 : Training/Testing 데이타 셋 2017.03.22
5. 김성 머신러닝 git hub 소스 다운로드 받기 2017.03.18

hdf5 파일 형식이란?

2017. 4. 14. 10:18

hdf5 파일형식이란? (https://www.hdfgroup.org/hdf5/)

계층적 데이터 형식(Hierarchical Data Format, HDF)은 HDF Gruop에 의해 관리되고 있는 대용량의 데이터를 저장하기 위한 파일 형식이다.

HDF5 is a data model, library, and file format for storing and managing data. It supports an unlimited variety of datatypes, and is designed for flexible and efficient I/O and for high volume and complex data. HDF5 is portable and is extensible, allowing applications to evolve in their use of HDF5. The HDF5 Technology suite includes tools and applications for managing, manipulating, viewing, and analyzing data in the HDF5 format.

hdf5의 특징 (https://support.hdfgroup.org/HDF5/whatishdf5.html)

XML과 동일하게 자기 기술적으로 구성되어있어 데이터 형식을 파일 안에 기술이 가능하다.
많은 양의 데이터를 저장 가능하다.
검색 속도가 빠르다.
병렬 입출력을 지원한다.
데이터의 무작위 조회가 가능하다.
20여년 이상 개발되어온 포맷으로 안정적이다.
수많은 프로그래밍 언어와 오픈소스 라이브러리 API가 지원된다.

hdf5에 대해서

hdf5 튜토리얼 : https://support.hdfgroup.org/HDF5/Tutor/
Introduction : https://support.hdfgroup.org/HDF5/Tutor/HDF5Intro.pdf

Python에서 사용하는 방법

☞ http://aileen93.tistory.com/98 (아직 작성 못함)

참고 링크

저작자표시 비영리 변경금지 (새창열림)

'◼︎ 개발 > 머신러닝 관련 문서' 카테고리의 다른 글

초평면과 퍼셉트론 이론 (0)	2017.04.14
파이썬(Python)에서 hdf5 파일 형식으로 데이터 읽고 쓰기 (0)	2017.04.14
데이터마이닝 분석 방법 및 알고리즘 (0)	2017.02.06
데이터마이닝의 개념 (0)	2017.02.03

[머신러닝] lec 7-2 : Training/Testing 데이타 셋

2017. 3. 22. 14:09

#모두를 위한 립러닝 강좌 7-2 : Training/Testing 데이타 셋

https://www.youtube.com/watch?v=KVv1nMSlPzY&list=PLlMkM4tgfjnLSOjrEJN31gZATbcj_MpUm&index=19

＊어떠한 모델이 좋은 모델인가?

전체 데이터 중에 70%는 Training Set으로 나머지 30%는 Testing set로 남겨두고 30%는 절대 사용해선 안된다. 그리고 30%의 Training set를 다시 70%는 트레이닝 데이터로 나머지 30%는 Validation 체크를 하기 위한 값으로 남겨둔다. 여기서 Validation 체크란 rate나 람다같은 수를 수정 변경할 경우 쓸 validation 체크용 데이터이다.

＊Online learning이란?

100만개의 데이터 세트가 있을 경우, 100만개의 데이터 세트를 10만개씩 나누어서 Model을 학습시키는데 이때, 첫번째 학습한 10만개에 대한 학습 결과가 두번째 학습시키는 10만개의 데이터에 반영 되어야 한다는 방법론이다.

＊MINIST Dataset

사람들이 적어 놓은 숫자들을 컴퓨터가 정확히 알아낼 수 있는지 학습시키는 데이터 세트이다. 미국에서 사람들이 우편번호를 쓸 때, 날려쓰는 경우가 있는데 그 일을 컴퓨터를 통해서 시키기 위해서 나온 방법이다. 이것 역시도, train-inmages-idx3, train-labels 트레이닝 세트와 t10k-images, t10k-labels 테스트 세트가 있을 때 우리는 우리가 가진 모델이 얼마나 정확한 모델을 가졌는지 확인하는 작업은 매우 간단한 일이 될 것이다. y값 (레이블값)과 모델이 예측한 값을 비교하여서 100개 중에 10개 맞으면 10% 정확한 것이고. 100개 중에 90개를 맞췄다면 90%의 정확도를 가졌다고 할 수 있다.

저작자표시 비영리 변경금지 (새창열림)

'◼︎ 개발 > ML 알고리즘' 카테고리의 다른 글

[머신러닝] lec 8-1 : 딥러닝의 기본 개념 : 시작과 XOR 문제 (0)	2017.04.11
[머신러닝] lab 7-2 : Meet MNIST Dataset (0)	2017.04.11
[머신러닝] lab 7-1 : training/test dataset, learning rate, normalization (0)	2017.04.04
[머신러닝] lec 7-1 : 학습 Learning rate, Overfitting, 그리고 일반화 (0)	2017.03.20
[머신러닝] lec 6-2 : Softmax classifier 의 cost함수 (0)	2017.03.10
[머신러닝] lec 6-1 : Softmax Regression: 기본 개념 소개 (0)	2017.03.10
[머신러닝] lec 5-2 : Logistic Regression의 cost 함수 설명 (0)	2017.02.28

5. 김성 머신러닝 git hub 소스 다운로드 받기

2017. 3. 18. 20:58

김성 교수님의 딥러닝 git 다운받기

저작자표시 비영리 변경금지 (새창열림)

'◼︎ 개발 > 텐서플로우' 카테고리의 다른 글

[텐서플로우] 기본 예제1) (0)	2017.03.23
[텐서플로우] Open GL과 Open CL (0)	2017.03.23
7. [Mac] 에서 텐서플로우(Tensorflow) GPU 설치하기 (0)	2017.03.22
6. 텐서플로우 시작하기 (0)	2017.03.19
4. 파이참(Pycharm)에서 텐서플로우 예제 실행해보기 (0)	2017.03.17
3. 파이참(Pycharm)으로 Hello world 찍기 (0)	2017.03.17
1. Tensorflow 윈도우/맥에서 설치하기 (0)	2017.03.17

PREV 1 NEXT

Ailyn의 기술 블로그

딥러닝

hdf5 파일 형식이란?

'◼︎ 개발 > 머신러닝 관련 문서' 카테고리의 다른 글

[머신러닝] lec 7-2 : Training/Testing 데이타 셋

'◼︎ 개발 > ML 알고리즘' 카테고리의 다른 글

5. 김성 머신러닝 git hub 소스 다운로드 받기

'◼︎ 개발 > 텐서플로우' 카테고리의 다른 글

+ Recent posts

티스토리툴바