본문 바로가기

Data

(31)
파이썬 코딩 컨벤션 해당글은 https://spoqa.github.io/2012/08/03/about-python-coding-convention.html 에서 작성되었습니다. Coding Convention 코딩 컨벤션이란 개념에 대해 생소하신 분들도 계실 테니 이를 먼저 알아보죠. 코딩 컨벤션은 프로그램 코드를 작성할 때 사용되는 일종의 기준입니다. 이를테면 들여쓰기(Indentation)는 공백으로 할거냐 탭으로 할거냐. 부터 var a = 3; 과 같은 코드에서 a와 =를 붙이느냐 마느냐라던지를 정해주는 것이죠. 알고 계시는 것처럼 이러한 차이는 특별히 실행 결과의 영향을 주지 않습니다. 다르게 이야기하자면 “실행 결과에 별 차이가 없는 선택지들”이기 때문에 일관성이 있는 기준을 두어 통일하자는 것이지요. 그렇다면 ..
'머신러닝-딥러닝', 뭐가 다를까? 해당글은 : http://www.zdnet.co.kr/news/news_view.asp?artice_id=20170807140504 에서 작성되었습니다. 지난해 '알파고 쇼크'이후 인공지능(AI)에 대한 관심이 커진 가운데, 자주 언급되는 AI 관련 용어가 바로 '기계학습(머신러닝)' 과 '심층학습(딥러닝)'이다. 하지만 머신러닝과 딥러닝의 차이를 잘 모르거나, 혼동하는 사람이 적지 않다.이에 두 기술 용어의 차이를 공학용 소프트웨어 'MATLAB'의 개발원인 매스웍스가 쉽게 해설한 유트브 동영상이 관심을 모으고 있다. 머신러닝이나 딥러닝 모두 학습 모델을 제공해 데이터를 분류하는 데 사용되는 기술이다.그 기능을 설명하는 데 있어 자주 사용되는 것이 개와 고양이 이미지를 분류하는 예시인데,매스웍스가 공개..
[Anaconda] 아나콘다 설치 및 사용법 for 맥 & 윈도우 아나콘다(Anaconda) 설치 및 사용법 아나콘다가 무엇일까?컨티눔(Continuum)사가 제작한 파이썬 배포판이 바로 '아나콘다' 입니다. 여러가지 배포판 중 가장 후발주자이지만 가장 뛰어난 완성도로 현재는 사실상의 표준(de facto standard) 이 되었습니다. 아나콘다는 패키지 의존성을 관리해주므로 가상환경에 따라 독립적으로 패키지를 관리할 수 있습니다. 아나콘다 설치아나콘다는 https://www.continuum.io/downloads 다음과 같은 페이지에 접속해서 다운로드 받을 수 있습니다. 사용하시는 OS 환경에 따라 윈도우, OSX, 리눅스 중에 선택해서 받으시면 됩니다. 파이썬 3버전이나 파이썬2.7 버전 어느 것을 받으셔도 크게 상관없습니다. 왜냐하면 저희는 필요하다면 가상환경..
Machine Learning #6 Pandas Dataframe 1. Pandas Dataframe 형식으로 읽어오기 import pandas as pd df = pd.read_csv('./data_file/ex1.csv') print('\n', df) print('\n', pd.read_table('./data_file/ex1.csv', sep=',')) print('\n', pd.read_table('./data_file/ex2.csv', header=None, sep=',')) print('\n', pd.read_table('./data_file/ex2.csv', names=['a','b','c','d','message'])) names = ['a','b','c','d','message'] print('\n', pd.read_table('./data_file/e..
Machine Learning #5 Matplotlib 1. Default import pandas as pd import matplotlib.pyplot as plt import numpy as np #t = np.arange(0., 5., 0.2) #plt.plot(t, t,'r--', t, 0.5*t**2, 'bs:', 0.2*t**3, 'g^-') np.random.seed(12345) f1 = plt.figure(figsize=(10,2)) plt.title('figsize:(10,2)') plt.plot(np.random.randn(100)) plt.savefig('ex_plot.png', dpi=400, bbox_inches='tight') plt.show() 2. Line Exx1 = np.linspace(0., 5.) x2 = np.linsp..
Machine Learning #4 Pandas Pandas는 고수준의 자료구조와 파이썬을 통한 빠르고 쉬운 Series- 일련의 객체를 담을 수 있는 1차원 벡터- index(색인)라고 하는 배열의 데이터에 연관되 이름을 가지고 있다. import pandas as pd import numpy as np obj = pd.Series([-4,7,-4,3]) print('\n',obj, '\n') print('\n',obj.values, '\n') print('\n',obj.index, '\n') obj2 = pd.Series([-4,7,-4,3], index=['d','b','a','c']) print('\n',obj2, '\n') print('\n',obj2.index, '\n') print('\n',obj2['a'], '\n') obj2['d'] ..
Machine Learning #3 numpy Numpy 배열- 배열을 생성할 때는 효율성을 높이려고 배열을 데이터에 연결- python 내부적으로는 array를 지원하지 않는다.- numpy는 C로 구성되어 있으며, 리스트 형태의 python data를 C의 array type으로 만들어 준다. [Code]import numpy as np arr = np.arange(10) print('\n', arr) print('\n', arr[5]) print('\n', arr[5:8]) arr[5:8] = 12 print('\n', arr) arr_slice = arr[5:8] print('\n', arr_slice) arr_slice[1] = 12345 print('\n', arr) arr_slice[:] = 64 print('\n', arr) arr3d..
Machine Learning #2 python 1.여러분이 10일 작업에 대한 두 가지 급여 옵션을 제의 받았다고 가정하자 옵션1: 하루에 $100 지급옵셥2: 첫째 날에 $1, 둘째 날에 $2, 셋째 날에 $4등 매일 전일 급여의 두 배를 받음 두 가지 옵션 중에 어떤 경우가 좀 더 유리한 옵션인지 결정하라.이 때 Option1과 Option2라는 함수를 각각 생성하여 계산하여라. def main():## Compare salary options opt1 = option1() opt2 = option2() print("Option 1 = ${0:,.2f}.".format(opt1)) print("Option 2 = ${0:,.2f}.".format(opt2)) if opt1 > opt2: print("Option 1 pays better.") el..