#. 이미지 url 다운로드-- urllib.request.urlretrieve(image_url, image_path) 12345678import urllib.request def downImage(img_url, img_name): dir = '/Users/aaron/Desktop/test/' urllib.request.urlretrieve(img_url, dir + img_name + '.jpg') downImage('http://blogfiles.naver.net/20120808_277/tpet2_1344432366023a5JkD_PNG/2.png','cat') Colored by Color Scriptercs
#. 구글 이미지 크롤링 + 2020.04.22 추가 (google-images-download does not work)해당 라이브러리로 이미지 크롤링이 제대로 작동하지 않는다는 댓글이 생겨서 확인해보았습니다.google images download library 홈페이지 에 명시된대로 다시 구현해보았는데 역시나 같은 현상이 발생하였습니다.문제 해결을 위해 구글링을 해본 결과 stack overflow, google-images-download github issue 에서도 같은 현상을 보이는 개발자들이 많은 것을 알게 되었습니다.Google 이미지 형식이 변경되어 크롤링을 하는 과정에서 기존에 파싱이 가능한 객체를 보내주었다면, 지금은 파싱이 가능했던 깨끗한(?) 하나의 객체를 보내주지 않고 정보를 ..
#. 파일명 변경하기-- path 안에 있는 파일들을 list로 읽고-- os.rename 메서드로 취향에 맞게 파일명 변경 12345678910import os def changeName(path, cName): i = 1 for filename in os.listdir(path): print(path+filename, '=>', path+str(cName)+str(i)+'.jpg') os.rename(path+filename, path+str(cName)+str(i)+'.jpg') i += 1 changeName('/Users/aaron/Desktop/testFolder/','test')cs
#. 폴더 생성하기 -- os.path.exists 메서드로 해당 Directory가 없으면 Directory를 생성 12345678910import os def createFolder(directory): try: if not os.path.exists(directory): os.makedirs(directory) except OSError: print ('Error: Creating directory. ' + directory) createFolder('/Users/aaron/Desktop/test')cs
.Setting1234567891011import pandas as pd import numpy as np from pandas import Series, DataFrame from numpy import nan as NA import matplotlib.pyplot as plt %matplotlib qtcs-- .시계열 데이터12345from datetime import datetime # datetime 모듈 안에 datetime 함수 now = datetime.now() # sysdate in oracle, Sysdate in R now.year, now.month, now.dayColored by Color Scriptercs-- .날짜 생성1datetime(2019,2,20) - datetime..
#. 색인 (.np.ix_, .iloc, .loc) *# 슬라이스 색인 (얕은 복사, 원본 갱신) - 1차원 : ar[n:m] # n~m-1 - 2차원 : arr[:2] # 행 우선 (n~1행) arr[:2, 1:] # (n~1행, 1~m열) # 다차원 색인 - arr[[1,5,3], [2,6,4]] # point 색인 (1,2), (5,6), (3,4) - arr[[1,5,3], [:,[2,6,4]] # 1,5,3행의 2,6,4열 # np.ix_() 함수 색인 - arr[np.ix_([1,5,3], [2,6,4])] # 1,5,3행의 2,6,4열 (np.ix_ 함수 : 위치 값으로 전달) # iloc[] 정수 색인 - df.iloc[0,:] # 0번째 행 - df.iloc[:,0] # 0번째 열 - d..
그룹 연산(Group by) - 연산대상.groupby(그룹핑 대상) - groupby의 결과는 Dictionary 형태 - groupby 수행 시 결과는 보여주지 않음 로 그룹핑이 되었다고만 출력 - 분리 -> 적용 -> 결합 : 다른 언어와 다르게 파이썬은 분리(split)까지 동작. 적용과 결합을 위해 연산 메서드를 적용 pd.groupby? pd.groupby(*args, **kwargs) #. 그룹 연산(pd.groupby) sub = pd.read_csv('subway.csv', encoding='cp949') # 노선번호별 승차에 대한 평균 # 방법 1) 일부 컬럼 전달(속도상 유리) sub['승차'].groupby(sub['노선번호']).mean() # 방법 2) 전체(연산 가능한 모든 컬..
참고글 : [Python] 피벗 (.pivot, .pivot_table) [Python 시각화] 선 그래프 그리기 (matplotlib API) import pandas as pd import numpy as np from pandas import Series, DataFrame from numpy import nan as NA import matplotlib.pyplot as plt %matplotlib qt #. 막대 그래프(Bar Plot) 그리기 - 각 로우별 막대 그래프 출력 - 각 컬럼이름이 범례로 지정 df1 = pd.read_csv('plot_test.csv') df1.index = ['월','화','수','목','금','토','일'] df1.columns.names = ['지점'] df1..