파이썬으로 할 수 있는 일/파이썬 기초 (27) 썸네일형 리스트형 알고리즘을 적용해 프로그램을 효율화하자 알고리즘 : 어떤 문제를 풀기 위한 절차나 방법, 구체적으로 어떤 문제가 주어진 '입력' 정보를 원하는 '출력(답)' 정보로 만드는 일련의 과정을 말함. 1부터 n까지 연속한 정수의 합을 구하는 알고리즘1 1부터 n까지 숫자를 차례로 더하는 방법을 사용함 def sum_n(n) : s = 0 # 합을 계산할 변수 for i in range(1, n+1): # 1부터 n까지 반복(n+1은 제외) s = s + i return s sum_n(10) 55 1부터 n까지 연속한 정수의 합을 구하는 알고리즘2 수학자 가우스의 계산 방법을 사용함 def sum_n(n): return n * (n+1)//2 # 슬래시 두개는 정수 나눗셈을 의미 알고리즘 1과 2를 비교했을 때, 숫자가 커지면 커질수록 알고리즘2가 더.. Time Series 관련 함수들과 kaggle data API 설정 Timestamp Timestamp()는 시간의 단일 시점을 나타낸다. 파이썬 datetime.datetime 객체와 동일한 기능을 한다. date 또는 datetime 스트링과 함께 pd.Timestamp() 함수를 사용해 Timestamp 객체를 만들 수 있다. import pandas as pd timestamp_ex = pd.Timestamp('2023-09-10 12:00:00') Period Period()는 하루, 한달, 또는 일년과 같이 시간의 일정 기간을 나타낸다. date 또는 datetime 스트링과 빈도(freq)와 함께 pd.Period() 함수를 사용해 Period 객체를 만들 수 있다. period_ex = pd.Period('2023-10', freq='M') Timedelt.. pandas DataFrame 에서 loc, iloc 사용 pandas는 Series, DataFrame 두개를 중심으로 데이터를 다룬다. 그 중 DataFrame에서 주로 사용하는 명령을 먼저 간단히 정리해 본 다음, loc와 iloc를 알아볼 것이다. 먼저 라이브러리를 읽어들인다. import pandas as pd import numpy as np 그 다음 사용할 데이터를 DataFrame 데이터 유형으로 만든다. dates = pd.date_range('2023-09-01', periods=6) df = pd.DataFrame(np.random.randn(6,5), index = dates, columns=['A', 'B', 'C', 'D', 'E']) df head() 명령을 사용하면 기본적으로 첫 5행을 보여준다. 괄호에 숫자를 기입하면 그 숫자만큼 .. jupyter notebook 원격 접속 설정 요즘 딥러닝 프로그램을 돌리는 컴퓨터가 있는 사무실에 계속 있기 어려운 환경에 있습니다. 그래서, 외부에서 컴퓨터를 온오프할 수 있도록 공유기 원격접속과 컴퓨터 WOL 기능을 켜두었습니다. 그리고 가장 많이 사용하고 있는 jupyter notebook을 원격지에서 사용할 수 있도록 세팅하였습니다. 1. 방화벽 해제 : 먼저 우분투 포트 방화벽 해제 및 공유기 포트포워드 설정을 합니다. >> sudo ufw allow 8888(jupyter notebook의 기본포트로 원하시는 포트로 변경 가능) 2. jupyter notebook 암호 설정 로컬에서만 사용할 경우에는 보통 암호 설정 없이, 토큰을 이용해 접근했었습니다. 그렇지만 원격 접속은 보안을 위해 암호를 설정하는 것이 더 편하고 좋습니다. jupy.. git과 github 기본 명령어 정리 git 기본 명령어(로컬) git(깃)은 파이썬으로 작업하는 사람들이 협업하는데 있어 필수적이라고 생각한다. 명령어 사용에 익숙해질 수 있도록 기본 명령어를 정리해 봐야겠다. - git init : 기존 디렉토리(폴더)를 git repository(저장소)로 초기화하여 만들기 - git add 파일이름 : git에 새로운 파일을 추가하여 git이 추적할 수 있게 하기 - git commit -m "" : 변경된 파일을 저장소에 제출하기 - git status : 현재 저장소 상태를 출력하기 git branch(독립적인 공간을 따로 만들기) - git branch 이름 : '이름'의 브랜치를 만들기 - git checkout 브랜치이름 : 현재 작업중인 '브랜치이름'으로 작업 공간을 변경하기 - git m.. 데이터 삭제 (Pandas 레시피) 이번에는 pandas에서 데이터를 삭제하는 방법에 대해 알아보고자 합니다. 1. pandas, numpy 라이브러리를 불러들입니다. >>> import pandas as pd >>> numpy as np 2. 다음 주소에서 데이터셋을 읽어들입니다. >>> url = 'https://archive.ics.uci.edu/ml/machine-learning-databases/wine/wine.data' 3. 읽어들인 데이터셋을 wine 변수에 저장합니다. >>> wine = pd.read_csv(url) >>> wine.head() 4. 컬럼들 중에서 첫번째, 네번째, 일곱번째, 아홉번째, 열두번째, 열세번째, 열네번째 컬럼을 삭제합니다. >>> wine = wine.drop(wine.columns[[0, 3.. 시계열 처리- Time series (Pandas 레시피) 애플 주식 가격을 사용한 시계열 처리를 알아봅니다. 1. pandas, numpy, matplotlib 라이브러리를 불러들입니다. >>> import pandas as pd >>> import numpy as np >>> import matplotlib.pyplot as plt >>> %matplotlib inline # jupyter notebook 내에서 그래프를 그릴 수 있도록 합니다. 2. 아래 주소를 url 변수에 저장합니다. >>> url = 'https://raw.githubusercontent.com/guipsamora/pandas_exercises/master/09_Time_Series/Apple_Stock/appl_1980_2014.csv' 3. 위 주소에서 받은 애플 주식 데이터를 a.. 시각화-visualization (Pandas 레시피) 1. pandas, numpy, matplotlib, seaborn 등 필요한 라이브러리를 읽어들입니다. >>> import pandas as pd >>> import numpy as np >>> import matplotlib.pyplot as plt # 파이썬에서 시각화를 처리하는데 필요한 대표적인 라이브러리로 생각하면 됩니다. >>> import seaborn as sns # matplotlib를 바탕으로 해서 시각화를 더 멋지게 만들어줍니다. % matplotlib inline # jupyter notebook(쥬피터 노트북) 내에서 그래프를 보여주도록 해줍니다. sns.set(style='ticks') # 더 나은 스타일로 그래프를 보여주도록 seaborn을 설정합니다. 2. 다음 주소에서 데이.. 이전 1 2 3 4 다음 목록 더보기