딕셔너리: 

dic = {"하나" :1, "둘":2}

 

#키값은 자동으로 abc 순, 혹은 가나다 순으로 정렬

{'둘':2, '하나':1}

 

dic.keys()

dict_keys([ '하나', '둘'])

 

dic.values()

dict_values([1, 2])

 

튜플:

tup = (1,2)

tup

(1,2)

 

리스트

데이터 전처리할 때 가장 많이 쓰임, 문자형 데이터가 들어가는 factory 변수 설정

factory=["전기", "오퍼레이터", "직업", "사무실", "사장"]

len 함수는 자료형의 길이 확인 가능

 

len(factory)

5

 

append

for 반복문과 함께 데이터 전처리할 때 많이 활용됨

factory.append("비")

factory

['전기', '오퍼레이터', '직업',  '사무실', '사장', '비']

factory.append(factory)

['전기', '오퍼레이터', '직업',  '사무실', '사장', '비',['전기', '오퍼레이터', '직업',  '사무실', '사장', '비']]

값을 하나씩 추가할때는 append

리스트를 추가할 때는 extend

factory.extend(factory)

['전기', '오퍼레이터', '직업',  '사무실', '사장', '비', '전기', '오퍼레이터', '직업',  '사무실', '사장', '비']

 

factory.remove("전기")

factory

['오퍼레이터', '직업',  '사무실', '사장', '비']

 

딕셔너리: key value 값으로 이루어진 {}안에서 입력되는 자료형

fac_word = {'factory':'공장', 'electricity': '전기', 'assemble': '조립하다'  }

fac_word

{ 'assemble': '조립하다' ,'electricity': '전기',  'factory':'공장'}

fac_word["factory"]

'공장'

fac_word["assemble"] = "모으다"

fac_word

{ 'assemble': '모으다' ,'electricity': '전기',  'factory':'공장'}

fac)word.keys()

dict_keys(['factory', 'electricity', 'assemble'])

 

tuple 변수 할당

digit = (0,1,"two")

digit = tuple(0,1,"two")

digit[1]

1

tuple은 조회밖에 안됨

digit[0] = 1

오류

 

반복되는 코드에 대해서 처리가 가능한 기능 for문, while문

while문

i=1

while i <= 100:

print(i)

i=i+1

1부터 100까지 출력

 

x in A

x not in A

 

for i in range(1, 101):     /101까지 해야 100까지

 

a=118* 29

b=97*35

if a>b:

 

** 제곱

예외처리

.py 파일은 중간에 오류가 하나라도 발생하면 실행을 멈춤

예외처리를 하면 자잘한 오류를 무시하고 코드 실행 가능

커스텀 에러 메시지 구현

 

text = "100퍼센트"

try: #try 구문 정의

number=int(text) # int 변환

excepty ValueError:

print("{}는 숫자가 아닙니다.".format(text))

 

#함수설정

def list_print(list, index): #입력변수: 리스트 면수, 인덱스

print(list.pop(index)):

 

numpy 패키지

수학 연산, 행렬처리 등의 작업 수행

numpy 형태로 데이터를 변환 후 머신러닝/딥러닝 모델에 입력 가능

특징
1.Numpy 배열을 리스트와 같은 값의 집합으로 볼 수 있으나 리스트와 다르게 하나의 타입만을 가질 수 있음

2. 각 차원의 크기를 튜플 형태로 표현 가능

3.배열의 차원에 따라서 인덱싱(조회) 가능

 

#외부 패키지 임포트

import numpy as np

#import pandas as pd

 

arr1 = np.array([1, 2, 3])

type(arr1)

numpy.ndarray

 

arr1.shape # numpy 행렬의 사이즈 출력

(3,)

arr1.ndim  #차원

1

arr2 = np.array([[1, 2, 3],[4, 5, 6,]])

type(arr2)

(2,3)

arr2.ndim

2

np.zeros(shape=(5,5))

 

 

'파이썬' 카테고리의 다른 글

Visual Studio Code  (0) 2023.07.28
Visual Studio Code  (0) 2023.07.28
Colaboratory  (0) 2023.07.28
Jupyter Notebook  (0) 2023.07.27
아나콘다 개발 환경 구축  (0) 2023.07.27

Visual Studio Code

다양한 언어를 활용할 수 있는 통합 개발 환경을 지원함

VS 코드는 윈도우, 리눅스, 맥OS 전부 지원

디버깅, Git, 구문 강조, 테마 설정, 단축키 설정 등 다양한 기능 제공

통합 개발 환경에서 호환겅, 편의성, 확장성 등을 보장함

 

파이썬 활용 유저는 같은 통합 개발 환경 계열인 파이참을 활용하는 경우도 있지만 일반적으로 VS코드 활용

https://code.visualstudio.com/download

 

Download Visual Studio Code - Mac, Linux, Windows

Visual Studio Code is free and available on your favorite platform - Linux, macOS, and Windows. Download Visual Studio Code to experience a redefined code editor, optimized for building and debugging modern web and cloud applications.

code.visualstudio.com

 

가상환경을 세팅했다면 자동적으로 인터프리터(파이썬)를 연결 가능

상단의 터미널 > 새 터미널을 클릭하면 하단에 터미널 창이 나타남

 

test.py 파일을 실행

python test.py

 

'파이썬' 카테고리의 다른 글

변수와 자료형  (0) 2023.07.28
Visual Studio Code  (0) 2023.07.28
Colaboratory  (0) 2023.07.28
Jupyter Notebook  (0) 2023.07.27
아나콘다 개발 환경 구축  (0) 2023.07.27

Visual Studio Code

다양한 언어를 활용할 수 있는 통합 개발 환경을 지원함

VS 코드는 윈도우, 리눅스, 맥OS 전부 지원

디버깅, Git, 구문 강조, 테마 설정, 단축키 설정 등 다양한 기능 제공

통합 개발 환경에서 호환겅, 편의성, 확장성 등을 보장함

 

파이썬 활용 유저는 같은 통합 개발 환경 계열인 파이참을 활용하는 경우도 있지만 일반적으로 VS코드 활용

https://code.visualstudio.com/download

 

Download Visual Studio Code - Mac, Linux, Windows

Visual Studio Code is free and available on your favorite platform - Linux, macOS, and Windows. Download Visual Studio Code to experience a redefined code editor, optimized for building and debugging modern web and cloud applications.

code.visualstudio.com

 

가상환경을 세팅했다면 자동적으로 인터프리터(파이썬)를 연결 가능

상단의 터미널 > 새 터미널을 클릭하면 하단에 터미널 창이 나타남

 

test.py 파일을 실행

python test.py

 

'파이썬' 카테고리의 다른 글

변수와 자료형  (0) 2023.07.28
Visual Studio Code  (0) 2023.07.28
Colaboratory  (0) 2023.07.28
Jupyter Notebook  (0) 2023.07.27
아나콘다 개발 환경 구축  (0) 2023.07.27

Colaboratory

구글에서 개발한 클라우드 기반 웹 Jupyter Notebook  개발 환경

코랩이라고 부름

빅데이터 및 인공지능 데이터  분석은 높은 수준의 컴퓨팅 연산 능력을 요구

서버 컴퓨터를 활용하기 어려운 경우에 사용

분석 PC에 GPU가 없는 경우가 많고,  GPU가 있더라도 사양이 낮아 제대로 분석하기 어려움

기본적인 수준의 데이터 분석을 수행할 수 있는 파이썬 프로그래밍 개발 환경 제공

교육이나 간단한 알고리즘 테스트시 유용하게 활용

 

개발환경

ID만 로그인하면 크롬 환경에서 사용가능

클라우드 기반으로 안정적인 패키지 환경을 제공하기 때문에 종속성 문제가 생길 우려가 적음

패키지 문제가 발생해도 런타임을 초기화하면 실행 초기 상태로 복구

기본적인 환경 설정이 구축되어 있어 환경 변수 세팅 등의 추가 설정을 간편하게 수행할 수 있음

Jupyter Notebook에 추가적으로 확장된 기능들도 제공

 

https://colab.research.google.com/

 

Google Colaboratory Notebook

Run, share, and edit Python notebooks

colab.research.google.com

 

구글에서는 데이터 분석의 다양한 예제를 코랩을 통해서 제공

독립된 환경으로 너무 오래된 코드만 아니라면 거의 대부분 확실한 실행을 보장

다양한 예제를 코랩으로 구성하여 문서형태로 제공

 

확장기능

코드와 텍스트 셀을 추가할 수 있는 버튼 제공

편의 기능들 지원

 

목차구성

텍스트 셀에서 #을 활용하여 목차 구성

#의 개수가 적을 수록 상위 목차

목차를 #으로 구성하면 하위 셀들을 위로 접을 수 있음

 

코랩 저장소

코랩 저장소는 폴더 아이콘을 클릭하면 확인할 수 있음

파일을 업로드하는 방식으로 외부 파일 사용

경로 복사할 수 있음

폴더 아이콘을 클릭하면 확인 가능

/content/ 기본 저장소

 

#데이터 프레임 조작 패키지 임포트

import pandas as pd

pd.read_csv("경로 붙여넣기")

 

=> 데이터를 불러올 수 있음

 

#행렬 조작, 머신러닝, 딥러닝 모델에 입력할 때 사용

import numpy as np

 변수 = pd.read_csv("경로")

 

런타임 유형 변경

기본 로컬 환경을  GPU 환경 구축 시 상시적으로 GPU 연산을 활용할 수 있음

런타임 유형을 필요할 때 불러오는 방식을 활용

런타임 > 런타임 유형 변경을 클릭하면 사용가능

딥러닝 분석 시 하드웨어 가속기를 GPU 및 TPU로 설정하여 활용

GPU설정을 자동적으로 테서플로우, 파이토치 등에 적용되지만 TPU 설정은 따로 코드를 설정

TPU란 데이터 분석 및 딥러닝을 위한 하드웨어, 텐서프로우에 최적화된 시스템을 가짐

 

구글 코랩은 사용자 친화적인 UI/UX를 제공하면서 데이터 분석 컴퓨팅 연산 문제 해결

'파이썬' 카테고리의 다른 글

Visual Studio Code  (0) 2023.07.28
Visual Studio Code  (0) 2023.07.28
Jupyter Notebook  (0) 2023.07.27
아나콘다 개발 환경 구축  (0) 2023.07.27
파이썬  (0) 2023.07.27

실행

아나콘다 가상환경과 연동된 Jupyter Notebook 실행

Jupyter Notebook은 크롬 환경을 기본으로 하기 때문에 기본 브라우저를 크롬으로 지정

파일 검색창에서 '기본 웹 브라우저 선택' 이동

웹 브라우저 선택 장에서 크롬 선택

주피터 노트북 실행

 

새로운 노트북 파일(jpynb) 만들기

주피터 노트북 홈 화면에서 New > Python3 버튼 클릭으로 jpynb 파일을 생성

일반적인 파이썬 코드 파일은 .py확장자로 생성되지만 주피터 노트북에서는 .jpynb 파일 확장자를 사용

주피터 노트북 파일이라고 부르기도 하는 jpynb 파일은 코드 뿐만 아니라 한글, Word롸 같은 문서 편집기 프로그램처럼 텍스트, 이미지, 동영상 등의 자료를 포함할 수 있음

 

파일 경로:C:\Users\97ehf

 

파이썬 코드 테스트

노트북 파일 코드 셀에 코드 입력

print("Hello, word!")

Shift + Enter 키를 누르면 코드가 실행됨

 

Move

파일경로를 이동하는 방법은 해당 파일을 체크 후 Move 버튼을 누르는 것

Move 버튼을 누르면 원하는 경로로 해당 파일을 이동할 수 있음

기본 경로: C:\Users\윈도우 계정

파일 경로를 이동하기 위해서는 해당 코드 파일을 shutdown 해야함

주의할 점 여러개의 파일을 체크해서 일괄처리하는 기능을 지원 x

하나의 파일만을 경로를 이동하거나 삭제하는 등의 작업 수행 가능

 

파일 삭제 기능

동시 작업이 필요할 경우 직접 디렉토리에 파일 탐색기로 접근

빨간 휴지통

 

이름 바꾸기 

스크립트 안에서 노트북 파일 이름 클릭으로 바꿀 수 있음

따로 저장

스크립트 상단의 file > save as로 가능

 

pdf로 저장

스크립트 상단의 file > save as에서 pdf로 저장하는 방식을 따로 설정해야함

크롬 웹 문서를 pdf로 인쇄하는 방식을 활용하면 간편하게 노트불 파일 코드를 pdf로 변환 가능

ctrl +p키를 누르면 인쇄창이 나타남

pdf로 설정하고 인쇄 버튼을 누르면 저장 가능

 

아이콘 활용하기

스크립트 환경의 아이콘은 다양한 기능을 지원

 

 

'파이썬' 카테고리의 다른 글

Visual Studio Code  (0) 2023.07.28
Visual Studio Code  (0) 2023.07.28
Colaboratory  (0) 2023.07.28
아나콘다 개발 환경 구축  (0) 2023.07.27
파이썬  (0) 2023.07.27

아나콘다

파이썬을 기반 빅데이터 기술을 활용하기 위해서는 많은 패키지 설치 및 세부 설정을 해야함

아나콘다 빅데이터 및 인공지능 기술을 활용하기 위한 기본 패키지와 설정을 지원하는 개발 환경

개인PC환경에서 간단하게 설치 될 수 있어 분석테스트 목적으로 유용하게 활용되고 있음

직관적인 의미에서 아나콘다는 몸집이 커진 파이썬으로 볼 수 있음

 

아나콘다 네비게이터

아나콘다에 포함된 패키지 프로그램들을 활용할 수 있도록 지원

 

아나콘다 프롬프트

터미널로 작업할 수 있는 기능제공 CMD와 같은 역할

 

주피터 노트북

셀 단위로 간편하게 파이썬 언어를 사용할 수 있도록 지원하는 스크립터 프로그램

간단한 수준의 분석이나 테스트 시 아주 유용하게 활용 가능

 

아나콘다3 > 스크립터: 주피터 노트북(사용언어 파이썬)

 

https://www.anaconda.com/download

 

Free Download | Anaconda

Anaconda's open-source Distribution is the easiest way to perform Python/R data science and machine learning on a single machine.

www.anaconda.com

아나콘다 다운로드

아나콘다 프롬프트를 실행하여 python --version 코드를 입력, 실행하면 파이썬 설치가 완료 된 것을 확인 가능

단순 로컬 환경에서 분석을 진행하면 설치하는 패키지 종속성에 문제가 생길 수 있음

종속성 문제를 보완할 수 있는 방법이 아나콘다에서 가상 환경을 구축하는 것

코드 몇 줄로 간단하게 가상 환경을 구축할 수 있음

 

아나콘다 프롬프트 실행하여 가상 환경 생성 코드를 입력

-conda create -n my_env python=3.8 -y

-n 은 이름 my_env 

python=3.8 3.8버전으로

-y를 활용하면 설치 시 확인이 필요한 부분에서 바로 넘어갈 수 있음

virtual machine, docker

가상 환경 설치가 완료되면 my_env 환경 활성화 가능

-active my_env

 

Jupyter Notebook커널 설치

커널을 따로 설치하면 간편하게 가상 환경에 연동된 Jupyter Notebook을 사용할 수 있음

-conda install nb_conda_kernels -y

nb_conda_kernels는 패키지명

설치가 완료되면 로컬 환경의 Jupyter Notebook외에 가상 환경이 연동된 Jupyter Notebook을 실행할 수 있음

가상환경 주피터 노트북을 켤 수 있게 됨

추가 가상 환경 조작 코드

가상환경 비활성화: deactivate

가상환경 삭제하기: conda env remove -n my_env

 

'파이썬' 카테고리의 다른 글

Visual Studio Code  (0) 2023.07.28
Visual Studio Code  (0) 2023.07.28
Colaboratory  (0) 2023.07.28
Jupyter Notebook  (0) 2023.07.27
파이썬  (0) 2023.07.27

파이썬

객체지향 프로그래밍 언어로 인터프리터식 스크립트 환경(코드를 입력을 해서 객체지향 방식으로)을 제공

인터프리터(interpreter):프로그래밍 언어의 소스코드를 바로 실행할 수 있는 컴퓨터 프로그램 또는 환경

컴파일러에 비교적 실행이 느림

인터프리터 유형

1.소스 코드 직접 실행

2. 효율적인 중간 코드로 변환 후 바로 실행

3. 인터프리터 시스템에서 컴파일 후 저장된 코드 실행

인간언어에 가까움.

 

컴파일러

특정 프로그래밍 언어를 기계가 이해할 수 있는 형태의 언어로 변환하는 프로그램

실행이 빠르지만 컴파일 단계를 거쳐야 사용 가능

컴파일 시간이 오래 걸림

대부분의 인터프리터가 컴파일 작업을 수행할 수 있기 때문에 구분이 사라져감

code optimizer: 최적화

 

파이썬의 장점 rapid miner

쉽고 간편하게 익힐 수 있음

방대한 패키지 소스를 제공하여 유연성과 확장성을 보장

빅데이터 분석 기술이 고도화 되면서 객체 지향 프로그래밍의 중요성이 더 높아지고 있음

오픈소스형태로 개발된 파이썬은 지금까지 관련 문서 및 자료들이 축적되어 있어 온라인 상에서 방대한 양의 의사소틍이 이루어지고 있음

빅데이터 분석을 수행하다가 어려운 점이 있을 때, 거의 모든 자료를 온라인 상에서 검색할 수 있음

kaggle

파이썬은 거의 모든 IDE에서 지원됨

심지어 노코딩 기반 분석 도구에서도 플러그인 형태로 소프트웨어 내부에서 기능을 사용할 수 있도록 지원

 

IDE:통합 개발 환경을 의미, 다양한 프로그래밍 언어를 하나의 GUI로 결합할 수 있는 소프트웨어

일반적으로 3가지 기능 보유

1. 소스 코드 편집기

구문 강조 기능으로 코드 작성 지원

2. 로컬 빌드 자동화

전체 프레임워크를 한번에 컴파일하여 로컬 환경에 시스템 구축

3. 디버깅

소스코드에서 버그가 발생한 부분을 확인

 

파이썬2

GC탑재와 유니코드 지원

GC: 프로그램이 할당한 메모리에서 필요없는 영역을 제거

유니코드: 전 세계 모든 문자를 컴퓨터에서 지원될 수 있도록 코드화

파이썬3

편의성을 위한 자료형 변환, 라이브러리 재배치, 유니코드 확장

 

파이썬의 핵심 철학

아름다운 것이 추한 것보다 낫다

명시적 표현이 암묵적 표현보다 중요하다

단순한 표현이 복잡한 표현보다 낫다

복잡함이 난해한것보다 낫다

가독성은 중요하다

 

파이썬의 라이브러리

프로그래머가 바로 활용할 수 있는 라이브러리와 통합 환경이 같이 제공

운영체제 호출, 정규 표현식, 통신 프로토콜, 데이터 파일 처리 등 다양한 내부 라이브러리 제공

NUMPY, OPENCV, PANDAS,PILLOW...

 

CMD 파이썬 활용

CMD창에서 Python이라고 입력하면 파이썬 스크립트 환경으로 접근 가능

 

Jupyter notebook

마크다운 기능 지원으로 문서 작업과 유사한 방식으로 파이썬 코드 작성 가능

가장 직관적인 형태의 스크립트 환경으로 기본적인 테스트 및 교육 시 활용

셀 단위로 파이썬 코드를 실행할 수 있음

 

Spyder

변수 탐색기 지원으로 데이터 분석 시 유용하게 활용

 

Colaboratory 

구글에서 개발한 클라우드 기반 파이썬 개발 환경

컴퓨팅 자원(특히GUI) 이 부족한 사람들에게 유용함

 

Visual Studio Code

마이크로 소프트에서 개발한 IDE 환경

'파이썬' 카테고리의 다른 글

Visual Studio Code  (0) 2023.07.28
Visual Studio Code  (0) 2023.07.28
Colaboratory  (0) 2023.07.28
Jupyter Notebook  (0) 2023.07.27
아나콘다 개발 환경 구축  (0) 2023.07.27

+ Recent posts