일 | 월 | 화 | 수 | 목 | 금 | 토 |
---|---|---|---|---|---|---|
1 | 2 | 3 | 4 | 5 | ||
6 | 7 | 8 | 9 | 10 | 11 | 12 |
13 | 14 | 15 | 16 | 17 | 18 | 19 |
20 | 21 | 22 | 23 | 24 | 25 | 26 |
27 | 28 | 29 | 30 |
- fnmatch
- choice()
- decode()
- CSS
- discard()
- __len__
- inplace()
- node.js
- zipfile
- Database
- shuffle()
- View
- __sub__
- 오버라이딩
- JS
- fileinput
- randrange()
- shutil
- mro()
- __annotations__
- MySqlDB
- locals()
- 파이썬
- items()
- count()
- MySQL
- remove()
- HTML
- glob
- __getitem__
- Today
- Total
목록파이썬 데이터 분석 (13)
흰둥이는 코드를 짤 때 짖어 (왈!왈!왈!왈!왈!왈!왈!왈!왈!왈!왈!)

In [ ]: import pandas as pd In [ ]: df = pd.read_csv('/content/drive/MyDrive/KDT/2. 데이터분석/소상공인시장진흥공단_상가(상권)정보_서울_202303.csv') :1: DtypeWarning: Columns (2) have mixed types. Specify dtype option on import or set low_memory=False. df = pd.read_csv('/content/drive/MyDrive/KDT/2. 데이터분석/소상공인시장진흥공단_상가(상권)정보_서울_202303.csv') In..

In [ ]: import requests import folium import json from pandas.io.json import json_normalize import warnings warnings.filterwarnings('ignore') In [ ]: targetSite = 'https://www.starbucks.co.kr/store/getSidoList.do' request = requests.post(targetSite) print(request) print(request.text) {"list":[{"seq":0,"sido_cd":"01","sido_nm":"서울","gugun_cd":null,"gugun_nm":null,"code_order":null,"view_yn":null,..

1. API(Application Programming Interface) 여러 프로그램들과 데이터베이스, 여러 기능들의 상호 통신 방법을 정하고 도와주는 매개체 2. 따릉이 API 접속하기 import requests # fetch랑 비슷 import folium import json # json 다루는 모듈 from pandas.io.json import json_normalize # json을 데이터프레임으로 변환 import warnings warnings.filterwarnings('ignore') # warning 문구 필터링 targetSite = 'https://www.bikeseoul.com/app/station/getStationRealtimeStatus.do' request = req..

In [ ]: import pandas as pd import numpy as np import matplotlib.pyplot as plt import seaborn as sns In [ ]: park = pd.read_csv('/content/drive/MyDrive/KDT/2. 데이터분석/전국도시공원표준데이터.csv', encoding='ms949') park.head() Out[ ]: 관리번호 공원명 공원구분 소재지도로명주소 소재지지번주소 위도 경도 공원면적 공원보유시설(운동시설) 공원보유시설(유희시설) 공원보유시설(편익시설) 공원보유시설(교양시설) 공원보유시설(기타시설) 지정고시일 관리기관명 전화번호 데이터기준일자 제공기관코드 제공기관명 Unnamed: ..

In [ ]: import pandas as pd import numpy as np import matplotlib.pyplot as plt import seaborn as sns # matplotlib 기반으로 만들어진 시각화 라이브러리 In [ ]: shop = pd.read_csv('/content/drive/MyDrive/KDT/2. 데이터분석/shop_201806_01.csv') In [ ]: shop Out[ ]: 상가업소번호 상호명 지점명 상권업종대분류코드 상권업종대분류명 상권업종중분류코드 상권업종중분류명 상권업종소분류코드 상권업종소분류명 표준산업분류코드 ... 건물관리번호 건물명 도로명주소 구우편번호 신우편번호 동정보 층정보 호정보 경도 위도 0 19905471 와라와라호프 N..

1. folium leaflet.js 기반으로 만들어진 라이브러리 지도위에 데이터를 표현해주는 대표적인 파이썬 지도 시각화 라이브러리 folium.document In [ ]: !pip install folium Looking in indexes: https://pypi.org/simple, https://us-python.pkg.dev/colab-wheels/public/simple/ Requirement already satisfied: folium in /usr/local/lib/python3.10/dist-packages (0.14.0) Requirement already satisfied: branca>=0.6.0 in /usr/local/lib/python3.10/dist-packages (f..

1. 워드 클라우드(Word Cloud) 핵심 단어를 시각화하는 기법 문서의 키워드, 개념등을 직관적으로 파앋할 수 있게 핵심 단어를 시각적으로 돋보이게 하는 기법 In [ ]: !pip install wordcloud Looking in indexes: https://pypi.org/simple, https://us-python.pkg.dev/colab-wheels/public/simple/ Requirement already satisfied: wordcloud in /usr/local/lib/python3.10/dist-packages (1.8.2.2) Requirement already satisfied: numpy>=1.6.1 in /usr/local/lib/python3.10/dist-pack..

1. 자연어 일상에서 사용하는 언어 컴퓨터는 자연어를 직접적으로 이해할 수 없음 -> 컴퓨터가 자연어 의미를 분석해 처리할 수 있도록 하는 일을 "자연어 처리(Natural Language Processing)"라고 부름 2. 토크나이징 문장을 의미가 있는 가장 작은 단어들로 나눔 나눠진 단어들을 이용해 의미를 분석 가장 기본이 되는 단어들을 "토큰"이라고 부름 문장 형태의 데이터를 처리하기 위해 제일 처음 수행해야 하는 기본적인 작업 토크나이징을 어떻게 하느냐에 따라 성능의 차이가 날 수 있음 3. 형태소 분석 자연어의 문장을 형태소라는 최소 단위로 분할하고 품사를 판별하는 작업 영어 형태소 분석은 형태소마다 띄어쓰기를 해서 문장을 구성하는 것이 기본(분석이 쉬운편) 아시아 계열의 언어분석은 복잡하고 ..