일 | 월 | 화 | 수 | 목 | 금 | 토 |
---|---|---|---|---|---|---|
1 | 2 | 3 | 4 | |||
5 | 6 | 7 | 8 | 9 | 10 | 11 |
12 | 13 | 14 | 15 | 16 | 17 | 18 |
19 | 20 | 21 | 22 | 23 | 24 | 25 |
26 | 27 | 28 | 29 | 30 | 31 |
- 혼공단
- 한빛미디어
- matplotlib
- 동적할당
- c++
- 구조체
- 포인터
- STR
- Axis
- seaborn
- boxplot
- df.t
- class
- 혼공학습단
- 파이썬
- 혼공파
- PYTHON
- value_counts
- const
- LOC
- numpy
- 데이터분석
- plot
- 열혈c++
- 넘파이
- 클래스
- 참조자
- expand=true
- 혼공분
- violinplot
- Today
- Total
목록데이터 분석 (8)
yEverything
02-1 API 사용하기 API(Application Programming Interface): 두 프로그램이 서로 대화하기 위한 방법을 정의한 것애플리케이션 간의 통신을 위해서는 웹 기반의 API가 널리 사용 HTTP: 인터넷에서 웹 페이지를 전송하는 기본 통신 방법데이터 분석가는 웹 기반 API를 사용하는 방법을 아는 것이 중요! HTML: 웹 브라우저가 화면에 표시할 수 있는 문서의 한 종류이자 웹 페이지를 위한 표준 언어웹 기반 API는 주로 JSON이나 XML을 많이 사용 JSON: 파이썬의 딕셔너리와 리스트를 중첩해 놓은 것과 비슷, 키와 값을 콜론으로 연결d = {"name": "혼자 공부하는 데이터 분석"}print(d['name'])JSON 형식으로 만든 파이썬 딕셔너리import jso..
1번 2번 vstack에서 ()를 빠트렸다... vstack((배열1, 배열2, ....)) 형태로 써야한다. 3번 4번 5번 정답이 조금 더 간략한 방식으로 표현할 수 있는 것 같다. 6번 7번np.zeros(shape, [dtype]) 형식으로 사용한다. 8번 9번조건은 맞게 입력 했는데 &로 조건을 잇지 않았다... &로 조건 결합 시 각 조건을 괄호로 묶는 것도 잊지 말자. 10번행의 개수를 반환 받도록 하면 되는데 size의 경우에는 매개변수 전달이 되지 않는다... shape이 튜플을 반환한다는 것을 이용해야 하는 것 같다.
넘파이(Numpy = Numerical Python): 파이썬 기반의 수치 계산 라이브러리import numpy as npnp.array([0, 1, 2])넘파이 배열의 축 1차원 배열 - axis 02차원 배열 - axis 0, axis 13차원 배열 - axis 0, axis1, axis 2 축 번호가 매겨지는 과정은 코드에서 보는 것이 이해가 더 편하다.array([0, 1, 2])array([[0, 1, 2], [3, 4, 5]]) array([[[0, 1, 2], [3, 4, 5]], [[0, 1, 2], [3, 4, 5]]])가장 바깥쪽 [ 부터 0, 1, 2 순으로 매겨진다. ndarray.dtype: 배열의 데이터 타입..
01-1 데이터 분석이란 데이터 분석: 유용한 정보를 발견하고 결론을 유추하거나, 의사 결정을 돕기 위해 데이터를 조사, 정제, 변환, 모델링하는 과정데이터 과학: 통계학 데이터 분석, 머신러닝, 데이터 마이닝 등을 아우르는 큰 개념 데이터 분석은 올바른 의사 결정을 돕기 위한 통찰을 제공하는데 초점을 맞추고,데이터 과학은 한 걸음 더 나아가 문제 해결을 위한 최선의 솔루션을 만드는 데 초점을 맞춘다. 데이터 분석가는 프로그래밍, 수학·통계, 도메인 지식( 비즈니스 문제에 대한 전문 지식)이 모두 필요 데이터 분석을 도와주는 도구란 어떤 종류의 소프트웨어를 말한다.데이터 분석에서 많이 사용하는 프로그래밍 언어는 파이썬과 R이다.데이터가 데이터베이스 형태로 있다면 SQL을 사용할 수 있다. SQL은 범용적..
%matplotlib inline import pandas as pd df = pd.read_csv('sports.csv', index_col=0) df plot을 사용하기 위해 맨 첫 줄 작성. df에 sports.csv 읽기, df 출력. sports.csv에는 위와 같은 데이터들이 들어있다. df.plot() plot메서드를 사용하면, 디폴트가 선 그래프이므로, 해당 데이터에 대해서 그래프를 그려준다. 운동별 남성과 여성의 수가 그래프로 나타나있다. df.plot(kind='bar') kind에 'bar'를 전달해주면, 막대그래프가 출력된다. 선 그래프보다 남성과 여성을 비교하는 것이 훨씬 보기 쉽다. df.plot(kind='barh') bar대신 barh라고 전달하면, 옆으로 누워있는 막대그래프..
%matplotlib inline import pandas as pd plot을 사용하려면 %matplotlib inline을 작성해야 한다. df = pd.read_csv('broadcast.csv', index_col=0) df df에 pd를 이용해서 csv 파일을 읽는다. csv파일을 이렇게 표로 정리해준다. df.plot(kind= 'line') plot을 이용해 선 그래프를 그려준다. 디폴트 값이 line이라 적지 않아도 된다. 이렇게 연도변 시청률을 선 그래프로 보여준다. df.plot(y='KBS') y에 KBS를 입력하면, KBS의 그래프만을 보여준다. df.plot(y=['KBS', 'JTBC']) 리스트 형식으로 여러 개를 전달할 수 도 있다. df[['KBS', 'JTBC']].plo..
import numpy array1 = numpy.array([2, 3, 5, 7, 11, 13, 17, 19, 23, 29, 31]) array1 numpy를 사용하기 위해 import한다. array1에 numpy를 사용해 array를 저장한다. array1을 출력한다. type(array1) array1의 타입을 알아본다. numpy.ndarray라고 나온다. numpy의 ndarray, n차원 배열이다. array1.shape array1의 shape을 출력한다. 11개가 들어있으므로 위와 같이 출력된다. array2 = numpy.array([[1, 2, 3, 4], [5, 6, 7, 8], [9, 10, 11, 12]]) array2 array2에 다른 numpy array를 저장하고 출력한..
print("Hello world!") Hello world! 출력 x = 5 print(x) y = 17 결과: 5 x에 5 저장 x 출력 y에 17 저장 print(y) 결과: 17 y = 50 print(y) 결과: 50 뒤에 y에 50을 저장한 뒤 위에 써놨던 y출력을 다시 실행하면 50으로 출력됨. # 가장 큰 제목 ## 두 번째 큰 제목 ### 세 번째 큰 제목 그냥 글쓰기 위와 같이 작성한 뒤 실행하면, 아래와 같은 출력 결과를 얻을 수 있다. **두껍게** *날려* 마찬가지이다. * list 1 * list 2 * list 3 이것도 역시. 1. 안녕 2. 녕안 3. 수고 ~~물결~~ __언더바__ _언더바하나_ 코딩 강의는 역시 [코드잇](https://www.codeit.kr)이죠! 이..