본문 바로가기

데이터 분석13

1장 연습문제 1번 2번 vstack에서 ()를 빠트렸다... vstack((배열1, 배열2, ....)) 형태로 써야한다. 3번 4번 5번 정답이 조금 더 간략한 방식으로 표현할 수 있는 것 같다. 6번 7번np.zeros(shape, [dtype]) 형식으로 사용한다. 8번 9번조건은 맞게 입력 했는데 &로 조건을 잇지 않았다... &로 조건 결합 시 각 조건을 괄호로 묶는 것도 잊지 말자. 10번행의 개수를 반환 받도록 하면 되는데 size의 경우에는 매개변수 전달이 되지 않는다... shape이 튜플을 반환한다는 것을 이용해야 하는 것 같다. 2025. 1. 13.
01장 수치 계산 라이브러리, 넘파이 넘파이(Numpy = Numerical Python): 파이썬 기반의 수치 계산 라이브러리import numpy as npnp.array([0, 1, 2])넘파이 배열의 축  1차원 배열 - axis 02차원 배열 - axis 0, axis 13차원 배열 - axis 0, axis1, axis 2 축 번호가 매겨지는 과정은 코드에서 보는 것이 이해가 더 편하다.array([0, 1, 2])array([[0, 1, 2], [3, 4, 5]]) array([[[0, 1, 2], [3, 4, 5]], [[0, 1, 2], [3, 4, 5]]])가장 바깥쪽 [ 부터 0, 1, 2 순으로 매겨진다. ndarray.dtype: 배열의 데이터 타입.. 2025. 1. 13.
[혼공분석] 1주차_데이터 분석을 시작하며 01-1 데이터 분석이란 데이터 분석: 유용한 정보를 발견하고 결론을 유추하거나, 의사 결정을 돕기 위해 데이터를 조사, 정제, 변환, 모델링하는 과정데이터 과학: 통계학 데이터 분석, 머신러닝, 데이터 마이닝 등을 아우르는 큰 개념 데이터 분석은 올바른 의사 결정을 돕기 위한 통찰을 제공하는데 초점을 맞추고,데이터 과학은 한 걸음 더 나아가 문제 해결을 위한 최선의 솔루션을 만드는 데 초점을 맞춘다. 데이터 분석가는 프로그래밍, 수학·통계, 도메인 지식( 비즈니스 문제에 대한 전문 지식)이 모두 필요 데이터 분석을 도와주는 도구란 어떤 종류의 소프트웨어를 말한다.데이터 분석에서 많이 사용하는 프로그래밍 언어는 파이썬과 R이다.데이터가 데이터베이스 형태로 있다면 SQL을 사용할 수 있다. SQL은 범용적.. 2025. 1. 7.
막대 그래프 %matplotlib inline import pandas as pd df = pd.read_csv('sports.csv', index_col=0) df plot을 사용하기 위해 맨 첫 줄 작성. df에 sports.csv 읽기, df 출력. sports.csv에는 위와 같은 데이터들이 들어있다. df.plot() plot메서드를 사용하면, 디폴트가 선 그래프이므로, 해당 데이터에 대해서 그래프를 그려준다. 운동별 남성과 여성의 수가 그래프로 나타나있다. df.plot(kind='bar') kind에 'bar'를 전달해주면, 막대그래프가 출력된다. 선 그래프보다 남성과 여성을 비교하는 것이 훨씬 보기 쉽다. df.plot(kind='barh') bar대신 barh라고 전달하면, 옆으로 누워있는 막대그래프.. 2024. 4. 21.
선 그래프 %matplotlib inline import pandas as pd plot을 사용하려면 %matplotlib inline을 작성해야 한다. df = pd.read_csv('broadcast.csv', index_col=0) df df에 pd를 이용해서 csv 파일을 읽는다. csv파일을 이렇게 표로 정리해준다. df.plot(kind= 'line') plot을 이용해 선 그래프를 그려준다. 디폴트 값이 line이라 적지 않아도 된다. 이렇게 연도변 시청률을 선 그래프로 보여준다. df.plot(y='KBS') y에 KBS를 입력하면, KBS의 그래프만을 보여준다. df.plot(y=['KBS', 'JTBC']) 리스트 형식으로 여러 개를 전달할 수 도 있다. df[['KBS', 'JTBC']].plo.. 2024. 4. 21.
Numpy import numpy array1 = numpy.array([2, 3, 5, 7, 11, 13, 17, 19, 23, 29, 31]) array1 numpy를 사용하기 위해 import한다. array1에 numpy를 사용해 array를 저장한다. array1을 출력한다. type(array1)​ array1의 타입을 알아본다. numpy.ndarray라고 나온다. numpy의 ndarray, n차원 배열이다. array1.shape array1의 shape을 출력한다. 11개가 들어있으므로 위와 같이 출력된다. array2 = numpy.array([[1, 2, 3, 4], [5, 6, 7, 8], [9, 10, 11, 12]]) array2 array2에 다른 numpy array를 저장하고 출력한.. 2024. 4. 21.