python2 [Python] scatter-matrix - 산점도와 히스토그램을 한 번에 데이터 프레임 상에서 열(feature)들의 상관관계에 대한 시각화를 할 때 heatmap을 많이 써왔는데, 항상 같은 열들이 매칭되는 대각선이 낭비된다고 생각했었습니다. 그런데 파이썬 판다스 패키지에는 scatter-matrix라는 함수가 있습니다. 대각선 외의 행렬에는 상관관계의 산점도를, 대각선 행렬에는 수치형 특성의 히스토그램을 출력해줍니다. feature 간의 관계와 feature의 분포를 동시에 시각적으로 파악하는데 상당히 효율적인 함수라는 생각이 들었습니다. corr()함수를 적용시킨 뒤 heatmap으로 시각화하는 과정 데이터는 캘리포니아 주택가격 데이터를 사용하였습니다. 상관관계 도출 후 시각화하는 두 번의 과정을 거칩니다.(물론 corr()함수를 heatmap()내에 넣을 수 있습니다... 2021. 8. 5. [Python][Pandas] 함수 매핑 함수 매핑이란? - 시리즈 또는 데이터프레임의 개별 원소를 특정 함수에 일대일 대응시키는 과정을 뜻한다. - 사용자 지정함수, 무명함수 등을 적용할 수 있기 때문에 판다스 기본 함수로 처리하기 어려운 복잡한 연산을 판다스 객체에 적용하는 것이 가능하다. 쓰이는 함수 - apply(), applymap(), pipe() 목차 1. 객체의 개별원소에 함수 매핑 2. 시리즈 객체에 함수 매핑 3. 데이터프레임 객체에 함수 매핑 1. 객체의 개별원소에 함수 매핑 (1) 시리즈 객체의 원소에 함수 매핑 본 글에서는 데이터프레임을 열을 가져와 함수를 매핑한다. - 기본 형식 - 적용 우선 seaborn 라이브러리의 titanic 데이터 셋을 가져와 데이터프레임을 만든다. 인자에 +10을 해주는 add라는 함수를 생.. 2021. 5. 1. 이전 1 다음