-
[pandas] : 도수분포표와 히스토그램Python 2020. 9. 23. 13:09
통계용어 알고가기
분포 : 다양한 수치로 나타나는 것 통계 : 분포의 특징이나, 반복을 이끌어내기 위한 방법 축약 : 통계에서 사용하는 방법, 데이터를 어떤 기준으로 정리정돈하여 의미 있는 정보 추출
도수분포표
계급 : 최대값부터 최소값까지 구간을 자르기 좋은 대강의 범위를 만들고, 그 범위 내에서 작은 구간들로 자른다. 그렇게 자른 범위가 계급 계급값 : 각 계급을 대표하는 수치(일반적으로 가장 가운데 값) 도수 : 각 계급의 데이터 개수 상대도수 : 각 도수가 전체에서 차지하는 비율, 각 계급의 상대도수를 모두 합하면 1이 됨 누적도수 : 첫번째 계급부터 해당 계급의 도수를 누적한 값 최종 누적도수 = 데이터의 개수
-도수분포표를 만드는 과정에서 축약이 발생한다.
-데이터의 세부적인 사항을 희생시키고, 특징을 부각시킨다.
히스토그램
-도수분포표를 바탕으로 그린 막대그래프로, 도수분포표에서 드러난 데이터의 특징을 더 명확하게 보여준다.
-좌우대칭 등 데이터가 나타내는 모습을 한눈에 알아볼 수 있다.
출처 : 세상에서 가장 쉬운 통계학 입문(고지마 히로유키)
'Python' 카테고리의 다른 글
[converter] docx 파일을 txt로 바꾸기 (0) 2021.01.14 [pandas] group으로 묶기 (0) 2020.09.24 [pandas] 구글 드라이브에서 파일 불러오기 (0) 2020.09.23 [payment. py] Python으로 만든 더치페이 프로그램 (0) 2020.09.07 [hello. py] C언어와 Python의 메모리 관리 차이점 (0) 2020.09.03