Notice
Recent Posts
Recent Comments
Link
일 | 월 | 화 | 수 | 목 | 금 | 토 |
---|---|---|---|---|---|---|
1 | 2 | 3 | 4 | 5 | ||
6 | 7 | 8 | 9 | 10 | 11 | 12 |
13 | 14 | 15 | 16 | 17 | 18 | 19 |
20 | 21 | 22 | 23 | 24 | 25 | 26 |
27 | 28 | 29 | 30 |
Tags
- AWS builders
- NLP
- 서비스기획
- 알고리즘
- NLU
- 데이터도서
- 부트캠프후기
- 임베딩
- pytorch
- 취업부트캠프 5기
- 유데미부트캠프
- MatchSum
- sql정리
- 그로스해킹
- SLASH22
- SQL
- 스타터스부트캠프
- 유데미큐레이션
- 서비스기획부트캠프
- 딥러닝
- 특성중요도
- 취업부트캠프
- 사이드프로젝트
- 유데미코리아
- 그래프
- BERT
- 스타터스
- AARRR
- 추천시스템
- 토스
Archives
- Today
- Total
목록가설과추론 (1)
다시 이음
통계
이 포스트는 밑바닥부터 시작하는 데이터 과학 이라는 오렐리 도서와 추가적인 정보를 정리한 내용입니다. 3. 통계 3-1. 중심 경향성 중심 경향성은 데이터의 중심이 어디에 있는지를 파악하는 지표입니다. 댜부분은 데이터의 값의 합을 포인트 개수로 나눈 평균을 사용합니다. 평균은 이상치에 민감한 특성을 가집니다. 이런 부분을 피하가고자 중앙값을 사용하기도 하는데 중앙값은 데이터 전체에서 가장 중앙에 있는 데이터를 의미합니다. 을 찾기 위해서는 데이터를 정렬해야합니다. 3-2. 산포도 산포도는 데이터가 얼마나 퍼져있는지를 나타냅니다. 산포도를 측정하기 위해 max() - min()을 통해 산포도를 나타낼 수도 있고 아래와 같이 분산,표준편차를 확인할 수 있습니다. 분산(variance)은 관측값에서 평균을 뺀..
채우기/밑바닥부터 시작하는 데이터 과학
2022. 9. 12. 15:59