# naver search confirm # markdown number and equation '분류 전체보기' 카테고리의 글 목록 //google adsense
본문 바로가기

분류 전체보기78

출구조사는 왜 틀리는가? 최근 두 번의 선거(20대 대선, 22대 대선)에서 출구 조사가 화제였습니다. 이에 대해 브런치에 쓴 글입니다.  출구조사는 왜 틀리는가?통계를 잘 모르는 사람들도 표본(샘플)이라는 말은 잘 안다. 전체를 조사할 수 없으니 일부만 뽑아서 조사하기 위해 필요하다. 추출한다, 또는 뽑는다는 말이 사물에는 잘 적용된다. 예를 들어brunch.co.kr 2024. 4. 27.
상관계수의 크기에 대한 감 잡기 상관관계와 상관계수 1. 들어가며 연속형 변수 x, y의 관계는 상관관계(correlation) 분석을 통해 2가지 사실을 알 수 있다. 관계의 방향 관계의 강도 보통 관계의 방향은 그래프를 그려 확인하고, 관계의 강도는 그래프로 diseny.tistory.com 1. 들어가며 상관계수 값은 공식에 의해 -1에서 +1 사이에 있다는 것은 잘 알고 있는 사실이다. 그렇다면 실제 현장에서 어느 정도면 상관계수가 크다, 또는 작다고 말할 수 있을까? 우선 상관계수의 값과 산점도와의 관계를 유심히 살펴보는 것이 중요하다. 산점도를 보면 두 데이터(변수)가 시각적으로 어느 정도 관계가 강한지 대략 눈으로 볼 수 있기 때문이다. 위키피디아에 나오는 꽤 유용한 그림을 먼저 보자. 위의 첫번째 줄은 구체적인 상관계수에.. 2024. 4. 22.
(3)데이터의 차원과 차트의 선택 데이터 시각화와 인지 과학적 원리 데이터 시각화의 정의와 필요성 1. 왜 데이터 시각화가 필요한가? 시각화는 데이터에서 메시지를 얻거나 표현하는 과정이다. 아래 그림을 보면 왼쪽의 원본 데이터(raw data)는 정보량이 많지만 구 diseny.tistory.com 1. 데이터 타입과, 차원에 따라 차트의 형태는 제한된다. 데이터셋에 포함된 변수들의 개수(차원)와 그들의 관계에 따라 그릴 수 있는 차트의 형태는 정해져 있다. 우선 최종적인 결과물은 2차원 공간 또는 2차원 지면, 디스플레이라는 한계가 있다는 점을 분명하게 의식해야 한다. 따라서 데이터셋에서 2개의 변수까지는 하나의 축(x, y)에 매핑되고, 변수 3개를 동시에 표현해야 할 때는 디자인 요소를 넣어 차트를 그려야 한다. 2. 2개의 변수를.. 2024. 3. 15.
(2)데이터 시각화와 인지 과학적 원리 데이터 시각화의 정의와 필요성 1. 왜 데이터 시각화가 필요한가? 시각화는 데이터에서 메시지를 얻거나 표현하는 과정이다. 아래 그림을 보면 왼쪽의 원본 데이터(raw data)는 정보량이 많지만 구체적인 메시지가 없다. 반면 데 diseny.tistory.com 1. 데이터 시각화에 인지 과학이 필요한 이유 모든 사람은 동일한 시각 체계(Visual System)를 갖는다. 이런 시각 체계는 인간이 수천만 년 동안 현재가 자연환경에 맞게 진화한 시스템이다. 이런 시스템에서 특정한 방식으로 표현되는 데이터 시각화를 사람들이 더 잘 받아들이고 일부는 그렇지 못하다는 사실에 근거한다. 따라서 시각 메커니즘의 작용 방식을 잘 이해하거나, 또는 잘 준수한다면 더 훌륭한 시각화 디자인이 가능하다는 논리다. 2. 시.. 2024. 3. 15.
(1)데이터 시각화의 정의와 필요성 1. 왜 데이터 시각화가 필요한가? 시각화는 데이터에서 메시지를 얻거나 표현하는 과정이다. 아래 그림을 보면 왼쪽의 원본 데이터(raw data)는 정보량이 많지만 구체적인 메시지가 없다. 반면 데이터를 요약하고, 요약된 정보를 시각화하면 핵심 메시지가 선명해진다. 또한 시각화는 데이터에 내재하는 패턴을 지각하는데도 효과적이다. 아래와 같은 테이블 형태의 데이터는 그 자체로서 패턴을 지각하기 어렵다. 반면 이런 테이블 데이터를 시각화하면 그룹 A, B, C, D가 어떤 패턴을 갖는 데이터인지 금방 지각할 수 있다. 특히 빅데이터 분석에서는 통계적 유의성보다는 이런 패턴을 찾고, 보여주는 것이 중요하다. 2. 누구를 위해서 데이터 시각화를 하는가? 탐색적 분석(EDA)을 효과적으로 하기 위해(분석가 자신을.. 2024. 3. 14.
데이터 과학을 시작하려는 분들께 교보문고 readITcon 2022에 기고한 컬럼이다. https://event.kyobobook.co.kr/detail/203827 박사 과정에 막 들어갔을 때, 세상은 빅데이터로 떠들썩했다. 오래전부터 존재했던 데이터 앞에 ‘빅’이 붙었을 뿐인데 모든 문제를 해결해줄 것만 같은 분위기였다. 비슷한 시기에 통계학과는 무슨 차이가 있는지가 사뭇 궁금했던 데이터과학도 유행했다. 데이터과학자는 현실에 존재하지 않는 유니콘이라고도 묘사됐는데 이는 바꿔 말하면 그만큼 희소가치가 있다는 뜻이므로 초보 학습자의 순진한 열정에 불을 질러 놓기도 했다. 그러던 어느 날 딥러닝이란 것이 세상을 강타했고 짧은 기간 동안 놀랄 만큼 진화를 거듭하더니 마침내 인공지능의 새로운 이름이 돼버렸다. 지능은 분석, 과학, 학습, 추.. 2022. 11. 23.