[스타터스 TIL]



5. 연결, 혼합

5.1 데이터 병합

우리와 함께

– 행 수준 데이터를 결합하는 데 사용

믹스

– 데이터 소스의 세분화 수준이 다른 경우 사용

→ 이 상태에서 접속하면 데이터 손실이 발생합니다.

– 데이터 소스가 다른 시스템(예: Excel, SQL 등)에 있는 경우 사용


→ 데이터 병합을 하기 ​​위해서는 메인 화면의 기존 데이터에서 병합할 데이터를 불러옵니다.


→ 박스 체인 모양은 이러한 레코드 사이에서 Tableau가 수행하는 것입니다.

가입 링크이루어졌다는 뜻입니다.

(Airline1 및 Airline2 레코드에서 지역 필드로 관련되며 연결 이유는 이름이 동일하기 때문입니다.

)

왼쪽 조인은 동일한 열 이름(Region)을 가지므로 Region이 공통 열이 되고 Airline2의 데이터는 Region 열에 따라 자동으로 분류됩니다.

다만, 기간에 대한 컬럼명(기간, 연도)이 다르기 때문에 기간이 적용되지 않으므로 Airline2의 데이터는 동일하다.


따라서 기간 관련 컬럼을 공통 컬럼으로 설정하여 기간에 따라 데이터를 변경해야 합니다.

데이터 편집 < 혼합물 관계그 안에서 바꿀 수 있다


동일한 컬럼으로 설정을 변경하면 차트가 변경된 것을 확인할 수 있습니다.

(+) 또한 열 이름을 변경하지 않고 동일하게 만드는 방법이 있습니다.


셔플링은 한 장을 기준으로 합니다.

새 시트를 열면 적용이 안되기 때문에 블렌딩을 새로 해줘야 합니다.

또한 블렌딩이 왼쪽 조인임을 알기Airline1의 데이터와 이 Airline2의 데이터를 결합하면 지역 범주가 4개뿐임을 알 수 있습니다.

(Airline2 데이터는 4개의 지역이 있기 때문에)


5.2 축이 두 개인 차트

부서별 판매 목표 및 실제 판매데이터를 볼 수 있도록 시각화해 보겠습니다.

데이터

어메이징마트EU2.xlsx
ListOfOrders + OrerBreakdown(Inner Join) & SalesTargets(2개의 시트가 결합되어 다른 시트와 혼합됨)

1) 카테고리별 월 매출 시각화


2) 카테고리별 월 목표 매출 추가

데이터의 두 범주는 연결되지만 월(주문 날짜) 열은 연결되지 않으므로 연결이 필요합니다.

→ 연도와 월만 사용하면 관계가 성립되지 않으므로 연도도 서로 연결됩니다.


목표 판매 차트를 숫자로 변경하고 시간 경과에 따른 추세를 확인하십시오.


▼ 다음과 같이 부서별 월별 목표 매출 추이를 확인할 수 있습니다.

가구 부서 – 선형적으로 증가하는 목표 금액이 있음
– 매월 증가해야 하는 특정 회전율 계수가 있습니다.

사무용품부 – 3개월마다 분기별 목표
– 분기별 목표 금액을 검토하고 이에 따라 계절 상품 및 예상 품목 등을 조정합니다.

기술 부서 – 연간 목표 금액 검토 및 설정

3) 월별 매출과 목표 매출 데이터를 결합한 2축 차트를 만들어 봅시다.

① 대상축 우클릭 > 이중축 클릭
→ 월간매출차트와 목표매출차트가 합쳐집니다.

② 오른쪽 대상 페이지에서 축 우클릭 > Axis Sync
→ 동일한 축 범위를 갖도록 두 데이터 축을 동기화합니다.

(매우 중요!
)

③ “Total(Sales)” 앞 줄에서 “Total(Target)”의 위치를 ​​변경합니다.


→ 대상 판매 차트가 판매 차트 뒤로 이동합니다.


5.3 혼합에서 계산된 필드 만들기

두 날짜의 데이터 항목을 혼합해야 하는 계산된 필드를 만드는 방법입니다.

모든 막대를 하나씩 가져와 판매가 목표 판매보다 높은지 확인할 수 있는 차트를 만들어 봅시다.


→ 부서별 실적을 빠르게 확인할 수 있습니다.

1) 데이터가 많아 복잡하므로 카테고리별 차트를 필터로 표시하도록 설정합니다.


2) 수익에서 목표 수익을 빼서 새 필드를 계산합니다.


→ 판매 우클릭 > 만들기 > 계산된 필드


3) 판매가 목표 판매보다 높거나 낮은지를 보여주는 차트 추가

→ 위에서 얻은 필드(Excess of Target)를 Rows에 추가 + Color로 드래그 + Category를 Details로 드래그


가구 부문


→ 목표 회전율에 도달하지 못한 달이 많습니다.

(가운데) 판매 목표를 재설정해야 합니다.

사무용품 부서


→ 최다 목표 매출 달성

(가운데) 분기별 검토를 통한 매출 목표 재설정

기술부


→ 연 1회 목표매출액 설정

→ 목표 달성도는 계절에 따라 달라지는 것으로 나타나 계절적 효과를 가정

(가운데) 고객 행동 패턴을 기반으로 목표 판매를 재평가해야 합니다.

B. 구매하는 사람 또는 재고 조정 방법

5.4 데이터 모델, 관계

데이터 모델(아래 데이터 사용)

Olist 브라질 공공 전자 상거래 기록

제품, 고객 및 등급 정보가 포함된 100,000건의 주문

www.kaggle.com


위의 스키마를 사용하여 다음과 같이 Tableau에서 데이터 모델을 만들 수 있습니다.


관계

– 데이터 모델은 논리적 계층과 물리적 계층으로 구분됩니다.

– 논리적 계층 수준에서 관계 생성

– 관계는 조인보다 더 유연합니다(조인은 물리적 계층 수준에서 생성됨).

– 모든 테이블은 관계로 분리(단, 필드는 관계로 연결되어 있어 직접 결합 가능)

– Tableau는 자동으로 적절한 집계 수준에서 데이터를 연결합니다.

– 무엇을 사용해야 할지 모를 때 관계를 사용하십시오.

관계와 조인의 차이점

관계는 분석을 위해 여러 테이블의 데이터를 결합하는 동적이고 유연한 방법입니다.

help.tableau.com

5.5 관계 작업(예제)

관리자가 고객으로부터 받은 총 금액을 표시하는 관리자 직위의 영업 사원에 대한 거품형 차트를 만듭니다.

① geo_seller 테이블의 위도, 경도 데이터를 열과 행에 추가

② 판매자 테이블에서 판매자 ID 데이터를 상세정보로 드래그

③ 판매자 테이블의 판매자 상태 데이터를 색상으로 드래그

④ 주문 결제 테이블에서 결제 금액 데이터를 크기로 드래그

⑤ 지도 > 배경 지도 > 거리로 설정


6. 스프레드시트, 대시보드 및 스토리텔링

6.1 매핑(지도 그리기)

1) 지리정보 설정

지도를 그리려면 지리적 정보가 포함된 데이터가 필요합니다.

(예: 위도, 경도 등)

현재 자료는 없지만 지역정보가 있으니 지리정보로 설정하시면 됩니다.


→ 지역 > 지리적 역할 > 시/도/도를 마우스 오른쪽 버튼으로 클릭합니다.

영국이 아닌 세계지도가 표시됩니다.

그래서 아래 ‘4개의 미지수’ > 위치 수정딸깍 하는 소리


그러면 아래와 같은 창이 뜨는데 국가를 영국으로 설정하면 자동으로 위치가 설정됩니다.


2) 차트 종류를 Mark에서 Auto → Map으로 변경
3) 영역을 색상으로 드래그합니다.


4) 자동 생성된 행 수 데이터를 라벨로 드래그하여 차트에 고객 수를 표시합니다.


6.2 인구통계학적 세분화

은행 고객의 성별, 직업, 연령 등을 시각화합니다.

성별 고객 비율

1) 은행 고객의 성별 수를 나타내는 원형 차트 템플릿을 만듭니다.


2) 성별의 수가 아닌 비율을 표현

레이블이 지정된 데이터(필드)를 스프레드시트로 바꾸려고 합니다.

비례적으로 변경하면 필드가 삼각형 모양(파란색 상자)으로 변경됩니다.


→ 레이블 우클릭 > 퀵 테이블 계산 > 전체 비율


연령분포

특정 연령대의 회원 수를 보는 것이 아니라 연령대별로 어떻게 분포되어 있는지 확인하고 싶습니다.

1) 세트 탱크

→ 연령 필드를 마우스 오른쪽 버튼으로 클릭 > 생성 > 구간차원


Bin 차원의 크기는 5로 설정하여 5년 단위의 연령 분포를 확인했습니다.

이렇게 생성된 연령(간격) 필드는 더 이상 수치변수가 아닌 차원으로 변경됩니다.

(→ 범주형 변수)

2) 비율로 표현

이 차트는 대시보드의 지도와 함께 작동하지만 지도에는 사람 수가 포함되어 있으므로 백분율로 표시하려고 합니다.

→ 행의 카운트 필드 우클릭 > 퀵 테이블 계산 > 총계 백분율


잔액별 분포(+ 매개변수)

1) 연령 분포도와 같은 도표를 그린다.


2) 파라미터 사용

편집하여 매번 매개변수를 설정하는 번거로움
그래서 매개변수를 빠르게 조정할 수 있는 옵션을 추가하고자 합니다.

① 파라미터 생성
좌측 데이터 화면 우클릭 > 파라미터 생성


② 워크시트에 파라미터 옵션 기능 추가
매개변수 필드(잔액 그룹)를 마우스 오른쪽 버튼으로 클릭 > 매개변수 표시

③ Balance box와 연동
필드를 마우스 오른쪽 단추로 클릭 > 그룹 편집 > 그룹 크기 편집


다음과 같이 슬라이더로 직접 간격 차원을 변경하여 차트를 확인할 수 있습니다.


직업별 클라이언트 수 및 비율(트리 차트)

원하는 데이터(필드)를 입력하고 표현방식에서 트리도를 선택


6.3 고객 세분화 대시보드

1) 시트를 대시보드에 하나씩 가져온 후 위치를 조정합니다.

2) Interactive(인터랙티브) 설정

각 시트에서 추가 옵션 > 필터로 사용을 클릭합니다.


대시보드 > 동작에서 대화형으로 만들기 옵션을 선택하여 이 작업을 수행할 수 있습니다.

3) 차트 팝업창 기능 제거

대시보드의 각 시트 클릭 > 워크시트 > 툴팁 > 표시 체크 해제


6.4 대시보드 분석

대시보드를 사용하면 특정 수준별로 데이터를 검토하고 통찰력을 얻을 수 있습니다.


포지셔닝은 홍보 및 전략화를 위해 모든 데이터로 차별화되어야 합니다.

1) 전체 대시보드(잔액, 나이)

→ 잔고 : 잔고가 낮을수록 손님이 많다

→ 연령 : 30대가 대부분(40%)


2) 지역별 분석

영국

→ 소수의 노인

→ 여성 고객이 많다

→ 사무직이 많다(아마도 유럽의 경제 중심지인 런던 때문일 것이다)


스코틀랜드

→ 대부분 40대 후반이나 50대 초반

→ 남성고객 비중이 높음

→ 높은 근로자 비율

(홍보전략) 나와 내 가족을 지키는 보험 홍보


웨일스

→ 중형 저울에 많이 사용됨 (용기 치수 변경 확인)


북아일랜드

→ 20대 후반에서 30대 초반으로 연령대가 적음

→ 여성고객 비중이 높음

→ 그 밖에도 많은 직업이 있습니다.

(홍보전략) 인생의 전환점이 될 수 있는 일에 대한 보증으로서의 보험 홍보 B. 주택 구입, 결혼 및 자녀


6.5 연혁

대시보드를 스토리로 만들어 인사이트와 스토리를 공유해 보세요.

1) 캡션의 각 스토리에 대한 통찰력 쓰기


2) 그래프의 특정 데이터에 주석 달기

→ 차트 우클릭 > 주석 추가 > 마커 2