데이터 및 엑셀 파워 쿼리 (2/2) - Sesac

 데이터 활용

  • 어떤 데이터를 봐야 하는가?

  • 상황파악(목적) -> 데이터정의 -> 분석기법/역량 
    (목적 설정이 선행되어야 한다.)

분석 목적 세분화

  • Issue Tree (마인드맵)

    • 구조화 한다. 관련성 있는 것들을 묶는다.

    • 1~3 단계가 보통, 레벨링 관리 필요

    • MECE
      • 빠진 부분이 있는지 확인

    • 우선이슈 선별
      • 분석할 필요가 없는 영역은 생략
      • 수집이 가능한 데이터

    • 가설 설정
      • 모든 대안 -> 가설 설정 -> 의사결정

    • 답을 찾는 것이 아니라, 의사결정의 효율성이 중요하다.

어떤 데이터

  • 추상적인 데이터를 수치화 해야 한다.

  • 취준생은 우울하다. 얼마나 우울할까?
    ex) 우울한 사람 중에 취준생을 찾는 게 편할까?
         취준생 중에서 우울한 사람을 찾는 게 편할까?
    ex) 취준생 -> 온라인에서 활동하는 취준생 -> 우울감을 호소하는 취준생
    ex) 우울감을 호소하는 취준생의 키워드는? 'ㅠㅠ'
    ex) 'ㅠㅠ' 키워드 언급량으로 변동성을 찾는다.

  • 나만의 논리와 인사이트로 기준을 만들 수 있다.

  • 도시별 발전 정도 차이?
    ex) 정량적 공공자료.
    ex) 버거지수 = (버거킹+맥도날드+KFC)/롯데리아


도메인 지식

  • 데이터 값이 '코드'일 경우, 코드의 의미를 알아야 한다.

  • 수치를 해석하는 데 전문적인 지식이 필요한 경우 (의학수치)

데이터 활용 관점의 변화

  • 탑다운 방식으로 변화

    • 비지니스 -> 서비스 -> 데이터

    • 참고_바텀업 ( 데이터 -> 서비스 -> 비지니스 )



API - Excel BI

  • 외부에서 우리 데이터를 쓸 수 있도록 안테나를 만들어 줌

  • API 신청을 먼저 한다.


  • XML 주소를 가져와서 파워쿼리로 가져온다.
       
    미리보기


  • 2번에 걸쳐서 가져올 때, 첫번째 정보에서 두번째 정보를 열 수 있는 KEY값을 입력한다.






엑셀 - 데이터 분석

  • 기술통계법

    • 평균/중간값/최소값/최대값 을 표로 정리해 준다.

  • 히스토그램

    • 자동으로 계급(구간)을 설정해 도표와 차트로 출력해 준다.
      ( 주의: 영역을 지정할 때, 열 단위로 하지 말것 ) 



  • 스케일링

    • 각 변수들의 범위 혹은 분포를 같게 만드는 작업
    • 중심에서 멀어진 정도를 %로 나타낸다.


  • 박스플롯 차트 (상자수염)

    • 영역 - 삽입 - 모든 차트 - 상자 수염


  • 슬라이서

    • 필터를 클릭으로 할 수 있는 인터페이스

다음 이전