Certificate/data analytics-Google

1-1 Overall Concept of Data Professional

Olivia-BlackCherry 2023. 6. 28. 14:27

확률에 기반한 사고가 전 산업에 뿌리내려지고 있다. 과거에는 눈으로, 몸으로 트랜드를 느끼고 고객의 니즈를 파악하기 위해 귀를 기울이는 것이 성공비결이었다면 현재는 데이터를 통해 정확한 트랜드를 분석하고, 고객의 요구사항을 데이터로 분석하는 사업가가 성공하는 시대이다. 정확한 데이터를 통한 확률적 예측. 이것이 바로 데이터사이언티스트의 수요가 높아질 수 밖에 없는 배경이 된다. 

 

구글 데이터 분석 고급 과정은 데이터에 관한 전문적인 지식과 기술을 성장시키는데 도움이 되는 프로그램이다. 여정이 꽤 길고, 과제도 많겠지만 세계 최고의 교육을 받기 위해 또 열심히 노를 저어보자! 

 

 

All course

전체 과정은 아래와 같다. 아래의 과정을 완주하며 제대로 된 데이터분석 포트폴리오를 만들 수 있기를 기대한다. 

1. 파이썬으로 데이터 분석 코드를 작성한다. 

2. 데이터가 가지고 있는 이야기를 발견한다. 

3. 데이터를 시각화 시킨다. 

4. 통계 분석 도구를 활용한다. 

5. 머신러닝 모델을 만든다. 

6. 머신러닝을 통해 데이터를 탐색한다. 

 

 

사용 도구

이를 위해 사용할 도구는 아래와 같다.

- Python

-  jupyter notebook

- Tableau

- Storytellor(바로 나!)

 

 

배운 내용

첫 번째 모듈에서 배운 내용이다.

1) 데이터 전문가로서 가져야할 기술은 어떤 것이 있을까?

- statistics

- scientific methods

- data analysis

- AI

 

2) 데이터 사이언스의 역할은 무엇일까?

- Discipline of making data useful 

데이터가 유용하게 사용될 수 있도록 만드는 사람이라고 볼 수 있다. 데이터가 유용하다는 뜻은 해당 데이터가 현실 세계에서 영향력을 발휘하는 힘을 갖는다는 것이다.  

 

3) 데이터 과학 vs 데이터분석 

데이터 과학이 더 상위 개념이다. 컴퓨터 과학, 예측분석, 통계, 머신러닝 등의 여러 구성 요소가 있다. 

데이터 분석은 데이터 과학의 하위 분야로서, 데이터를 처리, 구성하여 현재 문제에서 인사이트를 발견하는 것이다. 예측분석과 통계 기술을 주로 사용한다. 

두 개념은 데이터를 이용해 조직을 더 나은 방향으로 성장시키는 인사이트를 발견한다는 점에서 공통의 목표가 있다. 프로젝트가 복잡해질 수록 데이터 분석가와 데이터 과학자가 팀을 이루는 것이 좋다. 

 

4) Data stewardship

데이터 스튜월드쉽은 데이터를 안전하고 적절하게 다루는 역할을 한다. 데이터의 수집, 저장, 사용, 공유에 관련한 규칙과 절차를 만들어 데이터가 제대로 보호되고 사용되는 것을 책임지는 거다.

 

5) Edge computing 

우리가 사용하는 많은 기기들이 인터넷과 연결되어 있다. 기기에서 데이터를 생산하면, 엣지 컴퓨팅은 해당 기기가 스스로 데이터를 처리하고 결과를 만들어내도록 돕는다. 보통 기기가 데이터를 생산하고 나면, 가까운 기기나 로컬 네트워크에서 처리하도록 하는데 이로써 데이터 처리의 시간이 줄고, 인터넷 대역폭을 효율적으로 사용하게 된다. 이렇게 하면 기기들은 더빠르게 응답하고 사용자에게 더 좋은 경험을 만들어 낸다.