Excel에서 Python까지 : 7 단계 분석가는 오늘날 취할 수 있습니다.

Excel에서 Python까지 : 7 단계 분석가는 오늘날 취할 수 있습니다.

Excel에서 Python으로의 전환Excel에서 Python으로의 전환
저자의 이미지 | 캔버

소개

Excel에서 데이터 분석가 경력을 시작하면 손을 올리십시오. 네, 나도. Excel은 데이터 분석 및 시각화를위한 강력한 도구이며 알고 있습니다. 다른 기사에 대한 Excel 농담을 유지합시다. 그러나 더 큰 데이터 세트를 처리하는 것이 개선 되었음에도 불구하고 Excel이 부하에서 삐걱 거리는 지점이 있습니다.

이 시점에서, 당신은“아, 나사 엑셀, 나는 파이썬을 배웠어야한다고 생각할 것입니다.” 당신은 여전히 ​​할 수 있습니다. (파이썬을 배우고 나사 엑셀이 아닌 배우십시오.) Python을 이러한 단계에 반영된 기술의 자연스러운 확장으로 생각하십시오.

Excel에서 Python으로의 전환Excel에서 Python으로의 전환

1 단계 : Excel 기술을 파이썬 등가에 매핑합니다

일부 Excel 기술은 프로그래밍 언어이지만 Python으로 전송할 수 있습니다. 많은 기능이 두 도구 사이에 맵핑되기 때문에 “그리드가없는 Excel”이라고 생각할 수 있습니다. 다음은 몇 가지 예입니다.

Excel에서 Python으로의 전환Excel에서 Python으로의 전환

여전히 Python의 구문 및 언어 기초를 배워야하지만 처음부터 시작하지는 않습니다. 이미 작업의 분석 부분을 이해하고 있습니다. 이제 그것은 당신이 이미 Excel에서하는 일을 파이썬으로하는 것에 관한 것입니다.

2 단계 : 파이썬 기초를 배우십시오

코딩을 시작하기 전에 언어 기초에 익숙해 지십시오. 시작하는 것이 좋습니다.

  • 기본 구문
  • 변수, 데이터 유형, 루프, 조건부
  • 목록 및 사전 (명명 된 범위 또는 조회 테이블과 유사합니다)
  • 코드 재사용 기능 (Excel의 재사용 가능한 공식과 같습니다)

시작할 수있는 몇 가지 리소스는 다음과 같습니다.

3 단계 : 환경을 설정하십시오

복잡한 파이썬 환경이 필요하지 않습니다. 로컬로 가려면 Anaconda를 설치하십시오. Python과 처음에는 필요한 주요 라이브러리 (Pandas, Numpy 및 Matplotlib)와 함께 제공됩니다. 또한 Jupyter 노트북도 포함됩니다. 코드와 텍스트 노트를 작성하는 통합 문서로 생각하십시오.

더 쉽게 만들 수 있습니다. Google 계정이있는 경우 Colab을 사용할 수 있습니다. Google 버전의 Jupyter Notebook 버전이며 Anaconda보다 더 많은 라이브러리가 설치되어 있습니다.

4 단계 : 팬더로 시작하십시오

Python은 생태계로 유명하며 기능을 확장하는 라이브러리가 풍부합니다. 그중 하나는 데이터 분석 및 조작을 위해 설계된 라이브러리 인 Pandas입니다. 데이터 분석에서 일반적으로 일반적으로 파이썬 자체와는 별다른 분리 할 수 ​​없습니다. 파이썬을 배우기 시작하면 팬더도 배웁니다. 당신이 연습해야 할 몇 가지 사항은 다음과 같습니다.

  • Excel 또는 CSV 파일에서 데이터 프레임 생성
  • 필터링, 정렬, 병합, 집계
  • Excel 워크 플로 복제 : 피벗 테이블, 조회, 조건부 계산

일반적으로 Excel에서 수행하는 모든 것을 Python 코드로 번역하십시오.

팬더가 끝나면 팬더를 뒷받침하는 수치 컴퓨팅을위한 라이브러리 인 Numpy를 사용하십시오.

5 단계 : 실제 데이터에 대한 연습

배우는 가장 빠른 방법은하는 것입니다. 몇 가지 옵션이 있습니다. Stratascratch 및 leetcode에 대한 분석 질문을 해결하고 실제 인터뷰 질문에 대해 연습 할 수 있습니다. 데이터와 문제를 해결할 수 있습니다. 당신이해야 할 일은 솔루션을 파이썬으로 작성하기 만하면됩니다.

또 다른 옵션은 사용 가능한 데이터 세트를 사용하고 생각하는 문제를 해결하는 것입니다. 일부 훌륭한 데이터 세트 소스는 Kaggle 데이터 세트, Data.gov 및 멋진 공개 데이터 세트입니다.

해결해야 할 문제에 대한 제안이 필요한 경우 다음부터 시작하십시오.

  • 데이터 청소 (복제 제거, 표준화 날짜, 결 측값 작성)
  • 일반적으로 Excel에서하는 간단한 보고서를 구축합니다

6 단계 : 데이터 시각화를 시작합니다

다음 단계는 분석을 시각화하는 것입니다. 좋은 시작은 이미 탁월한 차트를 파이썬으로 재현하는 것입니다. 가장 인기있는 두 가지 데이터 시각화 파이썬 라이브러리는 다음과 같습니다.

  • matplotlib – 기본 플롯 용 (라인, 바, 산란)
  • Seaborn – 최소한의 코드로 고급 시각화

7 단계 : Excel과 Python을 결합하십시오

당신은 엑셀을 버릴 필요가 없습니다. 원한다고해도 주변의 대부분의 이해 관계자가 탁월하게 결혼하기 때문에 할 수 없었습니다.

이상적인 조합은 OpenPyXl 또는 Xlwings를 사용하여 Python의 Excel 파일에 다시 작성하는 것입니다. 다시 말해, Python은 백그라운드에서 무거운 리프팅을 수행하지만 최종 출력은 이해 관계자를 위해 Excel에 착륙합니다. 거기서 멈출 필요가 없습니다. 현재 Microsoft는 Excel에서 AI를 사용할 수있는 새로운 Copilot () 함수를 테스트하고 있습니다.

결론

보시다시피, Excel에서 Python으로 전환한다고해서 0부터 시작하는 것은 아닙니다. Excel에서 데이터 분석을 수행하는 경우 이미 기본 지식이 있음을 의미합니다. 데이터 분석을 알고 있습니다. 유일한 것은 그 지식을 프로그래밍 언어로 전송하여 기술적으로 더 정교하게 만드는 것입니다.

이 기사의 단계를 따르면 전환이 생각보다 부드럽습니다.

네이트 로시디 데이터 과학자이자 제품 전략입니다. 그는 또한 겸임 교수 교육 분석이며, 데이터 과학자들이 최고 회사의 실제 인터뷰 질문과의 인터뷰를 준비하는 플랫폼 인 Stratascratch의 창립자입니다. Nate는 커리어 시장의 최신 트렌드에 대해 글을 쓰고, 인터뷰 조언을 제공하고, 데이터 과학 프로젝트를 공유하며, 모든 SQL을 다룹니다.

출처 참조

Post Comment

당신은 놓쳤을 수도 있습니다