내 북마크바에 있는 내용: 데이터 과학 에디션

내 북마크바에 있는 내용: 데이터 과학 에디션

내 북마크바에 있는 내용: 데이터 과학 에디션 내 북마크바에 있는 내용: 데이터 과학 에디션
작성자별 이미지

# 소개

데이터 과학을 따라가는 것이 항상 쉬운 것은 아닙니다. 매일 새로운 라이브러리, 논문, 데이터 세트 및 도구가 있는데 모두 기억할 수는 없습니다. 뉴스레터나 스레드를 팔로우하는 것만으로는 실제로 효과가 없다는 것을 알았습니다. 더 도움이 되는 것은 몇 가지 유용한 리소스를 준비하는 것입니다. 나에게 이는 연구, 코딩 자료, 데이터 세트, 시각화 및 빠른 참조를 모두 한 곳에 보관하는 작은 허브와 같습니다. 이것저것 시도해본 결과, 이제 나는 항상 사용하는 북마크가 10개 있습니다. 집중력을 유지하고, 시간을 절약하고, 무슨 일이 일어나고 있는지 알 수 있도록 도와줍니다. 매일 아침 나는 그것을 열었고 그것은 내 하루의 분위기를 설정했습니다. 내가 가장 많이 사용하는 북마크와 이를 유지하는 이유는 다음과 같습니다.

# 1. arXiv: 머신러닝(cs.LG) 신규 논문

arXiv 최신 머신러닝 연구를 확인하는 곳입니다. cs.LG 섹션에서는 NLP, 비전 및 RL의 이론부터 응용 기계 학습까지 모든 것을 다룹니다. 나는 그것을 즐겨찾기에 추가하고 자주 확인하여 새로운 아이디어나 프로젝트에 영감을 줄 수 있는 논문을 놓치지 않습니다. 새로운 방법이 기사나 GitHub에 게시되기 전에 앞서서 배울 수 있는 좋은 방법입니다.

# 2. GitHub 트렌드 Python 저장소

이 페이지 새로운 라이브러리부터 실험 도구까지 매주 가장 인기 있는 Python 프로젝트를 보여줍니다. 데이터 과학은 알고리즘뿐만 아니라 도구에 관한 것이기 때문에 책갈피에 추가해 둡니다. 추세를 스캔하면 유용한 라이브러리나 패턴이 너무 혼잡해지기 전에 조기에 발견하는 데 도움이 됩니다. 여기서 일주일에 10분만 투자하면 시도해 볼 가치가 있는 일 한두 가지를 얻을 수 있습니다.

# 3. 데이터는 복수형이다

데이터는 복수형이다 특이하고 흥미로운 데이터 세트로 가득한 뉴스레터이자 아카이브입니다. 프로젝트 아이디어, 튜토리얼 또는 해커톤 과제를 찾는 데 유용하기 때문에 북마크에 보관해 둡니다. 각 데이터 세트에는 간단한 설명과 링크가 있습니다. 이는 새로운 데이터를 탐색하고 Kaggle이나 일반적인 소스를 넘어서는 아이디어를 얻는 쉬운 방법입니다.

# 4. 런다운 AI

런다운 AI 최고의 AI 및 기계 학습 뉴스와 논문을 모아서 검색 시간을 절약해 줍니다. 새로운 논문이든, 도구 릴리스이든, 새로운 접근 방식이든 상관없이 관련 내용을 확인할 수 있도록 빠른 개요를 제공합니다. 기본적으로 최신 정보를 유지하고 트렌드를 따라가는 간단한 방법입니다.

# 5. RAW그래프

RAW그래프 깔끔하고 사용자 정의 가능한 차트를 빠르게 만들기 위한 무료 브라우저 기반 도구입니다. 복잡한 내용을 작성하지 않고도 CSV 또는 JSON에서 바로 시각화를 만들 수 있습니다. matplotlib 또는 씨본 암호. 추세, 이상값을 파악하거나 보고서용 차트를 만드는 데 유용합니다. 차트는 벡터 형식으로 쉽게 내보내기 때문에 슬라이드나 기사에서 전문적으로 보입니다.

# 6. Quartz 잘못된 데이터 가이드

그만큼 Quartz 잘못된 데이터 가이드 지저분한 데이터를 정리할 때마다 제가 자주 이용하는 것 중 하나입니다. 누락된 값, 잘못된 텍스트, 일관되지 않은 서식, 잘못 입력된 숫자 등 일반적인 문제를 살펴보고 이를 해결하는 방법에 대한 팁을 제공합니다. 지저분한 데이터는 작업의 일부일 뿐이므로 이 가이드를 사용하면 문제 해결에 많은 시간을 절약할 수 있습니다. 또한 누가 무엇을 수정해야 하는지에 따라 구성되어 있어 문제를 훨씬 쉽게 추적하고 해결할 수 있다는 점이 마음에 듭니다.

# 7. 5분 통계

5분 통계 필수 통계 개념과 공식에 대한 빠른 참조입니다. 가설 검정, 확률 분포, 상관 관계, 기술 통계와 같은 주제를 단 몇 분 만에 쉽게 새로 고칠 수 있습니다. 교과서를 뒤지지 않고도 계산을 확인하거나, 수업을 준비하거나, 튜토리얼을 작성할 때 적합합니다.

# 8. 놀라운 데이터 분석

놀라운 데이터 분석 데이터 워크플로우의 모든 부분에 대한 도구 및 리소스의 GitHub 모음입니다. 데이터 정리, 조작, 시각화 및 기계 학습 파이프라인 구축에 적합하기 때문에 북마크에 보관합니다. 새로운 라이브러리를 시도하거나, 도구 키트를 새로 고치거나, 동료나 학생과 공유할 때 안정적이고 잘 관리되는 도구를 빠르게 찾는 데 도움이 됩니다.

# 9. 모카루

모카루 임의의 데이터와 모의 API를 생성하는 도구입니다. 모든 것을 직접 입력하지 않고도 CSV, JSON, SQL 또는 Excel로 현실적인 데이터 세트를 빠르게 만들 수 있습니다. 까다로운 엣지 케이스를 포함하여 코드, 대시보드 또는 기계 학습 워크플로를 테스트하는 데 적합합니다. 또한 Mock API를 사용하면 프런트엔드와 백엔드에서 동시에 작업할 수 있습니다.

# 10. 신호등에서

신호등에서 기술 및 데이터 구인 목록을 위한 플랫폼입니다. 나는 이를 사용하여 새로운 채용 공고를 찾아보고, 회사를 팔로우하고, 주제, 위치 또는 원격 옵션별로 채용 정보를 필터링합니다. 또한 기회를 더 쉽게 추적할 수 있도록 CSV 또는 JSON으로 목록을 내보낼 수도 있습니다. 여러 사이트를 오갈 필요 없이 채용 시장에 대한 최신 정보를 계속 얻을 수 있는 간단한 방법입니다.

칸왈 메린 데이터 과학과 AI와 의학의 교차점에 대한 깊은 열정을 가진 기계 학습 엔지니어이자 기술 작가입니다. 그녀는 “ChatGPT를 통한 생산성 극대화”라는 전자책을 공동 집필했습니다. 2022년 APAC Google Generation Scholar로서 그녀는 다양성과 학문적 우수성을 옹호하고 있습니다. 그녀는 또한 Tech Scholar, Mitacs Globalink Research Scholar 및 Harvard WeCode Scholar에서 Teradata Diversity로 인정받았습니다. Kanwal은 STEM 분야에서 여성의 역량을 강화하기 위해 FEMCodes를 설립한 변화에 대한 열렬한 옹호자입니다.

출처 참조

Post Comment

당신은 놓쳤을 수도 있습니다