Kaggle Cli 치트 시트 – Kdnuggets


저자의 이미지
Kaggle CLI (Command Line Interface)를 사용하면 Kaggle의 데이터 세트, 경쟁, 노트북 및 터미널에서 직접 모델과 상호 작용할 수 있습니다. 웹 브라우저가 필요하지 않고 다운로드, 제출물 및 데이터 세트 관리를 자동화하는 데 유용합니다. 내 GitHub 액션 워크 플로의 대부분은 가장 빠르고 효율적인 방법이므로 데이터 세트를 다운로드하거나 푸시하는 데 Kaggle CLI를 사용합니다.
1. 설치 및 설정
Python 3.10+가 설치되어 있는지 확인하십시오. 그런 다음 터미널에서 다음 명령을 실행하여 공식 Kaggle API를 설치하십시오.
Kaggle 자격 증명을 얻으려면 “새 토큰 작성”을 클릭하여 Kaggle 계정 설정에서 Kaggle.json 파일을 다운로드하십시오.
다음으로 로컬 시스템에서 환경 변수를 설정하십시오.
- kaggle_username =
- kaggle_api_key =
- kaggle_api_key =
2. 경쟁
Kaggle 대회는 머신 러닝 문제를 해결하고 데이터를 다운로드하고 예측을 제출하고 리더 보드에서 결과를 볼 수있는 과제입니다.
CLI는 경쟁 탐색, 파일 다운로드, 솔루션 제출 등 모든 것을 자동화하는 데 도움이됩니다.
목록 경쟁
kaggle competitions list -s
검색어에 따라 선택적으로 필터링 된 Kaggle 경쟁 목록을 보여줍니다. 가입 할 새로운 도전을 발견하는 데 유용합니다.
경쟁 파일을 나열하십시오
kaggle competitions files
특정 경쟁에서 사용할 수있는 모든 파일을 표시하므로 제공되는 데이터를 알 수 있습니다.
경쟁 파일을 다운로드하십시오
kaggle competitions download [-f ] [-p ]
경쟁에서 로컬 컴퓨터로의 모든 또는 특정 파일을 다운로드합니다. -f를 사용하여 파일 -P를 지정하여 다운로드 폴더를 설정하십시오.
경쟁에 제출하십시오
kaggle competitions submit -f -m ""
제출물을 설명하는 선택적 메시지로 솔루션 파일을 경쟁에 업로드하십시오.
제출물을 나열하십시오
kaggle competitions submissions
점수 및 타임 스탬프를 포함하여 경쟁에 대한 이전의 모든 제출물을 보여줍니다.
리더 보드를보십시오
kaggle competitions leaderboard [-s]
경쟁을 위해 현재 리더 보드를 표시합니다. -S를 사용하여 상단 항목 만 표시합니다.
3. 데이터 세트
Kaggle 데이터 세트는 커뮤니티가 공유하는 데이터 모음입니다. 데이터 세트 CLI 명령은 데이터 세트를 찾고 다운로드 및 업로드하고 데이터 세트 버전을 관리하는 데 도움이됩니다.
데이터 세트를 나열하십시오
검색어로 필터링 된 Kaggle에서 데이터 세트를 찾습니다. 프로젝트 데이터를 발견하는 데 적합합니다.
데이터 세트에 파일을 나열합니다
특정 데이터 세트에 포함 된 모든 파일을 표시하므로 다운로드하기 전에 사용할 수있는 내용을 확인할 수 있습니다.
데이터 세트 파일을 다운로드하십시오
kaggle datasets download / [-f ] [--unzip]
데이터 세트에서 모든 또는 특정 파일을 다운로드합니다. -unzip을 사용하여 ZIPPER 파일을 자동으로 추출하십시오.
데이터 세트 메타 데이터 초기화
폴더에 메타 데이터 파일을 작성하여 데이터 세트 생성 또는 버전화를 준비합니다.
새 데이터 세트를 만듭니다
kaggle datasets create -p
데이터 및 메타 데이터가 포함 된 폴더에서 새 데이터 세트를 업로드합니다.
새 데이터 세트 버전을 만듭니다
kaggle datasets version -p -m ""
변경 사항을 설명하는 메시지와 함께 기존 데이터 세트의 새 버전을 업로드합니다.
4. 노트북
Kaggle 노트북은 실행 가능한 코드 스 니펫 또는 노트북입니다. CLI를 사용하면 분석 공유 또는 자동화에 유용한이 노트북의 상태를 나열, 다운로드, 업로드 및 확인할 수 있습니다.
커널을 나열하십시오
검색어와 일치하는 공개 Kaggle 노트북 (커널)을 찾습니다.
커널 코드를 얻으십시오
특정 커널의 코드를 로컬 컴퓨터에 다운로드합니다.
커널 메타 데이터를 초기화합니다
폴더에 메타 데이터 파일을 작성하여 커널 작성 또는 업데이트를 준비합니다.
커널을 업데이트하십시오
새 코드를 업로드하고 커널을 실행하여 Kaggle에서 업데이트합니다.
커널 출력을 얻으십시오
kaggle kernels output / -p
커널 실행에 의해 생성 된 출력 파일을 다운로드합니다.
커널 상태를 확인하십시오
커널의 현재 상태 (예 : 실행, 완전, 실패)를 보여줍니다.
5. 모델
Kaggle 모델은 공유, 재사용 또는 배포 할 수있는 버전의 기계 학습 모델입니다. CLI는 목록 및 다운로드에서 만들기 및 업데이트에 이르기까지 이러한 모델을 관리하는 데 도움이됩니다.
목록 모델
검색어와 일치하는 Kaggle에서 공개 모델을 찾습니다.
모델을 얻으십시오
모델과 메타 데이터를 로컬 컴퓨터에 다운로드합니다.
모델 메타 데이터 초기화
폴더에 메타 데이터 파일을 생성하여 모델 생성을 준비합니다.
새 모델을 만듭니다
로컬 폴더에서 Kaggle에 새 모델을 업로드합니다.
모델을 업데이트하십시오
기존 모델의 새 버전을 업로드합니다.
모델을 삭제하십시오
Kaggle에서 모델을 제거합니다.
6. 구성
Kaggle CLI 구성 명령은 다운로드 위치 및 기본 경쟁과 같은 기본 동작을 제어합니다. 이 설정을 조정하여 워크 플로우를 더 매끄럽게 만듭니다.
구성보기
현재 Kaggle CLI 구성 설정 (예 : 기본 경쟁, 다운로드 경로)을 표시합니다.
구성을 설정합니다
기본 경쟁 또는 다운로드 경로와 같은 구성 값을 설정합니다.
UNSET 구성
구성 값을 제거하여 기본 동작으로 되돌아갑니다.
7. 팁
- 자세한 옵션 및 사용에 대해서는 명령 후 -h 또는 -help를 사용하십시오.
- CSV 출력에는 -v를 사용하고 조용한 모드의 경우 -Q를 사용하십시오
- 다운로드하거나 경쟁에 제출하기 전에 Kaggle 웹 사이트에서 경쟁 규칙을 수락해야합니다.
Abid Ali Awan (@1abidaliawan)은 기계 학습 모델 구축을 좋아하는 공인 데이터 과학자입니다. 현재 그는 컨텐츠 제작 및 기계 학습 및 데이터 과학 기술에 대한 기술 블로그 작성에 중점을두고 있습니다. Abid는 기술 관리 석사 학위와 통신 공학 학사 학위를 취득했습니다. 그의 비전은 정신 질환으로 어려움을 겪고있는 학생들을위한 그래프 신경망을 사용하여 AI 제품을 구축하는 것입니다.
Post Comment