Automl은 아직 사용하지 않는 가장 중요한 도구 일 수 있습니다.

Automl은 아직 사용하지 않는 가장 중요한 도구 일 수 있습니다.

마치 학습은 강력하지만 고통이기도합니다. 파이프 라인 설정, 데이터 전처리 데이터, 모델 선택, 하이퍼 파라미터 조정 … 주택 가격을 예측하기 위해 박사 학위가 필요하다고 느낄 수 있습니다. 입력하다 자동차데이터 과학자, 개발자 및 호기심 많은 비 기술자들에게 궁극적 인 생산성이 향상됩니다.

Automl은 더 이상 유행어가 아닙니다. 기계 학습에 액세스 할 수 있고 빠르며 효율적으로 만드는 도구의 증가하는 생태계입니다. 핀 테크 스타트 업을 시작하든 더 똑똑한 인벤토리 시스템을 구축하려고하든 Automl은 원시 데이터에서 시간의 일부에 대한 예측에 이르기까지 얻는 데 도움이됩니다.


그래서, 무엇을 ~이다 정말로 Automl?

Automl (자동 기계 학습의 경우 짧음)은 정확히 들리는 것입니다. 기계 학습 워크 플로우의 무거운 리프팅을 자동화합니다. 데이터 청소부터 최상의 모델 선택에 이르기까지 Automl은 모든 것을 처리 할 수 ​​있습니다.

주요 구성 요소 :

  • 데이터 전처리: 청소, 스케일링 및 기능 엔지니어링
  • 모델 선택: 작업에 대한 올바른 알고리즘 선택
  • 하이퍼 파라미터 튜닝: 최대 성능을위한 스위트 스팟 찾기
  • 교육 및 평가: 데이터 및 테스트 모델을 자동 분할

왜 Automl이 중요한가

  • 🚀 속도: 이제 며칠이 걸리는 데 시간이 몇 시간이 걸립니다.
  • 🧠 간단: 시간 조정이 적고 더 많은 시간 생각.
  • 🔓 접근성: 많은 코드를 알지 못하는 훌륭한 모델.
  • 📊 확장 성: 실제 데이터 세트와 복잡한 문제를 빠르게 처리하십시오.

코드를 보여주세요 : 자동 스크 리크와 함께 automl

Scikit-Learn을 기반으로 한 강력한 오픈 소스 Automl 라이브러리 인 Auto-Sklearn을 사용하여 빠른 예를 들어 봅시다.

보스턴 주택 가격 예측 :

import autosklearn.regression
from sklearn.datasets import load_boston
from sklearn.model_selection import train_test_split
from sklearn.metrics import mean_squared_error

X, y = load_boston(return_X_y=True)
X_train, X_test, y_train, y_test = train_test_split(X, y, random_state=1)

model = autosklearn.regression.AutoSklearnRegressor(
    time_left_for_this_task=120,
    per_run_time_limit=30
)
model.fit(X_train, y_train)

predictions = model.predict(X_test)
mse = mean_squared_error(y_test, predictions)
print(f"MSE: {mse:.2f}")

그래, 그게 다야. 수동 모델 선택이 없습니다. 그리드 검색이 없습니다. 결과.


또 다른 모습 : 스냅의 홍채 분류

import autosklearn.classification
from sklearn.datasets import load_iris
from sklearn.model_selection import train_test_split
from sklearn.metrics import accuracy_score

X, y = load_iris(return_X_y=True)
X_train, X_test, y_train, y_test = train_test_split(X, y, test_size=0.2)

clf = autosklearn.classification.AutoSklearnClassifier(
    time_left_for_this_task=300,
    per_run_time_limit=30
)
clf.fit(X_train, y_train)

print("Accuracy:", accuracy_score(y_test, clf.predict(X_test)))

Automl은 전처리, 모델 및 미세 조정을 처리합니다. 땀을 흘리지 않고 정확한 분류기를 되 찾습니다.


Automl이 파도를 만드는 곳

  • 의료: 질병 예측, 환자 위험 모델링
  • 💸 재원: 신용 점수, 사기 탐지
  • 🍽 소매: 판매 예측, 개인화 된 마케팅
  • 📈 마케팅: 캠페인 최적화, 이탈 예측

  • 자동 스크린: 구조화 된 데이터, Pythonic 및 Open-Source에 좋습니다
  • Google Automl: 클라우드 기반, 초보자 친화적, UI 중심
  • H2O Automl: 엔터프라이즈 규모, 클라우드 및 로컬 지원
  • TPOT: 유전자 알고리즘은 ML 파이프 라인을 충족합니다

모든 마법은 아닙니다 : 일부 경고

  • 데이터는 여전히 중요합니다: 쓰레기, 쓰레기
  • automl은 컴퓨팅이 많은 것일 수 있습니다: 특히 하이퍼 파라미터 검색 중
  • 항상 최고의 모델은 아닙니다: 좋은 기준이지만 여전히 미세 조정을 원할 수도 있습니다.

최종 생각

Automl은 데이터 과학자를 대체하기 위해 여기에 있지 않습니다. 삶을 편하게하기 위해 여기 있습니다. 또한 데이터 세트가있는 사람과 머신 러닝 실험을 시작하는 목표를 열고 있습니다. 솔로 설립자이든 대규모 분석 팀의 일원이든 Automl은 무시할 수없는 트렌드입니다.

그러니 계속하십시오. 지루한 부품을 자동화하십시오. 중요한 통찰력에 집중하십시오.

출처 참조

Post Comment

당신은 놓쳤을 수도 있습니다