2025 년에 AI 에이전트를 데이터 과학자로 사용하는 방법


저자의 이미지
틀 소개
데이터 과학자로서, 우리는 일에 너무 많은 모자를 쓰기 때문에 종종 여러 경력이 하나로 굴러가는 것처럼 느껴집니다. 단일 근무일에는 다음을해야합니다.
- 데이터 파이프 라인을 구축하십시오
SQL
그리고Python
- 통계를 사용하여 데이터를 분석하십시오
- 이해 관계자에게 권장 사항을 전달합니다
- 제품 성능을 지속적으로 모니터링하고 보고서를 생성하십시오
- 회사가 제품 출시 여부를 결정하는 데 도움이되는 실험을 실행하십시오.
그리고 이것은 그것의 절반에 불과합니다.
데이터 과학자가되는 것은 기술에서 가장 다재다능한 분야 중 하나이기 때문에 흥미 진진합니다. 비즈니스의 다양한 측면에 노출되어 일상 사용자에게 제품의 영향을 시각화 할 수 있습니다.
하지만 단점? 당신이 항상 캐치 업을하고있는 것 같습니다.
제품 출시가 제대로 작동하지 않으면 이유를 알아 내야하며 즉시 그렇게해야합니다. 그 동안 이해 관계자가 기능 B 대신 기능 A의 시작 기능의 영향을 이해하려면 실험을 빠르게 설계하고 이해하기 쉬운 방식으로 결과를 설명해야합니다.
설명에서는 너무 기술적 일 수는 없지만 너무 모호 할 수도 없습니다. 분석적 엄격함으로 해석 가능성을 균형 잡는 중간 근거를 찾아야합니다.
근무일이 끝날 무렵 때로는 마라톤을 달리는 것처럼 느껴집니다. 일어나서 다음날 다시 한 번 다시 할 수 있습니다. 그래서 AI로 직장의 일부를 자동화 할 수있는 기회를 얻으면 가져갑니다.
최근에 AI 에이전트를 데이터 과학 워크 플로우에 통합하기 시작했습니다.
이로 인해 직장에서 더 효율적이었고, 예전보다 훨씬 빠르게 데이터로 비즈니스 질문에 대답 할 수 있습니다.
이 기사에서는 AI 에이전트를 사용하여 데이터 과학 워크 플로의 일부를 자동화하는 방법을 정확하게 설명합니다. 구체적으로, 우리는 다음을 탐구 할 것입니다.
- AI없이 일반적으로 데이터 과학 워크 플로우를 수행하는 방법
- AI로 워크 플로를 자동화하기 위해 취한 단계
- 내가 사용하는 정확한 도구와 이것이 얼마나 많은 시간을 절약했는지
그러나 우리가 그것에 들어가기 전에, AI 요원이 정확히 무엇인지, 그리고 왜 그들 주위에 과대 광고가 있는지 다시 방문합시다.
틀 AI 요원은 무엇입니까?
AI 에이전트는 문제를 통해 계획하고 추론하여 자동으로 작업을 수행 할 수있는 LLM (Lange Language Model)이 강화 된 시스템입니다. 사용자의 명시 적 방향없이 고급 워크 플로를 자동화하는 데 사용할 수 있습니다.
이는 단일 명령을 실행하는 것처럼 보일 수 있으며 LLM이 엔드 투 엔드 워크 플로우를 실행하는 동시에 결정을 내리고 프로세스 전반에 걸쳐 접근 방식을 조정하는 것처럼 보일 수 있습니다. 이 시간을 사용하여 각 단계를 개입하거나 모니터링 할 필요없이 다른 작업에 집중할 수 있습니다.
틀 AI 에이전트를 사용하여 데이터 과학 실험을 자동화하는 방법
실험은 데이터 과학 작업의 큰 부분입니다.
Spotify, Google 및 Meta와 같은 회사는 항상 새로운 제품을 발표하기 전에 실험을합니다.
- 신제품이 높은 투자 수익률을 제공 할 것인지 여부는 투자 수익률을 높이고 자원을 구축하는 데 할당 된 자원의 가치가 있는지 여부
- 제품이 플랫폼에 장기적인 긍정적 영향을 미치는 경우
- 이 제품에 대한 사용자 정서
데이터 과학자들은 일반적으로 새로운 기능 또는 제품 출시의 효과를 결정하기 위해 A/B 테스트를 수행합니다. 데이터 과학의 A/B 테스트에 대한 자세한 내용은 A/B 테스트에 대한이 안내서를 읽을 수 있습니다.
회사는 일주일에 최대 100 개의 실험을 실행할 수 있습니다. 실험 설계 및 분석은 반복적 인 프로세스가 될 수 있으므로 AI 에이전트를 사용하여 자동화하려고했습니다.
다음은 일반적으로 실험 결과를 분석하는 방법, 3 일에서 일주일이 걸리는 프로세스입니다.
- 시스템에서 흐르는 A/B 테스트 데이터를 추출하기위한 SQL 파이프 라인 구축
- 이 파이프 라인을 쿼리하고 탐색 데이터 분석 (EDA)을 수행하여 사용할 통계 테스트 유형을 결정하십시오.
- 통계 테스트를 실행 하고이 데이터를 시각화하려면 파이썬 코드를 작성하십시오.
- 권장 사항을 생성하십시오 (예 :이 기능을 사용자의 100%로 출시하십시오)
- 이 데이터는 Excel 시트, 문서 또는 슬라이드 데크 형태로 제시하고 이해 관계자에게 결과를 설명합니다.
실험 결과가 항상 간단한 것은 아니기 때문에 2 단계와 3 단계는 가장 시간이 많이 걸립니다.
예를 들어, 비디오 광고 또는 이미지 광고를 출시할지 여부를 결정할 때 모순 된 결과를 얻을 수 있습니다. 이미지 광고는 더 즉각적인 구매를 생성하여 단기 수익이 높아질 수 있습니다. 그러나 비디오 광고는 사용자 유지 및 충성도가 향상 될 수 있으므로 고객이 더 많은 반복 구매를합니다. 이로 인해 장기 수입이 높아집니다.
이 경우 이미지 또는 비디오 광고를 시작할지 여부를 결정하기 위해 더 많은 지원 데이터 포인트를 수집해야합니다. 다른 통계 기술을 사용하고 일부 시뮬레이션을 수행하여 비즈니스 목표와 가장 잘 맞는 접근 방식을 확인해야 할 수도 있습니다.
이 프로세스가 AI 에이전트로 자동화되면 많은 수동 개입이 제거됩니다. 우리는 AI가 데이터를 수집하고 우리를 위해이 깊은 다이빙 분석을 수행 할 수 있습니다.
AI 에이전트를 사용한 자동화 된 A/B 테스트 분석은 다음과 같습니다.
- 나는 사용한다 커서코드베이스에 액세스하고 코드를 자동으로 쓰고 편집 할 수있는 AI 편집기.
- MCP (Model Context Protocol)를 사용하여 Cursor
- 그런 다음 Cursor는 실험 데이터를 처리하기 위해 파이프 라인을 자동으로 빌드하고 데이터 레이크에 다시 액세스하여 다른 관련 데이터 테이블과이를 연결합니다.
- 필요한 모든 파이프 라인을 작성한 후이 테이블에서 EDA를 수행하고 A/B 테스트 결과를 분석하는 데 사용하는 최상의 통계 기술을 자동으로 결정합니다.
- 선택한 통계 테스트를 실행하고 출력을 분석하여 비즈니스 이해 관계자에게 제시 할 수있는 형식으로 출력의 포괄적 인 HTML 보고서를 자동으로 생성합니다.
위는 AI 에이전트가있는 엔드 투 엔드 실험 자동화 프레임 워크입니다.
물론이 프로세스가 완료되면 분석 결과를 검토하고 AI 에이전트가 수행 한 단계를 살펴 봅니다. 이 워크 플로가 항상 완벽하지는 않다는 것을 인정해야합니다. AI는 환각을하며 자체 워크 플로를 만들기 전에 많은 프롬프트와 사전 분석의 예가 필요합니다. “쓰레기, 쓰레기 아웃”원칙은 여기에 확실히 적용되며, Cursor 가이 분석을 실행하는 데 필요한 모든 관련 정보가 있는지 확인하기 위해 예제를 큐 레이트하고 프롬프트 파일을 구축하는 데 거의 일주일을 보냈습니다.
자동화 된 프레임 워크가 예상대로 수행되기 전에 많은 앞뒤와 여러 반복이있었습니다.
그러나이 AI 에이전트가 작동하므로 A/B 테스트 결과를 분석하는 데 소요되는 시간을 크게 줄일 수 있습니다. AI 에이전트 가이 워크 플로우를 수행하는 동안 다른 작업에 집중할 수 있습니다.
이것은 내 플레이트에서 작업을 취하여 약간 덜 바쁜 데이터 과학자가되었습니다. 또한 이해 관계자에게 결과를 빠르게 제시 할 수 있으며, 전환 시간이 짧아 전체 제품 팀이 더 빠른 결정을 내릴 수 있습니다.
틀 데이터 과학을 위해 AI 에이전트를 배워야하는 이유
내가 아는 모든 데이터 전문가는 AI를 어떤 식 으로든 워크 플로에 통합했습니다. 조직에서 더 빠른 비즈니스 결정을 내리고 제품을 더 빨리 시작하며 경쟁을 앞당기는 것이 하향식 추진력이 있습니다. AI 채택은 데이터 과학자들이 관련성을 유지 하고이 구직 시장에서 경쟁력을 유지하는 데 중요하다고 생각합니다.
그리고 내 경험상, 직무의 일부를 자동화하기 위해 에이전트 워크 플로우를 만들려면 업 스킬이 필요합니다. MCP 구성과 같은 새로운 도구와 기술을 배워야했습니다. chatgpt) 및 워크 플로 오케스트레이션. 초기 학습 곡선은 작업의 일부를 자동화하면 시간을 절약하기 때문에 그만한 가치가 있습니다.
데이터 과학자이거나 야심 찬 사람이라면 경력 초기에 AI 지원 워크 플로우를 구축하는 방법을 배우는 것이 좋습니다. 이것은 단순히 좋은 것이 아니라 산업 기대치가되며 가까운 미래의 데이터 역할을 위해 자신을 배치하기 시작해야합니다.
시작하려면이 비디오를 통해 에이전트 AI를 무료로 배우는 방법에 대한 단계별 가이드를 보려면이 비디오를 볼 수 있습니다.
Natassha Selvaraj 글쓰기에 대한 열정을 가진 자립 데이터 과학자입니다. Natassha는 모든 데이터 주제의 진정한 마스터 인 Data Science 관련 Everything에 글을 씁니다. LinkedIn에서 그녀와 연결하거나 YouTube 채널을 확인할 수 있습니다.
Post Comment