다중 에이전트 시스템으로 전자 상거래 설명을 자동화합니다

MAS (Multiagent System)는 개인 및 집단 목표를 달성하기 위해 상호 작용하고 협력하는 여러 지능형 에이전트로 구성된 분산 시스템입니다. 소프트웨어 프로그램, 로봇 또는 인간 일 수있는이 에이전트는 자율적으로 작동하지만 단일 에이전트가 어려움을 겪을 수있는 복잡한 문제를 해결하기 위해 의사 소통 및 조정에 참여합니다. MAS의 주요 특성에는 자율성, 분산 제어 및 동적 환경에 적응하는 능력이 포함되어 있으며 다양한 산업 분야의 광범위한 응용 분야에 적합합니다. 전자 상거래 웹 사이트에서 목록을 자동으로 표시하기 위해 이미지 설명 생성 측면에서, 품목의 이미지를 입력하고 고객이 구매하도록 제작 된 설명을 생성 할 수있는 멀티 에이전트 시스템을 배포 할 수 있습니다.

학습 목표

이미지 분석 기능을 사용하여 복잡한 작업을 자동화 할 때 MAS (Multiagent Systems)의 역할을 이해하십시오.
이미지 처리 기능을 갖춘 다중 에이전트 AI 시스템을 생성하기위한 Crewai 및 그 기능을 탐색하십시오.
이미지에서 제품 설명을 자동으로 생성하여 에이전트 AI가 전자 상거래를 향상시키는 방법을 알아보십시오.
자동화 된 전자 상거래 목록 생성을 위해 CrewAI를 사용하여 실습 파이썬 기반 다중 에이전트 시스템을 구현하십시오.
의료, 제조 및 소매와 같은 산업에서 AI 구동 이미지 분석의 실제 응용 프로그램을 분석하십시오.

이 기사는의 일부로 출판되었습니다 데이터 과학 블로그.

에이전트 AI의 이미지 분석 기능

이미지 분석 기능이 장착 된 에이전트 AI 시스템은 몇 가지 중요한 기능을 수행 할 수 있습니다.

실시간 분석 : 이 시스템은 실시간으로 방대한 양의 시각적 데이터를 분석하여 의료, 제조 및 소매와 같은 다양한 부문에서 운영 효율성을 향상시킬 수 있습니다.
향상된 정확도 : 인식 속도가 95%를 초과하면 에이전트 AI는 이미지 인식 작업에서 오 탐지를 크게 줄여서보다 신뢰할 수있는 결과를 초래할 수 있습니다.
자동화 된 의사 결정 : 이미지 분석을 워크 플로에 통합함으로써 이러한 시스템은 의료 진단 또는 인간의 개입없이 감시와 같은 복잡한 작업을 자동화 할 수 있습니다.

이미지 분석에서 에이전트 AI의 응용

이미지 분석 기능이있는 에이전트 AI 시스템은 수많은 필드를 변환하고 있습니다.

의료: 의료 진단에서, 그들은 영상 데이터 평가, 패턴 감지 및 역사적 사례를 기반으로 진단을 제안하는 데 도움이됩니다.
조작:이 시스템은 시각 데이터 분석을 통해 장비를 지속적으로 모니터링하여 예측 유지 보수 및 품질 관리를 추진합니다.
소매: 이미지를 효율적으로 분류하고 인덱싱하여 시각적 검색 기능 및 인벤토리 관리를 향상시킵니다.
전자 상거래 목록. 해당 에이전트 AI 시스템을 사용하여 이미지에서 항목에 대한 설명을 생성하는 것은 엔드에서 엔드로 자동화 될 수 있습니다.

다중 에이전트 이미지 분석을위한 승무원 AI

Crewai는 2023 년에 설립되었으며 브라질 상파울루에 본사를 둔 혁신적인 플랫폼으로 인공 지능 응용 프로그램을위한 다중 에이전트 시스템 개발을 전문으로합니다. 이 플랫폼을 통해 기업은 “승무원”이라고하는 자율 AI 에이전트 팀을 생성, 배포 및 관리 할 수 있으며, 이는 특정 역할과 전문 지식을 활용하여 복잡한 작업을 수행하기 위해 협력하는 “승무원”이라고합니다.

Crewai의 주요 특징

다중 에이전트 오케스트레이션 : Crewai는 사용자가 여러 작업 별 AI 에이전트를 통신, 작업을 위임하고 워크 플로우를 자동화하여 다양한 산업 분야의 운영 효율성 향상을 수행 할 수 있습니다.
역할 전문화: 승무원 내의 각 에이전트는 전통적인 조직에서 부서의 기능과 유사하게 역할과 책임을 정의했습니다. 이 구조는 원활한 협업 및 효과적인 작업 실행을 용이하게합니다
오픈 소스 프레임 워크 : 2023 년 후반에 오픈 소스 프로젝트로 출시 된 Crewai
엔터프라이즈 클라우드 오퍼링 : 최근 Crewai는 복잡한 AI 워크로드 및 다중 에이전트 시스템을 관리하기위한 중앙 집중식 플랫폼 역할을하는 엔터프라이즈 클라우드 솔루션을 도입했습니다. 이 오퍼링은 팀이 간단하고 복잡한 워크 플로를 자동화 할 수있는 클라우드 공수 응용 프로그램을 구축 할 수 있습니다.

이미지 분석 기능이있는 승무원 AI

Crewai의 비전 도구는 AI 에이전트의 기능을 향상시켜 이미지에서 텍스트를 추출 할 수 있도록 설계된 특수 기능입니다. 이 도구는 에이전트의 기능을 크게 확장하여 시각 정보를 처리하고 워크 플로에 통합 할 수 있습니다.

비전 도구의 주요 기능은 이미지에서 텍스트를 추출하는 것입니다. 사용자는 이미지에 대한 URL 또는 파일 경로를 제공 할 수 있으며,이 대리인은 텍스트 데이터를 검색하기 위해 분석합니다. Vision Tool을 Crewai 내의 AI 에이전트에 쉽게 통합 할 수 있습니다. 예를 들어, 비전 도구를 사용하도록 에이전트를 구성하면 시각적 컨텐츠에서 텍스트를 읽고 해석 해야하는 작업을 자동으로 처리합니다.

비전 도구는 다음을 포함한 다양한 시나리오에서 적용 할 수 있습니다.

문서 처리 : 스캔 된 문서 나 텍스트가 포함 된 이미지에서 정보 추출을 자동화합니다.
데이터 입력 자동화 : 송장이나 영수증에서 관련 정보를 추출하여 수동 데이터 입력을 줄입니다.
컨텐츠 생성 : 추가 분석 또는보고를 위해 이미지에서 텍스트를 가져와 컨텐츠 생성을 지원합니다.

자동화 된 전자 상거래 설명을위한 다중 에이전트 시스템

다음 튜토리얼에서는 여러 AI 에이전트가 공동 작업하여 제품 이미지를 분석하고 설명 콘텐츠를 생성하는 Crew AI를 사용하여 프레임 워크 작성에 중점을 둘 것입니다. 이 시스템은 항목 설명 프로세스를 자동화하여 전자 상거래 효율성을 크게 향상시켜 고객 경험을 향상시키고 판매를 유도하는 정확하고 매력적인 목록을 보장 할 수 있습니다.

1 단계 : 필요한 라이브러리 설치

이미지 분석 및 설명 생성을위한 다중 에이전트 프레임 워크를 설정하기 위해 승무원 AI 및 필요한 종속성을 설치하십시오.

!pip install crewai crewai-tools poetry
!pip install langchain_openai

2 단계 : 필요한 라이브러리 가져 오기 및 OpenAI API 키 정의

승무원 AI, Langchain 및 VisionTool과 같은 필수 라이브러리를 가져 오면 AI 모델에 액세스하기 위해 OpenAI API 키를 구성합니다.

from langchain_openai import ChatOpenAI
from crewai import Agent, Crew, Process, Task
from crewai.project import CrewBase, agent, crew, task
from crewai_tools import VisionTool
import os
from crewai import Agent, Task, Crew, Process

os.environ['OPENAI_API_KEY'] =''

3 단계 : 이미지 분석 및 설명 생성을위한 OpenAI 모델 정의

사용 gpt-4o-mini 이미지 분석 및 gpt-3.5-turbo-16k 자세한 항목 설명을 생성합니다.

os.environ["OPENAI_MODEL_NAME"] = "gpt-4o-mini"
llm = ChatOpenAI(
    model="gpt-3.5-turbo-16k",
    temperature=0.1,
    max_tokens=8000

승무원 AI의 VisionTool ()에서 사용될 이미지 분석을 위해 여기에서 GPT-4O-MINI 모델을 사용할 것입니다. 이미지 설명의 생성을 위해 GPT-3.5-Turbo-16K 모델을 사용할 것입니다.

4 단계 : 이미지 분석 에이전트 및 관련 작업 정의

VisionTool을 사용하여 이미지에서 제품 이름과 설명을 추출하는 데 특화된 AI 에이전트를 만듭니다.

#Defining the URL
image_url = "
vision_tool = VisionTool()

image_text_extractor = Agent(
     role="Item Name & Description Extraction Specialist",
     goal="Extract NAME OF ITEM PRESENT ALONG WITH THEIR DESCRIPTION from images efficiently using AI-powered tools. You should get ITEM NAMES  from %s"%image_url,
     backstory='You are an expert in NAME OF ITEM PRESENT ALONG WITH THEIR DESCRIPTION extraction, specializing in using AI to process. Make sure you use the tools provided.',
      tools=[vision_tool],allow_delegation=False,verbose=True)


def text_extraction_task(agent):
        return Task(
            description = """Extract NAME OF ITEM PRESENT ALONG WITH THEIR DESCRIPTION from the provided image file. Ensure that the ITEM NAME & DESCRIPTION  is accurate and complete,
    and ready for any further analysis or processing tasks. The image file provided may contain
    various products of Different BRANDS, so it's crucial to capture all readable text. """,
            agent = agent,
            expected_output = "A string containing NAME OF ITEM PRESENT ALONG WITH THEIR DESCRIPTION extracted from the image.",
           max_iter=1
        )

우리는 먼저 항목의 다음 이미지를 사용하고 설명을 생성 할 것입니다.

5 단계 : 이미지 설명 생성기 에이전트 및 관련 작업 정의

전자 상거래 목록에 대한 추출 된 세부 사항을 기반으로 매력적인 제품 설명을 제작하기위한 AI 에이전트를 개발하십시오.

description_generator = Agent(
     role="Crafting Specialist",
     goal="From  the item names & description extracted from the previous agent, craft a good description of the PRODUCT (not any PERSON) highlighting all its key features for displaying on a website",
     backstory='You are an expert in crafting good descriptions for displaying on websites',
      llm=llm,allow_delegation=False,verbose=True)


def description_generator_task(agent):
        return Task(
            description = "From  the item names & description extracted from the previous agent, craft a good description of the PRODUCT (not any PERSON) highlighting all its key features for displaying on a website",
            agent = agent,
            expected_output = "A string containing a good description of the product.",
         max_iter=1)

6 단계 : 이미지 제목 생성기 에이전트 및 관련 작업 정의

전자 상거래 플랫폼에서 더 나은 가시성을 위해 간결하고 매력적인 제품 타이틀 (Max 3 Words)을 생성 할 대리인을 구현하십시오.

title_generator = Agent(
     role="Item Title Specialist",
     goal="From  the item description crafted from the previous agent, craft a good title for the PRODUCT (not any PERSON) in maximum 3 words for displaying on a ecommerce website",
     backstory='You are an expert in creating eye catching titles for displaying on websites',
      llm=llm,allow_delegation=False,verbose=True)


def title_generator_task(agent):
        return Task(
            description = "From  the item description crafted from the previous agent, ADD to the Description of the Product generated from previous agent A GOOD TITLE for the PRODUCT (not any PERSON) in maximum 3 words for displaying on a ecommerce website. Output should be Description of the Product generated from previous agent along with the Title",
            agent = agent,
            expected_output = "Output should be Description of the Product generated from previous agent along with the Title",
              max_iter=1)

7 단계 : 승무원 실행

구조화 된 전자 상거래 제품 설명을 생성하기 위해 각 작업이 이전 작업을 기반으로하는 순차적 프로세스에서 멀티 에이전트 시스템을 설정하고 실행하십시오.

task1 = text_extraction_task(image_text_extractor)
task2 = description_generator_task(description_generator)
task3 = title_generator_task(title_generator)

#start crew
targetting_crew = Crew(
    agents=[image_text_extractor,description_generator,title_generator],
    tasks=[task1,task2,task3],
    verbose=True, 
  process=Process.sequential # Sequential process will have tasks executed one after the other and the outcome of the previous one is passed as extra content into this next.
  )
targetting_result = targetting_crew.kickoff()

산출

Title: "Elegant Timepiece"

Description: Introducing the Daniel Wellington Classic Petite Melrose, a stunning
 women's watch that effortlessly combines style and sophistication. This timepiece
 features a round brown dial, adorned with elegant gold-tone hands and markers, 
creating a striking contrast that catches the eye. The watch is beautifully
 complemented by a rose gold metallic bracelet, adding a touch of luxury to any 
outfit. Designed with precision and attention to detail, the Classic Petite Melrose
 is not only a fashion statement but also a reliable timekeeping companion. Its
 high-quality craftsmanship ensures durability and longevity, making it a timeless
 investment piece. The round brown dial serves as the perfect backdrop for the gold-
tone hands and markers, allowing for easy readability at a glance. Whether you're
 attending a formal event or going about your daily routine, this watch effortlessly
 transitions from day to night, adding a touch of elegance to any occasion. The rose
 gold metallic bracelet adds a touch of glamour and sophistication to the overall
 design. Its sleek and slim profile ensures a comfortable fit on the wrist, while
 the secure clasp provides peace of mind during wear. With its classic yet
 contemporary design, the Daniel Wellington Classic Petite Melrose is a versatile
 accessory that can be paired with any outfit. Whether you're dressing up for a
 special occasion or simply want to elevate your everyday style, this watch is the
 perfect choice. Invest in timeless elegance and impeccable craftsmanship with the
 Daniel Wellington Classic Petite Melrose. Add this exquisite women's watch to your
 collection and make a statement wherever you go.

이제이 이미지의 결과를 확인해 봅시다.

Title: "Pastel Chic Sneakers"

Description: Introducing our stylish sneakers with a chunky white sole and a mix of
 pastel colors. These sneakers are designed to make a statement with their modern
 and trendy look, perfect for casual wear. The combination of mint green, peach, and
 gold accents adds a touch of elegance and sophistication to these sneakers. The 
chunky white sole not only provides comfort but also adds a fashionable touch to the
 overall design. Whether you're going for a walk in the park or meeting friends for 
a coffee, these sneakers will elevate your style and keep you looking effortlessly
 cool. Don't miss out on these must-have sneakers that effortlessly blend fashion
 and comfort.

결론

MAS (Multi-Agent Systems)는 자율 에이전트의 협력을 통해 복잡한 문제를 해결하는 강력한 접근법을 나타냅니다. 이러한 시스템은 고유 한 기능을 활용하여 다양한 부문에서 운영 효율성을 크게 향상시킬 수 있습니다. Crewai는 이러한 다중 에이전트 시스템의 개발을 촉진하는 혁신적인 플랫폼으로 두드러 지므로 조직은 에이전트 AI의 잠재력을 최대한 활용할 수 있습니다. Multiagent Orchestration, Role Specialization 및 Open-Source 프레임 워크와 같은 기능을 통해 Crewai는 사용자가 복잡한 워크 플로우를 효과적으로 자동화 할 수 있도록합니다.

이미지 분석 기능의 통합은 이러한 시스템을 더욱 풍부하게하여 실시간 데이터 처리 및 자동화 된 의사 결정을 허용합니다. Crewai는 컨텐츠 제작부터 고객 지원에 이르기까지 다양한 응용 프로그램을 통해 입증 된 바와 같이 프로세스를보다 효율적으로 만들고 디지털 마켓 플레이스의 전반적인 고객 경험을 향상시켜 비즈니스 운영 방식을 변화시킵니다.

주요 테이크 아웃

MAS는 개인 및 집단 목표를 달성하기 위해 의사 소통하고 조정하는 여러 자율 에이전트를 포함하여 전자 상거래 목록을위한 이미지에서 제품 설명을 생성하는 것과 같은 복잡한 작업을 해결하는 데 이상적입니다.
이미지 분석이 장착 된 에이전트 AI 시스템은 의료 진단, 품질 관리 및 재고 관리와 같은 작업을 자동화하여 의료, 제조, 소매 및 전자 상거래와 같은 분야를 크게 향상시키는 높은 정확도로 실시간 분석을 수행 할 수 있습니다.
2023 년에 설립 된 Crewai는 AI 에이전트 또는 “Crews”가 협력하여 작업을 완료하는 다중 에이전트 시스템의 생성 및 관리를 가능하게합니다. 오픈 소스 프레임 워크 및 클라우드 기반 플랫폼을 제공하여 기업이 복잡한 워크 플로 및 AI 작업을 더 쉽게 자동화 할 수 있습니다.
Crewai의 비전 도구를 사용하면 에이전트가 이미지에서 텍스트를 추출하여 이러한 시스템의 잠재적 응용 프로그램을 넓힐 수 있습니다. 문서 처리, 데이터 입력 및 컨텐츠 생성과 같은 작업을 자동화하여 시간을 절약하고 워크 플로 효율을 향상시킬 수 있습니다.
전자 상거래에서 다중 에이전트 시스템은 이미지에서 제품 설명을 자동으로 생성 할 수 있습니다. 이는 수동 개입없이 상세하고 매력적인 제품 목록을 제공하여 프로세스를 간소화하고 고객 경험을 향상시킵니다.

자주 묻는 질문

Q1. 다중 에이전트 시스템 (MAS)이란 무엇입니까?

A. MAS (Multi-Agent System)는 여러 지능형 에이전트가있는 분산 시스템입니다. 이 에이전트는 개인 및 공유 목표를 달성하기 위해 상호 작용하고 협력합니다. 소프트웨어 프로그램, 로봇 또는 인간이 될 수 있습니다. 각 에이전트는 복잡한 문제를 해결하기 위해 의사 소통하고 조정하는 동안 자율적으로 작동합니다.

Q2. 에이전트 AI 시스템은 이미지 분석을 어떻게 강화합니까?

A. 이미지 분석 기능이있는 에이전트 AI 시스템은 대량의 시각적 데이터에 대한 실시간 분석을 수행 할 수 있습니다. 정확도로 95%를 초과하고 의사 결정 프로세스를 자동화 할 수있는 인식 률을 달성 할 수 있습니다. 이를 통해 의료, 제조 및 소매와 같은 다양한 부문의 작업을 효과적으로 처리 할 수 있습니다.

Q3. Crewai 란 무엇이며 주요 기능은 무엇입니까?

A. Crewai는 2023 년에 설립 된 혁신적인 플랫폼으로 AI 애플리케이션을위한 다중 에이전트 시스템 개발을 전문으로합니다. 주요 기능에는 작업 대표단을위한 다중 에이전트 오케스트레이션 및 효과적인 협력을위한 역할 전문화가 포함됩니다. 또한 강력한 커뮤니티 관심사와 복잡한 AI 워크로드를 관리하기위한 엔터프라이즈 클라우드 솔루션을 갖춘 오픈 소스 프레임 워크를 제공합니다.

Q4. Crewai의 비전 도구는 어떻게 작동합니까?

A. Crewai의 비전 도구를 사용하면 AI 에이전트가 제공된 URL 또는 파일 경로를 분석하여 이미지에서 텍스트를 추출 할 수 있습니다. 이 도구는 에이전트의 시각적 정보를 처리하는 능력을 향상시킵니다. 추가 분석 또는보고를 위해 이미지에서 텍스트를 추출하여 문서 처리, 데이터 입력 자동화 및 컨텐츠 생성과 같은 시나리오에 적용 할 수 있습니다.

이 기사에 표시된 미디어는 분석 Vidhya가 소유하지 않으며 저자의 재량에 따라 사용됩니다.