Google은 Voice Model Chirp 3을 Vertex AI 플랫폼에 추가합니다.
생성 AI의 초점의 대부분은 텍스트, 이미지 등을 생성하는 데 사용되는 텍스트 기반 인터페이스에 있습니다. 다음 물결은 목소리로 보이며 빠르게 굴러 가고 있습니다. 최신 개발에서 Google은 오늘 다음 주부터 Vertex AI 개발 플랫폼에 Speech-to-Text 및 HD 텍스트 연설 모델을 추가 할 것이라고 발표했습니다.
지난주 Google은 Chirp 3이 31 개 언어로 8 개의 새로운 목소리를 내릴 것이라고 조용히 발표했습니다. 플랫폼의 사용 사례에는 음성 보조원 구축, 오디오 북 만들기, 지원 에이전트 및 비디오의 음성 개발이 포함됩니다. 이 뉴스는 런던의 Google Deepmind 사무소에서 열린 행사에서 발표되었습니다.
그 노력은 다른 사람들이 자신의 목소리 AI 작품으로 앞으로 나아가는 동시에오고 있습니다. 지난주, 바이러스 성, 매우 현실적인 사운드 “Maya”및 “Miles”AI 앱의 스타트 업인 Sesame은 개발자가 기술을 통해 자체 사용자 정의 앱 및 서비스를 구축 할 수 있도록 모델을 출시했다고 발표했습니다.
특히, Chirp 3 주변에는 사용 제한이 오용을 유지하려고 노력할 것입니다. Google Cloud의 CEO 인 Thomas Kurian은 오늘 뉴스 이벤트에서“우리는 안전 팀과 함께 이러한 것들 중 일부를 해결하고 있습니다.
Elevenlabs는 AI 음성 서비스에서 작업을 확장하기 위해 자금을 조달 한 주요 신생 기업 중 하나입니다.
이 뉴스는 Chirp 3을 테스트중인 플래그십 LLM 인 Gemini의 최신 버전과 동일한 안정된 것과 이미지 생성 모델 Imagen 및 값 비싼 VEO 2 비디오 생성 도구를 안정적으로 만들 것입니다.
Google이 Chirp 3으로 출시하는 것이 “인간”목소리를 창출하려는 다른 AI의 노력과 마찬가지로 “현실적”이 될지 여부는 여전히 확인되어야합니다 (Sesame의 작품은 특히 눈에 띄는). 그러나 DeepMind의 CEO 인 Demis Hassabis는 강조했으며, 이것은 스프린트가 아닌 마라톤으로 남아 있습니다.
“단기적으로… [AI is] 앞으로 몇 년 안에 모든 것에 대한은 총알, 나는 아직 그런 일이 일어나지 않는다. 우리는 여전히 Agi와 같은 일에서 몇 년이 걸렸다 고 생각합니다.”라고 그는 말했습니다. “이것은 향후 10 년 동안 중간 ~ 장기적인 것을 바꿀 것입니다. 그것은 그 흥미로운 순간 중 하나입니다.”
Google은 2021 년에 Vertex AI Way를 출시하여 개발자가 클라우드에서 머신 러닝 서비스를 구축 할 수있는 플랫폼으로 출시했습니다. 물론, AI에 대한 관심이 폭발하기 전, 특히 생성 AI는 OpenAI의 GPT 서비스가 시작되었습니다.
그 이후 로이 회사는 Microsoft 및 Amazon과 같은 다른 회사들에게 따라 Pertex AI에 기대어 있습니다. 또한 개발자를위한 생성 AI 툴링을 구축하고 있습니다. 개발자는 Gemini 위에 생성 AI를 구축하는 것 외에도 Vertex AI를 사용하여 데이터를 분류하고, 열차 모델을 만들고, 생산을위한 모델을 설정할 수 있습니다. 벽으로 둘러싸인 정원을 Google 자체에서 만든 모델로 확장하는 것이 흥미로울 것입니다.
Google은 몇 년 동안 “Chirp”음성 서비스를 구축해 왔으며 Amazon의 Alexa 서비스와 경쟁하기위한 초기 노력의 코드 이름으로 이름을 사용하는 것으로 돌아 왔습니다.
Post Comment