2024년 최고의 AI 기사

IEEE 스펙트럼지난해 가장 인기 있었던 AI 이야기는 분명한 주제를 보여준다. 2024년에 세계는 생성 AI의 기능과 결함을 이해하기 위해 고군분투했습니다. 두 가지 모두 매우 중요합니다.

올해 가장 많이 읽힌 AI 기사 중 두 개는 챗봇의 코딩 능력을 다루었고, 또 다른 기사는 챗봇과 이미지 생성기를 자극하는 가장 좋은 방법을 살펴보며 인간이 필요하지 않다는 사실을 발견했습니다.

‘결점’ 칼럼에서 한 심층 조사에서는 이미지 생성기 Midjourney가 상표권이 있는 캐릭터 및 저작권이 있는 영화의 장면과 거의 동일한 이미지를 뱉어내는 나쁜 습관이 있다는 사실이 밝혀졌고, 또 다른 조사에서는 나쁜 배우가 이를 어떻게 사용할 수 있는지 살펴보았습니다. 이미지 생성기 Stable Diffusion 버전 1.5로 아동 성적 학대 자료를 제작할 수 있습니다.

이 최고의 컬렉션에서 제가 가장 좋아하는 두 가지는 놀라운 이야기를 전하는 특집 기사입니다. 하나에서는 AI 연구원이 긱 근로자가 고용주를 감사하기 위해 데이터를 수집하고 정리하는 데 어떻게 도움을 주었는지 설명합니다. 또 다른 기사에서는 19개월 동안 활기 넘치는 스타트업에 몸담은 한 사회학자가 엔지니어들이 벤처 자본가들의 기대에 부응하기 위해 어떻게 노력하는지 설명합니다. 이 두 가지 중요한 이야기는 독자들을 과대 광고 거품 속으로 데려가 AI 기반 기업이 인간 노동을 활용하는 방법에 대한 실제 시각을 제공합니다. 2025년에는 IEEE 스펙트럼 계속해서 진실을 알려드릴 것을 약속드립니다.

데이비드 플렁커트

생성적 AI 붐이 챗봇과 이미지 생성기가 일자리를 앗아갈 것이라는 두려움을 불러일으켰음에도 불구하고 일부 사람들은 생성적 AI 도구를 사용하여 원하는 것을 정확히 생성하기 위한 프롬프트를 주의 깊게 구성하는 프롬프트 엔지니어링과 같은 완전히 새로운 일자리를 창출할 수 있기를 바랐습니다. 산출.

글쎄, 이 기사는 그러한 희망에 찬물을 끼얹었습니다. 스펙트럼 편집자 Dina Genkina는 AI 모델이 인간 엔지니어보다 프롬프트를 더 잘 구성한다는 것을 보여주는 새로운 연구에 대해 보고했습니다.

영화, 비디오 게임, TV에서 알아볼 수 있는 배우와 캐릭터인 생성 AI가 생성한 9개의 이미지 그리드입니다.

Midjourney를 통해 Gary Marcus와 Reid Southen이

뉴욕 타임즈 그리고 다른 신문들은 이미 챗봇이 저작권이 있는 기사를 그대로 전달하고 있다고 주장하면서 텍스트 표절 혐의로 AI 회사를 고소했습니다. 이번 중요한 조사에서는 게리 마커스 그리고 리드 서던 Midjourney를 사용하여 다스 베이더, 호머 심슨, 소닉 더 헤지혹과 같은 상표 등록 캐릭터뿐만 아니라 주요 영화의 스크린샷과 거의 똑같이 보이는 이미지를 생성하는 등 시각적 표절의 명확한 사례를 보여주었습니다. 이미지를 보려면 전체 기사를 살펴보는 것이 좋습니다.

저자는 다음과 같이 썼습니다. “이러한 결과는 Midjourney가 저작권이 있는 자료에 대해 훈련했다는 강력한 증거를 제공하며, 적어도 일부 생성 AI 시스템이 직접적으로 요청하지 않더라도 표절 출력을 생성하여 잠재적으로 사용자를 저작권 침해 소송에 노출시킬 수 있음을 입증합니다.”

키보드 위에 0과 1이 있는 유령 손 그림

게티 이미지

2022년 말 OpenAI의 ChatGPT가 처음 출시되었을 때 사람들은 OpenAI의 코드 작성 능력에 놀랐습니다. 그러나 그 능력에 대한 객관적인 측정을 원하는 일부 연구자들은 기능, 복잡성 및 보안 측면에서 코드를 평가했습니다.

그들은 5가지 프로그래밍 언어로 LeetCode 테스트 플랫폼의 728개 코딩 문제에 대해 GPT-3.5(ChatGPT를 지원하는 대규모 언어 모델 버전)를 테스트했습니다. 그들은 2021년 이전에 LeetCode에 있었던 코딩 문제에 대해 꽤 훌륭하다는 것을 발견했습니다. 아마도 훈련 데이터에서 이러한 문제를 보았기 때문일 것입니다. 최근 문제로 인해 성능이 급격히 떨어졌습니다. 쉬운 코딩 문제의 경우 기능 코드 점수가 89%에서 52%로 떨어졌고, 어려운 문제의 경우 40%에서 0.66%로 떨어졌습니다.

하지만 OpenAI 모델 GPT-4 및 GPT-4o가 이전 모델 GPT-3.5보다 우수하다는 점은 주목할 가치가 있습니다. 범용 생성 AI 플랫폼은 코딩 측면에서 지속적으로 개선되는 반면, 2024년에는 코딩에 맞춰진 AI 도구의 성능이 점점 더 확산되는 현상도 나타났습니다.

노트북 위의 사람 손 옆에 앉아 책 더미 위에 노트북을 바라보고 있는 미니 AI 봇의 사진 그림입니다.

알라미

우리 목록의 세 번째 이야기는 네 번째 이야기를 완벽하게 구성하며, 앞서 언급한 코딩 보조원의 급증을 고려하여 교수들이 코딩 교육에 대한 접근 방식을 어떻게 바꾸고 있는지 잘 살펴봅니다.

컴퓨터 과학 입문 과정에서는 코딩 구문보다는 테스트 및 디버깅에 더 중점을 두므로 학생들은 AI 보조원이 저지른 실수를 더 잘 포착할 수 있습니다. 또 다른 새로운 강조점은 문제 분해라고 한 교수는 말합니다. “이것은 LLM이 해결할 수 있는 작은 조각으로 큰 문제를 쪼개야 하기 때문에 조기에 알아야 할 기술입니다.” 전반적으로 강사들은 학생들이 AI 도구를 사용함으로써 이전에는 고급 수업에서만 가능했던 더 높은 수준의 사고를 가르칠 수 있는 자유를 얻었다고 말합니다.

Shipt 직원 영수증, 데이터 및 사람들의 사진 콜라주

마이크 맥퀘이드

이 특집 기사는 AI 연구원이 집필한 것으로, 다나 칼라치Target이 소유한 쇼핑 및 배달 플랫폼인 Shipt에서 긱 워커들과 함께 뭉쳤습니다.

직원들은 Shipt가 알 수 없는 방식으로 결제 알고리즘을 변경했다는 사실을 알고 있었고 많은 사람들이 급여가 삭감되는 것을 목격했지만 회사로부터 답변을 얻을 수 없었기 때문에 스스로 데이터를 수집하기 시작했습니다. Calacci와 힘을 합쳤을 때 그는 직원들이 급여 영수증의 스크린샷을 쉽게 보낼 수 있도록 텍스트봇을 구축하기 위해 협력했습니다. 또한 이 도구는 데이터를 분석하고 각 근로자에게 새로운 알고리즘에 따라 급여를 더 많이 받는지, 적게 받는지 알려주었습니다. 근로자의 40%가 예고 없이 임금을 삭감한 것으로 나타났으며, 근로자들은 파업, 불매운동, 시위를 조직하면서 이 결과를 언론의 주목을 끌었습니다.

Calacci는 다음과 같이 썼습니다. “사업 모델이 임시직 근로자에 의존하는 회사는 알고리즘을 불투명하게 유지하는 데 관심이 있습니다. 이러한 “정보 비대칭성”은 기업이 인력을 더 잘 통제하는 데 도움이 됩니다. 세부 사항을 공개하지 않고 조건을 설정하고 직원의 유일한 선택은 해당 조건을 수락할지 여부뿐입니다. 이러한 알고리즘이 블랙박스가 되어야 하는 기술적인 이유는 없습니다. 진짜 이유는 권력구조를 유지하기 위해서다.”

그래프 용지에 철자가 적힌 AI

IEEE 스펙트럼

두 개의 러시아 중첩 인형처럼 여기 목록 안에 목록이 있습니다. 매년 스탠포드는 AI 내 추세를 추적하기 위한 수백 개의 차트가 포함된 대규모 AI 지수를 발표합니다. 각 장에는 기술 성능, 책임 있는 AI, 경제, 교육 등이 포함됩니다. 그리고 지난 4년 동안, 스펙트럼 모든 내용을 읽고 AI의 현재 상태를 가장 잘 나타내는 차트를 꺼냈습니다.

2024년에 우리는 생성적 AI에 대한 투자, 기초 모델 훈련의 비용 및 환경적 영향, 수익에 도움이 되는 AI에 대한 기업 보고서, AI에 대한 대중의 경계심을 강조했습니다.

어두운 배경에 0과 1이 함께 연결된 진한 보라색 점과 선

iStock

신경망은 AlexNet이라는 시스템이 GPU 성능과 다층 신경망을 결합하여 이미지 인식 작업에서 이전에는 볼 수 없었던 성능을 얻은 2012년부터 AI의 지배적인 아키텍처였습니다. 그러나 투명성이 부족하다는 점을 포함하여 단점도 있습니다. 대개 정답인 답변을 제공할 수 있지만 작업 내용을 보여줄 수는 없습니다.

이 기사에서는 기존 시스템보다 더 해석하기 쉽고 더 정확해 보이는 신경망을 만드는 근본적으로 새로운 방법을 설명합니다. 설계자들은 물리학 질문과 미분 방정식에 대해 새 모델을 테스트할 때 모델이 어떻게 (종종 올바른) 답을 얻었는지 시각적으로 파악할 수 있었습니다.

많은 교통 카메라의 피드가 포함된 3개의 대형 스크린 앞 책상 뒤에 한 남자가 보입니다.

에드 겐트

다음 이야기에서는 인도 벵갈루루의 기술 허브를 소개합니다. 이곳은 인프라보다 인구가 더 빠르게 증가하여 세계에서 가장 혼잡한 거리를 남겨두고 있습니다. 이제 전직 칩 엔지니어에게 트래픽을 길들이는 어려운 임무가 주어졌습니다. 그는 혼잡을 모델링하고, 교통 체증을 예측하고, 많은 인파를 끌어들이는 사건을 식별하고, 경찰관이 사건을 기록할 수 있도록 하는 도구를 사용하여 AI에 도움을 요청했습니다.

다음 단계를 위해 교통국은 도시 전역의 보안 카메라에서 수집된 데이터를 통합하여 자동 차량 수 계산 및 분류는 물론 음식 배달 및 차량 공유 회사의 데이터를 통합할 계획입니다.

어두운 방에 빛나는 흰색 노트북 화면

마이크 켐프/게티 이미지

또 다른 중요한 조사에서 스펙트럼AI 정책 연구자 데이비드 에반 해리스 그리고 데이브 윌너 일부 AI 이미지 생성기가 명시된 사용 약관에 위배됨에도 불구하고 어떻게 아동 성적 학대 자료(CSAM)를 만들 수 있는지 설명했습니다. 그들은 특히 오픈 소스 모델인 Stable Diffusion 버전 1.5와 모델을 호스팅하고 무료로 다운로드할 수 있는 Hugging Face 및 Civtai 플랫폼에 중점을 두었습니다(Hugging Face의 경우 매월 수백만 번 다운로드되었습니다). . 그들은 많은 이미지 생성기가 수백 개의 CSAM 조각이 포함된 데이터 세트에 대해 훈련되었음을 보여준 이전 연구를 기반으로 구축했습니다.

Harris와 Willner는 이러한 주장에 대한 응답을 요청하기 위해 회사에 연락했으며 아마도 그들의 문의에 대한 응답으로 Stable Diffusion 1.5는 Hugging Face에서 즉시 사라졌습니다. 저자들은 이제 AI 기업과 호스팅 플랫폼이 잠재적인 책임을 심각하게 받아들여야 할 때라고 주장합니다.

유니콘 머리가 달린 톱마의 이미지입니다.

부헤스

사회학자가 방금 초기 벤처 캐피탈 투자 450만 달러를 받고 빠르게 순위를 올려 10억 달러 이상의 가치를 지닌 실리콘 밸리의 “유니콘” 중 하나가 된 샌프란시스코 스타트업에 입사하면 어떻게 될까요? 대답: 당신은 다음과 같은 매우 흥미로운 책을 얻었습니다. 스타트업의 뒷모습: 벤처캐피탈이 어떻게 일, 혁신, 불평등을 형성하는가어느 것에서 스펙트럼한 장을 발췌했습니다.

사회학자 저자, 벤저민 셰스타코프스키그가 AllDone(실명은 아님)이라고 부르는 회사가 투자자의 기대를 충족하기 위해 어떤 희생을 치르더라도 성장을 우선시하여 엔지니어들이 실제 엔지니어링을 많이 수행하기보다는 직원과 사용자 모두 채용에 집중하도록 유도한 방법을 설명합니다.

회사의 전체 가치 제안은 현지 서비스가 필요한 사람들을 현지 서비스 제공업체와 자동으로 연결하는 것이었지만, 결국 수동으로 매칭하는 필리핀 인력에게 매칭 프로세스를 아웃소싱하게 되었습니다. “필리핀 계약자는 효과적으로 기능했습니다. 인공의 Shestakofsky는 인공 지능이 아직 완료되지 않은 소프트웨어 알고리즘의 출력을 시뮬레이션한다고 썼습니다.

귀하의 사이트 기사에서

웹상의 관련 기사

출처 참조