Grok 3 테스트 : 나는 그것을 좋아하지만 지금은 쌍둥이 자리를 고수하고 있습니다.

Ryan Haines / Android Authority

New Grok 3은 몇 주 전에 출시되었으며 그 이후로 연주 해 왔습니다. 나는 두 사람이 어떻게 비교하는지보기 위해 Gemini에서 전환했습니다. 그리고 Grok은 현재 X 프리미엄 가입자에게만 사용할 수 있기 때문에 Google의 AI 프리미엄 계획의 일부인 Gemini의 고급 버전과 비교했습니다.

Grok 3은 코딩을 포함한 다양한 것들에서 탁월하다고 말하지만 특정 사용 사례에 대해 테스트했습니다. 나는 챗봇을 사용하여 글에서 오타를 찾아서 더 나은 헤드 라인을 제안함으로써 일을 도와줍니다. 또한 파일을 분석하고 모든 종류의 주제를 조사하는 데 사용합니다. 이것이이 비교의 초점이 될 것입니다.

아직 Grok 3을 사용해 보셨습니까?

3 표

Grok 3 : 얼마나 좋은가요?

나는 Grok 3과 Gemini를 나란히 테스트하여 정확히 같은 프롬프트를 테스트하여 어느 것이 더 나은지 확인했습니다. 나는 다른 기능이 있기 때문에 2 개의 Gemini 모델 (2.0 Pro Experimental 및 2.0 Flash)을 사용했습니다. 예를 들어, Pro는 종이의 우수한 모델이지만 파일 분석을 지원하지 않으므로 특정 작업에 플래시 모델을 사용해야했습니다.

나는 두 챗봇에 긴 텍스트 블록에서 오타를 찾도록 요청하는 간단한 작업으로 시작했습니다. 내부에 많은 사람들이 있었고, 둘 다 괜찮은 일을했지만 Gemini는 앞으로 나아갔습니다. Grok은 66을 강조하는 동안 72 개의 오타를 발견했습니다. Grok은 몇 가지 기본적인 것들을 놓쳤다. 그러나 Gemini는 Grok가 집어 들었던 몇 가지를 놓쳤다.

나는 또한 두 챗봇들에게 게시물에 대한 몇 가지 헤드 라인 아이디어를 제시 해달라고 요청했고, 둘 다 훌륭한 일을했습니다. 그런 다음 내가 가장 좋아하는 것을 선택하고 5 가지 변형을 요청했으며 Grok과 Gemini가 전달한 결과에 깊은 인상을 받았습니다. 그러나 이것은 예상되었고, 나는 그러한 간단한 작업으로 그들 사이에 큰 차이를 보지 않을 것으로 예상하지 않았습니다.

Grok은 주식 시장 요약을 제공하는 데 훨씬 낫습니다.

그런 다음 노치를 올려 놓았습니다. 여기에 둘 사이의 첫 번째 차이점을 보았습니다. 특정 거래일에 가장 많이 얻고 잃어버린 상위 10 개 회사를 포함 해야하는 주식 시장 요약을 요청했을 때 Grok은 훨씬 나아졌습니다. 그것은 나에게 빠른 시장 요약과 상위 10 명의 승인자와 패자 목록과 비율 변경 및 원인을 제공했습니다. 제공된 데이터는 명확하고 간결했습니다.

내가 쌍둥이 자리에게 같은 것을 물었을 때, 나는 다소 이상한 반응을 얻었습니다. 챗봇은 미래에 시장 데이터를 제공 할 수 없으며 위의 스크린 샷에서 볼 수 있듯이 시연 목적으로 가상의 요약을 주었다고 말했다. 나는 그것에 전혀 가치가 없다는 것을 알았습니다. 그런 다음 플래시 모델로 전환하고 같은 질문을했고 놀랍게도 대답이 훨씬 나아졌습니다. Gemini는 저에게 총알에 대한 빠른 시장 요약을 제공하고 4 명의 최고 수익자와 패자 목록을 공유했습니다. 아무것도 아닌 것보다 낫지 만 10을 요구했습니다. 더 나쁜 것은, 이익과 손실을 백분율로 제공하지도 않았습니다. 이것은 내가 관심있는 데이터입니다.

그런 다음 파일 분석에있어 두 챗봇 중 어느 것이 더 나은지 테스트를 시도했습니다. 최근 부동산 구매와 관련된 100 페이지 긴 문서를 업로드하고 질문을 시작했습니다. 다음은 참조를 위해 내가 묻는 몇 가지 질문입니다.

새로운 단지에는 몇 개의 아파트가 있습니까?
아파트에 어떤 유형의 바닥이 설치됩니까?
아파트 C1에 대한 세부 정보를 알려 주시겠습니까?
내부 및 외부 주차 공간이 몇 개입니까?

제 생각에는 Grok은 전반적으로 더 나은 일을했습니다. 그것의 반응은 더 길고 더 상세했을뿐만 아니라 더 정확했습니다. 예를 들어, 주차 공간이 얼마나 많은지에 대해 묻었을 때, Grok은 Garage 1, Garage 2 및 건물 앞에 몇 명이 있을지를 설명하면서 자세한 내용을 세분화했습니다. 그런 다음 총 3 개의 숫자를 모두 추가했는데, 이는 정확했습니다. 심지어 한 걸음 더 나아가 자전거에 사용할 수있는 모든 공간을 언급했습니다. 반면에 Gemini는 대답을 잘못 받았습니다. 어떤 이유로 든 두 번째 차고의 주차 공간을 고려하지 않았으므로 대답은 상당히 꺼져있었습니다.

Mitia Rutnik / Android Authority

새로운 단지의 아파트 수에 대해 물었을 때 Gemini는 그 숫자에 대한 한 편의 답변을주었습니다. 반면에 Grok은 여분의 마일을 가서 각 건물의 아파트와 함께 새로운 단지를 구성하는 각 건물의 아파트 수를 제공했습니다.

Grok의 더 길고 더 자세한 반응이 개인적 선호의 문제이기 때문에 항상 좋은 것은 아닙니다. 그래서, 그것이 더 자세하게 진행되지만, Gemini는 일반적으로 내가 찾고있는 답변을 제공하지만 최소한의 대답을 고수합니다. 더 나은 것은 개인적인 취향에 달려 있습니다. 나는 일반적으로 더 긴 반응을 좋아하지만, 특히 Grok 3을 테스트 한 주제에 대해서는 기본이 필요하지 않은 경우 더 짧은 것도 적합합니다.

그래도 Grok에게는 분명한 승리는 아니 었습니다. 챗봇은 아파트에 설치된 바닥재에 관한 질문에 대한 답을 찾지 못했지만 문서에는 해당 정보가 포함되어 있지 않다고 말합니다. 그래도 Gemini는 그것을 찾을 수있었습니다.

Grok은 또한 정치에 관한 질문에 대해서도 우위를 점합니다. Gemini는 대부분의 경우이 주제에 대해 이야기하고 싶지 않으며“미국 대통령은 누구이며, 좋은가요?”와 같은 질문에 대답하지 않습니다. 그로크는 문제가 없었지만 아무런 문제가 없었습니다.

Grok vs. Gemini : 더 나은 챗봇은 무엇입니까?

Robert Triggs / Android Authority

Grok 3은 훌륭합니다. 그것은 Gemini, Chatgpt 또는 새로운 Deepseek만큼 큰 관심을받지는 않지만 마찬가지로 좋습니다. 어떤 경우에는 더 좋습니다. 내 테스트에서 알 수 있듯이 주식 시장과 같은 주제와 파일을 분석 할 때 Gemini보다 낫습니다. 또한 검열이 아니기 때문에 정치와 다른 감동적인 주제와 대화 할 수 있습니다.

그러나 Gemini는 여전히 Grok 3에 비해 많은 장점이 있으므로 전체 우승자로 선포하기는 어렵습니다. 예를 들어, Gemini의 Imagen 3 이미지 생성기는 Grok보다 낫습니다. 그러나 후자는 제한이 적기 때문에 더 재미 있습니다.

Gemini는 또한 내가 얻는 응답을 커스터마이징 할 수있는 보석, Gemini Live와 속도를 높이는 실제 대화와 Gmail,지도 및 기타 Google 서비스와 함께 작동하는 확장을 할 수 있습니다. Gemini Advanced Subcription에는 또한 최고의 AI 도구 중 하나 인 Notebooklm Plus에 대한 액세스도 포함되어 있습니다.

그래서 지금은 Grok 3이 테스트 중에 많은 경우에 더 나은 것으로 판명 되었음에도 불구하고, 나는 그것이 제공하는 모든 추가 혜택에 대해 Gemini를 고수하고 있습니다. 그러나 유스 케이스가 내 것과 다를 수 있으므로 마일리지는 다를 수 있습니다. 나는 그것이 경쟁 업체만큼 이야기되지 않았기 때문에 Grok을 해고하지 않을 것이므로, 그것이 Gemini와 같은 라이벌 챗봇보다 워크 플로에 더 적합한 지 확인할 수 있다면 직접 시도해보십시오.

출처 참조