AI 트렌드 마스터

최근 몇가지 디지털 미디어와 K pop과 관련된 해외 논문을 공부, 분석하느라 생성형 AI를 많이 활용하고 있습니다. 특히, 이번에 챗GPT와 Grok2를 자세히 활용해 보았는데 정말 엄청난 성능의 차이를 실감했습니다.
결론부터 얘기하면, 전 앞으로 챗 GPT 구독을 취소하고 Grok2를 주로 활용할 계획입니다.
제 채널에서 그동안 챗 GPT를 주로 언급하며, 프롬프트 기획등을 활용하는 모습을 많이 보여드렸는데, 절대 never 사용하지 않길 바라며, Grok2를 활용하시길 바랍니다. 비용도 1/3 수준의 가격, 월 10,900원인데, 성능이 엄청납니다.

논문 분석 후 인사이트 리포트를 작성하는데 있어서 이 둘의 차이가 엄청 극명했었거든요.
특히, 최근 챗GPT가 몰래 토큰 용량을 줄였고 성능의 저하가 일어나고 있다는 말이 여기저기 들리는데, 제 경험 상 진짜 그렇다고 생각합니다.
토크나이저와 언어 처리, 그리고 토큰 커버리지, 추론 능력에 대해 이야기해 볼까요?

먼저, 토크나이저는 텍스트를 작은 단위로 쪼개는 역할을 하는데요, 이는 AI가 문장을 이해하는 데 필수적이죠.
만약 토크나이저가 잘 작동하지 않으면, "K-pop" 같은 특정 용어를 제대로 이해하지 못할 수 있어요.
Grok-2는 트위터의 방대한 데이터를 기반으로 더 정밀하게 단어를 쪼개고 이해할 수 있어서, K-pop 관련 논문 분석에서 유리했어요.



언어 처리는 텍스트에서 의미를 파악하는 과정이에요. Grok-2는 트렌드와 문화적 맥락에 민감하게 반응해서, 복잡한 K-pop 문화를 더 잘 해석할 수 있었어요. 반면, ChatGPT-4o는 좀 더 일반적인 데이터를 기반으로 하다 보니, 세부적인 문화적 뉘앙스를 놓치는 경우가 있었죠.


근데 최근에는 GPT4o 는 아예 제대로 작동도 안되는 수준인 듯 합니다. 논문 PDF 자체를 아예 분석을 못하고, 거짓분석을 리포팅하고, 한 채팅방 내에서 나오는 인사이트의 맥락도 엉망이었죠.





토큰 커버리지는 AI가 얼마나 많은 단어와 문장을 '알고' 있는지를 뜻해요. Grok-2는 실시간 데이터를 활용해 최신 트렌드 단어까지 커버할 수 있어서, K-pop 논문에서 사용된 최신 용어도 잘 처리했어요.

GPT의 경우 이전에 컨텍스트는 128k로 유지됐지만, 지금은 사용자들 몰래 토큰 제한을 걸어버려서, 엔터프라이즈 구독자를 제외하고 플러스와 팀즈 구독은 32k로 줄어들었습니다. 쉽게 얘기해서 과거에는 GPT와 대화를 할때 텍스트 양이 1/4로 줄어들었고, 대화 맥락을 손실해버리고, 게다가 지멋대로 거짓말을 하는 설정을 했는지 오류 정보를 대답하는 경우가 많아졌습니다.

주인 닮아가는 GPT, 앞으로 점점 불완전한 서비스로 퇴화할듯 합니다.


마지막으로, 추론 능력은 AI가 주어진 정보를 바탕으로 결론을 내리는 능력이에요. 여기서 Grok-2는 문맥을 잘 이해해 논문의 핵심을 정확히 짚어냈어요. Grok-2는 정말 기대했던 것 보다 훨씬 좋은 리포트를 써주더라구요
여러분도 직접 두 서비스에서 긴 텍스트의 작업을 해보시고 비교 분석해서 객관적을 판단해보시길 바랍니다.

4 months ago | [YT] | 5