AI 겸임교수 이종범

직장인을 위한 ChatGPT 및 생성형 AI로 업무 효율 높이기 'AI 겸임교수 이종범' 채널에 오신 것을 환영합니다.

이 채널은 AI 겸임교수 이종범이 운영하는 채널로, 생성형AI의 최신 트렌드와 업무에서의 활용 사례를 알기 쉽게 전달하는 것을 목표로 합니다. 다양한 AI 관련 주제를 다루며, 직장인에게 유익한 정보를 제공하고자 합니다.

채널 운영자인 AI 겸임교수 이종범은 ChatGPT 초보방 운영자이자 및 동국대학교 및 건국대학교에서 겸임교수를 하고 있으며, 패스트캠퍼스와 인프런에서 강의를 하고 있고 기업과 대학에서 AI 강의를 진행한 경험을 바탕으로 알찬 콘텐츠를 제작하고 있습니다.

'AI 겸임교수 이종범' 채널에서는 다음과 같은 콘텐츠를 만나보실 수 있습니다:

1. AI 업무 활용법
2. ChatGPT 및 생성형 AI 최신 업데이트
3. ChatGPT, Claude, Gemini 등 인기 생성형 AI 툴의 활용 팁과 노하우
4. 실무에서의 AI 활용 방법과 사례 소개

AI에 관심 있는 분들, AI를 업무에 활용하고자 하는 분들, 그리고 AI가 우리 삶에 미치는 영향에 대해 궁금한 분들께 이 채널을 추천합니다.
구독과 좋아요, 그리고 활발한 댓글 참여를 통해 AI 겸임교수 커뮤니티와 함께 성장해 나가길 바랍니다.

'AI 겸임교수 이종범''에서 여러분을 기다리겠습니다. 감사합니다!


AI 겸임교수 이종범

🚨 2025년 마지막 기회! 단 30명 한정 🚨
안녕하세요, AI 겸임교수 이종범입니다.
평소 기업/기관 요청으로만 진행하던 오프라인 대면 강의,
올해 처음이자 마지막으로 일반인에게 오픈합니다.
📍 어디서? 동국대학교 미래융합교육원 (서울캠퍼스)
🎯 무엇을? 생성형 AI로 실제 수익 만드는 법 (이론 NO, 실전 100%)
⏰ 언제? 12월 한 달, 매주 4시간 × 4회 = 총 16시간 완성

💡 이런 분들은 꼭 신청하세요

AI 활용법은 아는데 '돈'으로 연결이 안 되는 분
YouTube, 블로그, 디지털 콘텐츠로 수익화 시작하고 싶은 분
단순 이론이 아닌 즉시 적용 가능한 수익 모델이 필요한 분

🔥 실습 중심 + 1:1 피드백 + 수익화 모델 직접 구축
온라인 강의에서는 절대 경험할 수 없는 밀도 높은 16시간
⚠️ 선착순 30명 마감 시 조기 종료
올해는 이게 마지막입니다.
👉 지금 바로 신청하기
edulife.dongguk.edu/ngrade/site/html/8386

1 month ago | [YT] | 4

AI 겸임교수 이종범

제가 작성하는 AI 뉴스를 가장 빠르게 풍성하게 볼 수 있는 방법은 제 쓰레드를 확인해주시면 되세요.
www.threads.com/@powerblog


예전부터 AI에 관한 스터디를 아침마다 했는데 최근에 그걸 뉴스 형태로 공유하고 있습니다. 뉴스 거리가 될 만한 것만 올리다보니 없는 날도 있고, 제가 스터디를 못한 날도 있어서 들쭉 날쭉이긴 합니다만 게시판에는 동영상 콘텐츠는 전달이 어려워서 쓰레드가 가장 빠르게 소식을 받아볼 수 있는 채널입니다.

3 months ago | [YT] | 9

AI 겸임교수 이종범

[AI 겸임교수 이종범] 오늘의 뉴스 (2025.09.07)
가장 빠르게 AI 뉴스를 받아보고 싶다면 스레드를 팔로잉해주세요.
www.threads.com/@powerblog

1. 무료 전자책: 에이전틱 디자인 패턴: 지능형 시스템 구현을 위한 실용 가이드

구글 엔지니어가 에이전트 디자인 패턴에 관한 424페이지 분량의 무료 책을 방금 공개했습니다.

고급 프롬프트 엔지니어링, 다중 에이전트 프레임워크, RAG, 에이전트 도구 사용 및 MCP를 다룹니다.

실용적인 코드 예제가 포함된 100% 무료 자료입니다.

docs.google.com/document/d/1rsaK53T3Lg5KoGwvf8ukOU…

2. 나노 바나나 주말 해커톤 API 48시간 무료

구글에서 나노 바나나 (gemini-2.5-flash-image)의 글로벌 해커톤을 진행합니다.
주말동안 API를 무료로 사용할 수 있고 해커톤에 참여하면 5억원 상당의 상금도 받을 수 있습니다.

www.kaggle.com/competitions/banana

3. 중국 차단한 클로드, AI 기술 유출 막는다: Anthropic의 강화된 지역 제한 정책 발표

Claude의 Anthropic은 AI 서비스의 지역 제한 정책을 대폭 강화한다고 발표했습니다. 이번 조치의 핵심은 중국 등 권위주의 국가의 기업들이 해외 자회사를 통해 우회 접근하는 것을 원천 차단하는 것입니다. 특히 중국 본사가 50% 이상 지분을 보유한 해외 법인들도 서비스 이용이 금지됩니다.

Anthropic은 이러한 결정의 배경으로 국가 안보 위험을 지적했습니다. 권위주의 국가의 기업들은 자국 법률에 따라 정보 공유나 정보기관 협력을 강요받을 수 있으며, 이는 AI 기술이 적대적 군사·정보 목적으로 악용될 위험을 높인다는 것입니다. 또한 이들 기업이 모델 증류(distillation) 같은 기법으로 자체 AI를 개발하거나, 미국 및 동맹국 기업과 불공정하게 경쟁할 가능성도 우려 사항으로 꼽혔습니다.

이번 정책 변경은 단순한 기업 차원의 결정을 넘어, AI 기술이 민주주의 가치와 동맹국의 전략적 이익에 부합하도록 하겠다는 Anthropic의 의지를 보여줍니다. 회사는 강력한 수출 통제, 미국 내 AI 인프라 구축, 국가 안보 관련 AI 역량 평가 등 정부 차원의 정책도 지속적으로 지지하겠다고 밝혔습니다.

www.anthropic.com/news/updating-restrictions-of-sa…

4. AI 환각 현상의 근본 원인 규명: "모른다고 말하는 AI가 더 똑똑하다"

OpenAI라는 AI 회사가 최근 중요한 발견을 했습니다. ChatGPT 같은 AI가 왜 가끔 틀린 답을 자신 있게 말하는지 그 이유를 찾아낸 것입니다.

쉽게 설명하면 이렇습니다. 시험에서 모르는 문제가 나왔을 때를 생각해보세요. "모르겠습니다"라고 쓰면 0점이지만, 아무거나 찍으면 운 좋게 맞을 수도 있죠? AI도 똑같은 상황입니다. 지금의 AI 평가 방법은 "모르겠어요"라고 답하면 무조건 틀린 것으로 처리하기 때문에, AI는 확실하지 않아도 그럴듯한 답을 만들어내는 법을 배우게 된 것입니다.

실제 예를 들어보겠습니다. 새로운 GPT-5 모델은 확실하지 않은 질문의 52%에 "모르겠다"고 답했고, 틀린 답은 26%만 냈습니다. 반면 이전 모델은 거의 모든 질문(99%)에 답을 했지만, 그중 75%가 틀렸습니다. 어떤 게 더 믿을 만한 AI일까요?

OpenAI는 이 문제를 해결하려면 AI를 평가하는 방법을 바꿔야 한다고 말합니다. 틀린 답에는 감점을 주고, "잘 모르겠어요"라고 솔직하게 말하면 부분 점수라도 주는 방식으로요. 이렇게 하면 AI가 모르는 것은 모른다고 솔직하게 말하는, 더 믿을 수 있는 도구가 될 수 있다는 것입니다.


사이트: openai.com/index/why-language-models-hallucinate/
논문: cdn.openai.com/pdf/d04913be-3f6f-4d2b-b283-ff432ef…

5. ChatGPT로 브레인스토밍 하는 법

1. 프레임워크
설명:
브레인스토밍 프레임워크는 패턴을 기반으로 작동합니다. AI도 마찬가지입니다. 다음은 몇 가지 예시입니다:

5 Whys
SWOT
Six Thinking Hats
Gap Mapping
Starbursting

프롬프트 템플릿:
"[브레인스토밍 프레임워크]를 사용하여 다음 주제에 대해 브레인스토밍해 주세요: [당신의 주제]"

2. 다양한 관점
설명:
AI가 다른 각도에서 주제에 접근하도록 강제합니다.
다음과 같은 관점의 예시:

마케팅 전문가
영업 전문가
제품 전문가

프롬프트 템플릿:
"우리는 브레인스토밍 세션을 진행합니다: [전문가 A], [전문가 B], [전문가 C]. 각 전문가가 다음 주제에 대한 10가지 아이디어와 그들의 POV를 제시해 주세요: [당신의 주제]"

3. 반대의 날
설명:
고객을 행복하게 만드는 방법을 말하고 싶다고 가정해 봅시다.
먼저 고객을 더 불만족스럽게 만들 수 있는 방법에 대해 생각한 다음, 그것을 뒤집습니다.
프롬프트 템플릿:
"고객을 더 불만족스럽게 만들 수 있는 20가지 방법을 알려주세요. [제품/서비스]. 그런 다음 모든 포인트마다 정확한 반대를 제공하세요."

4. 단계별 접근
설명:
이전 단계를 기반으로 단계별로 진행하고 계속 구축합니다.
비즈니스 아이디어를 브레인스토밍한다고 가정해 봅시다. 단계:

산업
산업 과제
고통 포인트
솔루션
비즈니스 아이디어

프롬프트 템플릿:

"혼란에 적합한 10개 산업 목록"
"선택한 산업 내 10가지 과제 목록"
등등


5. 창의적인 단어
설명:
단어는 창의성을 장려할 수 있습니다.

극도로 독특한
대담하게 다른
이전에 없던
완전히 예상치 못한
격렬하게 파격적인
절대적으로 전례 없는
완전히 독창적인

프롬프트 템플릿:
"[주제]에 대한 10개의 [단어] 아이디어를 주세요."

6. 밀도의 사슬
설명:
CoD 프롬프트는 원래 반복을 통해 점점 더 나은 요약을 만들기 위해 만들어졌습니다.
하지만 이를 조정하여 점점 더 창의적인 결과물을 만들 수도 있습니다.
프롬프트 템플릿:
"점점 더 창의적인 결과물을 생성할 것입니다.
다음 2단계를 5번 반복하세요.
1단계: 초기 결과물에서 누락된 1-3개 포인트를 식별하세요.
2단계: 새롭고 개선된 동일한 길이의 결과물을 작성하되 누락된 포인트를 포함하세요."

7. 제1원칙
설명:
제1원칙 사고는 문제 해결을 위한 강력한 프레임워크이지만 브레인스토밍에도 적용할 수 있습니다.
복잡한 문제를 기본 요소로 분해하고 처음부터 다시 조립하는 것을 포함합니다.
프롬프트 템플릿:
"제1원칙 사고를 사용하여 다음 주제에 대해 브레인스토밍하세요: [당신의 주제]"

가장 빠르게 AI 뉴스를 받아보고 싶다면 스레드를 팔로잉해주세요.
www.threads.com/@powerblog

3 months ago | [YT] | 11

AI 겸임교수 이종범

[AI 겸임교수 이종범] 오늘의 뉴스 (2025.09.04)
아침마다 이메일로 편하게 받아보고 싶다면 뉴스레터를 구독해주세요.
aiadjunct.beehiiv.com/

1. 텍스트 한 줄로 영화급 사운드 제작? ElevenLabs SFX v2 출시

ElevenLabs가 AI 음향 효과 생성 모델 SFX v2를 공개했습니다. 이번 업데이트의 핵심은 단순한 텍스트 프롬프트만으로 최대 30초(기존 22초)의 고품질 사운드를 생성할 수 있다는 점입니다. 특히 주목할 만한 기능은 '무한 루핑 사운드 효과'로, 단 하나의 샘플로 11분간의 빗소리, 66분의 파도 소리, 끝없는 카페 배경음을 만들어낼 수 있습니다.

기술적으로도 크게 향상되었습니다. 샘플레이트가 44.1kHz에서 영화·TV·게임 업계 표준인 48kHz로 높아져 더욱 섬세한 음향 표현이 가능해졌고, AI 오디오 편집기 'Studio'와의 통합으로 오디오북 저자, 팟캐스터, 영상 편집자들이 더욱 몰입감 있는 콘텐츠를 제작할 수 있게 되었습니다.

ElevenLabs는 대폭 확장된 SFX 라이브러리와 함께 MIDI 지원 사운드보드 SB-1도 업그레이드했으며, 무료 플랜 사용자도 MP3와 WAV 포맷으로 AI 음향 효과를 이용할 수 있도록 했습니다. 이제 창작자들은 프롬프트 하나로 상상하는 모든 소리를 현실로 만들 수 있게 되었습니다.

elevenlabs.io/sound-effects

2. Le Chat 메모리 기능과 MCP 본격 도입

Mistral의 Le Chat이 20개 이상의 MCP(Model Context Protocol) 기반 커넥터와 완전히 제어 가능한 메모리 기능을 도입하며, 기업과 개인 사용자를 위한 가장 연결성 높은 AI 어시스턴트로 진화했습니다. 이번 업데이트의 핵심은 바로 '연결성'과 '개인화'입니다.

20개 이상의 기본 제공 커넥터와 모든 MCP 서버 연결 기능을 통해 Le Chat은 사용자의 데이터를 검색, 요약, 실행할 수 있게 되었습니다. 이는 기업 환경에서 여러 플랫폼과 도구를 오가며 작업해야 하는 번거로움을 획기적으로 줄여줄 것으로 기대됩니다.

특히 주목할 점은 새로운 메모리 기능입니다. Le Chat은 이제 과거 대화 내용을 학습하여 더욱 관련성 높은 응답과 개인화된 추천을 제공합니다. 사용자는 언제든지 메모리 항목을 추가, 편집, 삭제할 수 있으며, 투명한 프라이버시 설정을 통해 데이터를 완전히 제어할 수 있습니다.

chat.mistral.ai/chat

3. 엔비디아 CEO "AI가 5년 내 인터넷보다 더 많은 백만장자 만든다"

엔비디아 CEO 젠슨 황이 역대급 예측을 내놓았습니다. "AI는 5년 내에 인터넷이 20년 동안 만든 것보다 더 많은 백만장자를 만들어낼 것"이라는 대담한 전망입니다. 1조 달러 기업 엔비디아를 이끄는 그는 메타, 테슬라, OpenAI 등 주요 AI 기업들의 로드맵을 미리 파악하고 있어, 그의 발언은 단순 추측이 아닌 내부 정보에 기반한 통찰입니다.

젠슨 황은 AI를 "역사상 가장 위대한 기술 평등화 도구"라고 표현했습니다. "이제 모든 사람이 프로그래머이자 창작자가 될 수 있다"며, 기술 역량이 아닌 아이디어가 승부를 가르는 시대가 왔다고 강조했습니다. 특히 주목할 점은 그의 '투 팩토리 모델'입니다. 모든 기업이 제품 공장과 AI 공장, 두 개의 공장을 운영해야 한다는 것이죠. 테슬라가 자동차와 AI 두뇌를 동시에 만드는 것처럼 말입니다.

현재 AI 인프라 구축에만 수천억 달러가 투입되고 있으며, 이는 수조 달러 규모 산업의 시작에 불과합니다. 150명의 AI 연구원이 200~300억 달러의 가치를 창출하는 전례 없는 레버리지 효과도 나타나고 있습니다. 젠슨 황은 경고합니다. "AI를 사용하지 않으면, AI를 사용하는 누군가에게 일자리를 빼앗길 것이다." AI가 인간을 대체하는 것이 아니라, AI로 무장한 인간이 그렇지 않은 인간을 대체하는 시대가 온 것입니다.

4. 구글에서 밝힌 나노 바나나를 위한 텍스트-이미지 프롬프트 작성 팁 6가지

나노 바나나(일명 Gemini 2.5 플래시 이미지)를 소개합니다: 최신이자 가장 빠르고 효율적인 모델입니다. 이 모델의 기본 다중 모달 아키텍처는 텍스트와 이미지를 단일 단계로 처리하여 대화형 편집, 다중 이미지 합성, 논리적 추론과 같은 강력한 기능을 제공합니다.

구글에서 밝힌 프롬프트 작성 가이드 6가지를 노션에 정리했습니다. 아래 링크를 참고해주세요.

bit.ly/4mKPaMn

5. OpenAI, ChatGPT 무료 사용자에게도 프로젝트 관리 기능 제공 시작

OpenAI가 ChatGPT의 Projects 기능을 무료 사용자에게도 전면 개방했습니다. 이제 무료 버전에서도 프로젝트당 최대 5개의 파일을 업로드할 수 있으며, Plus 사용자는 25개, Pro/Business/Enterprise 사용자는 40개까지 업로드가 가능해졌습니다.

특히 주목할 만한 점은 프로젝트별로 독립적인 메모리 제어가 가능해져, 각 프로젝트의 맥락에 맞는 더욱 정교한 AI 어시스턴트를 구성할 수 있다는 것입니다. 사용자는 프로젝트마다 고유한 색상과 아이콘을 설정하여 시각적으로도 구분하기 쉬운 작업 환경을 만들 수 있습니다.

현재 웹과 Android 버전에서 이용 가능하며, iOS 사용자들에게는 향후 며칠 내에 순차적으로 업데이트될 예정입니다. 이번 업데이트로 ChatGPT는 단순한 대화형 AI를 넘어 체계적인 프로젝트 관리가 가능한 업무 도구로 진화하고 있음을 보여주고 있습니다.

6. AI가 비디오 편집자를 대체한다? Genspark Clip Genius의 원클릭 편집 기술

Genspark가 비디오 편집의 새로운 패러다임을 제시하는 'Clip Genius'를 공개했습니다. 이 AI 편집 도구는 단 하나의 프롬프트만으로 모든 형태의 비디오를 자동으로 편집해주는 혁신적인 서비스입니다.

Clip Genius의 작동 방식은 놀라울 정도로 간단합니다. 지능형 콘텐츠 분석을 시작으로 스마트 스토리 기획, 정밀 편집 및 최적화, 그리고 전문적인 조립까지 모든 과정이 자동화되어 있습니다. 싱글 클립부터 그리드 레이아웃, 복잡한 멀티 비디오 매시업까지 - 사용자가 원하는 모든 편집 스타일을 AI가 대신 처리합니다.

가장 주목할 점은 전문적인 편집 기술이 전혀 필요하지 않다는 것입니다. 이제 누구나 몇 분 안에 전문가 수준의 비디오를 제작할 수 있게 되었습니다. 비디오 편집에 소요되던 수많은 시간과 노력이 단 하나의 명령어로 해결되는 시대가 열린 것입니다.

www.genspark.ai/clip_genius

7. NVIDIA 두뇌와 유압식 심장의 만남: 차세대 휴머노이드 Protoclone 심층 분석

폴란드의 스타트업 Clone Robotics가 기존 휴머노이드 로봇의 패러다임을 완전히 뒤집는 'Protoclone'을 공개했습니다. Tesla, Figure, 1X 등 대부분의 휴머노이드가 모터 기반 시스템을 채택하는 가운데, Clone Robotics는 과감하게 인공 근육과 유압식 심장을 선택했습니다. 1,000개 이상의 Myofiber 인공 근육과 200개의 뼈로 구성된 이 로봇은 인간과 거의 동일한 200도 이상의 자유도를 구현합니다. 경쟁사들이 30-60도에 머물러 있는 것과 비교하면 혁명적인 수준입니다.

이들의 핵심 기술은 맨해튼 프로젝트에 참여했던 물리학자 Joseph McKibben이 마비된 딸을 위해 개발한 공압식 근육에서 시작됐습니다. Clone Robotics는 이를 현대적으로 재해석해 1그램의 근육이 자기 무게의 300배를 들어올리고, 50밀리초 만에 수축하는 강력한 유압식 시스템으로 발전시켰습니다. NVIDIA Jetson 칩이 두뇌 역할을 하며, 500개 이상의 센서가 전신에 분포해 실시간으로 환경을 인식합니다.

현재 Protoclone은 천장에 매달린 상태로 시연되고 있지만, Clone Robotics는 올해 안에 자유 보행이 가능한 차세대 모델 'Clone Alpha'를 선보일 예정입니다. 이들의 비전은 명확합니다. 아침에 침대 옆에서 조식을 준비하고, 직장에서는 업무 보조를 하며, 저녁에는 설거지와 빨래를 대신하는 '완벽한 인간 동반자'를 만드는 것입니다. 휴머노이드 시장에서 이것이 과연 애플의 아이폰 같은 혁신이 될지, 아니면 또 하나의 실험에 그칠지 2025년이 그 답을 보여줄 것입니다.
https://www.youtube.com/watch?v=E1the...

8. 젠스파크를 이긴 AI 에이전트, 심층 분석 능력으로 주목받는 스카이워크

2025년 AI 에이전트 시장에 흥미로운 신규 플레이어가 등장했습니다. 스카이워크(Skywork)라는
이 AI 에이전트는 최근 젠스파크가 주최한 '슬라이드 배틀' 챌린지에서 많은 사용자들이
우승 도구로 선택하면서 주목받기 시작했습니다. 실제 비교 테스트 결과, 스카이워크는
14페이지 분량의 PPT를 젠스파크가 3페이지 만드는 시간 내에 완성하는 놀라운 속도를
보여주었으며, 제3자 AI 평가에서도 "더 체계적이고 깊이 있는 정보 제공"이라는 평가를
받으며 우위를 입증했습니다.

스카이워크의 핵심 차별점은 '심층 연구' 기능에 있습니다. MCP(Model Context Protocol)
도구를 활용한 병렬 검색과 탐색으로 일반적인 AI 도구 대비 10배 더 신뢰할 수 있는
출처 추적을 제공하며, AI 환각을 최소화합니다. 특히 논문 작성 테스트에서는 17페이지
분량의 상세한 문서를 그래프와 참고문헌까지 포함해 생성했으며, 이는 경쟁 서비스 대비
약 6배 많은 분량입니다.

기업 사용자를 위한 실용적 기능도 눈에 띕니다. 사용자가 보유한 템플릿을 업로드해
맞춤형 문서를 생성할 수 있으며, PPT와 논문 외에도 웹페이지, 팟캐스트 스크립트,
엑셀 표 등 다양한 형식을 지원합니다. 생성된 모든 결과물은 개인 지식 기반으로
활용 가능해, 단순한 AI 도구를 넘어 종합적인 업무 생산성 솔루션으로 자리매김하고
있습니다.

https://youtu.be/YfZmrSydJf0

9. 바이브 마케팅의 시대가 열렸다. IDE 안에서 작동하는 AI 마케팅 도구 등장

개발자들이 마케팅에 고민하는 시간을 획기적으로 줄여줄 새로운 AI 도구가 등장했습니다. Layers는 IDE(통합개발환경) 내에서 직접 작동하는 노코드 마케팅 코파일럿으로, 1인 개발자나 소규모 팀이 별도의 마케팅 팀 없이도 효과적인 마케팅을 수행할 수 있도록 지원합니다. 특히 Cursor, Bolt, Windsurf 등 인기 개발 도구와의 완벽한 호환성을 자랑합니다.

이 플랫폼의 핵심은 'Vibe Marketing'이라는 새로운 개념입니다. 개발자가 앱 정보, 타겟 고객, 마케팅 목표만 입력하면 AI가 맞춤형 마케팅 전략을 수립하고, 어떤 부분을 직접 관리하고 어떤 부분을 자동화할지 선택할 수 있습니다. 실시간 성과 추적과 최적화까지 제공해 개발자는 코드 작성에 집중하면서도 효과적인 사용자 확보가 가능합니다.

Layers는 "마케팅 학위가 필요 없는 마케팅", "며칠 만에 사용자 확보"를 표방하며, 복잡한 마케팅 용어 대신 개발자 친화적인 가이드를 제공합니다. 성공적인 콘텐츠는 자동으로 유료 프로모션으로 확장되며, 앱이 성장함에 따라 전략도 자동으로 조정됩니다. 마케팅 팀을 고용하기 어려운 1인 개발자나 스타트업에게 특히 유용한 솔루션으로 평가받고 있습니다.

얼리 액세스: uselayers.ai/r/7LUJRY

아침마다 이메일로 편하게 받아보고 싶다면 뉴스레터를 구독해주세요.
aiadjunct.beehiiv.com/

3 months ago | [YT] | 6

AI 겸임교수 이종범

[AI 겸임교수 이종범] 오늘의 뉴스 (2025.09.01)
아침마다 이메일로 편하게 받아보고 싶다면 뉴스레터를 구독해주세요.
aiadjunct.beehiiv.com/

1. 전달만 하면 끝 - 이메일 중심 AI 자동화 도구 Manus.Bot 출시

이메일을 전달하기만 하면 모든 작업이 자동으로 처리되는 시대가 열렸습니다. Manus.Bot은 Gmail이나 Outlook 등 기존 이메일 서비스에서 @Manus.Bot으로 메일을 전달하기만 하면, AI가 즉시 내용을 분석하고 필요한 작업을 수행하는 혁신적인 서비스를 선보였습니다. 더 이상 텍스트를 복사하거나 파일을 다운로드할 필요 없이, 이메일 전달 한 번으로 번역, 요약, 분석 등 다양한 업무가 자동으로 처리됩니다.

특히 주목할 점은 전체 이메일 스레드와 첨부파일까지 한 번에 처리할 수 있다는 것입니다. 긴 팀 논의 스레드를 전달하면 핵심 요약과 실행 계획을 받아볼 수 있고, 계약서나 제안서가 포함된 이메일을 보내면 즉시 위험 요소 분석과 가격 인사이트를 제공받을 수 있습니다. 송장 이메일을 대량으로 전달하면 자동으로 경비 기록을 추출하고 정리하는 것도 가능합니다.

Manus.Bot은 단순히 이메일을 읽는 것을 넘어,
전체 대화의 맥락을 이해하고 적절한 작업을 수행합니다.
이메일이 곧 강력한 AI 비서가 되는 새로운 업무 환경을 경험해 보세요.
manus.im/

2. 마이크로소프트, AI 입문자를 위한 18개 에피소드 무료 교육 과정 공개

마이크로소프트가 "Generative AI for Beginners"라는 18개 에피소드로 구성된
교육 시리즈를 공개했습니다. 이 프로그램은 AI에 관심 있는 초보자부터 개발자까지
누구나 생성형 AI의 기초를 체계적으로 학습할 수 있도록 설계되었습니다.

특히 이번 교육 과정은 복잡한 AI 개념을 단계별로 쉽게 풀어내어, 기술적 배경이
없는 입문자도 부담 없이 따라갈 수 있다는 점이 주목할 만합니다. 생성형 AI의
작동 원리부터 실제 활용 방법까지 포괄적으로 다루며, 각 에피소드는 이론과
실습을 균형 있게 구성하여 실무 적용 능력을 높일 수 있도록 했습니다.

learn.microsoft.com/en-us/shows/generative-ai-for-…

3. 격투기 링에 오른 AI 로봇: UFC, AI 로봇 파이터 프리뷰 공개

UFC(Ultimate Fighting Championship)가 로봇공학 기업 Unitree와 함께 이벤트를 열었습니다. UFC 대표 다나 화이트(Dana White)가 직접 참여하는 이번 행사에서는 Unitree의 격투 로봇들이 실제 격투 기술을 시연했는데요, 이번 쇼케이스는 단순한 기술 시연을 넘어 스포츠 엔터테인먼트 산업과 AI 로봇공학의 융합 가능성을 보여주는 의미 있는 시도입니다.

격투 스포츠와 AI 기술의 만남은 향후 새로운 형태의 엔터테인먼트 콘텐츠 개발은 물론, 선수 훈련 보조 도구나 스포츠 분석 기술 발전에도 기여할 수 있을 것으로 보입니다.

x.com/UnitreeRobotics/status/1961009297812242819

4. PhD급 AI 과학자 'Novix' 출시... 논문 작성부터 실험까지 자동화

PhD 수준의 AI 과학자를 표방하는 자율 과학 발견 플랫폼 'Novix'가 출시되었습니다.
이 플랫폼은 심층 연구, 혁신적 아이디어 생성, 지능형 코딩, 고급 데이터 분석,
자동화된 실험, 그리고 논문 작성까지 연구 워크플로우 전반을 포괄하는 종합적인
기능을 제공합니다.

Novix의 핵심은 AGI 레벨 4 혁신 엔진으로, 연구자들이 아이디어 단계부터
출판 준비가 완료된 연구까지 전례 없는 효율성으로 진행할 수 있도록 지원합니다.
AI 기반 가설 생성, 자율 알고리즘 설계 및 검증, 자동화된 데이터 분석과
시각화, 그리고 연구 방법론의 자동 검증 및 재현 기능을 통해 과학적 발견
프로세스를 획기적으로 가속화합니다.

현재 신규 사용자에게는 5달러의 무료 크레딧이 제공되며, 사용자 피드백
설문조사를 완료하면 20달러 상당의 프로 계정을 이용할 수 있습니다.
오픈소스 기반(GitHub)으로 개발된 이 플랫폼은 novix.science에서
접속 가능합니다.

novix.science/

5. HITTER 로봇 공개 - 인간 수준의 탁구 실력을 갖춘 AI 휴머노이드 등장

UC 버클리 연구진이 개발한 휴머노이드 탁구 로봇 'HITTER'가 인간과 106회 연속 랠리를 성공시키며 로봇 공학계의 새로운 이정표를 세웠습니다. 초속 5미터가 넘는 탁구공을 정확히 받아치기 위해서는 1초 미만의 반응 시간 내에 인지, 예측, 행동이 모두 이루어져야 하는데, 이는 그동안 휴머노이드 로봇에게는 불가능에 가까운 도전 과제였습니다.

연구팀은 이 문제를 해결하기 위해 계층적 프레임워크를 개발했습니다. 모델 기반 플래너가 공의 궤적을 예측하고 라켓의 타격 위치를 계획하면, 강화학습 기반 컨트롤러가 팔과 다리의 협응된 움직임을 생성해 안정성을 유지하면서도 민첩한 동작을 구현합니다. 특히 인간의 동작 데이터를 학습에 활용해 자연스러운 움직임을 만들어낸 점이 주목할 만합니다.

이번 성과는 단순한 기술 시연을 넘어, 휴머노이드 로봇이 동적 환경에서 실시간으로 상호작용할 수 있는 가능성을 보여줍니다. 스포츠뿐만 아니라 재난 구조, 의료 보조 등 빠른 반응이 필요한 다양한 분야에서 휴머노이드 로봇의 활용 가능성이 한층 더 현실에 가까워졌습니다.

humanoid-table-tennis.github.io/

6. Kimi Slides 출시 - 몇 분 만에 완성되는 AI 프레젠테이션

Kimi가 새로운 AI 프레젠테이션 제작 서비스 'Kimi Slides'를 정식 출시했습니다. 이 서비스의 핵심은 단순명료합니다. 아이디어를 입력하면 몇 분 안에 완성된 프레젠테이션을 받아볼 수 있다는 것입니다. 기존에 몇 시간씩 걸리던 슬라이드 제작 과정을 AI가 대신 처리해주는 것이죠.

더욱 주목할 점은 Kimi가 예고한 추가 기능들입니다. 곧 도입될 '적응형 레이아웃(Adaptive Layout)'은 콘텐츠에 맞춰 자동으로 최적의 디자인을 제안하고, '자동 이미지 검색' 기능은 텍스트 내용에 맞는 이미지를 AI가 알아서 찾아 삽입해줄 예정입니다.

특히 '에이전트 슬라이드(Agentic Slides)' 기능은 AI가 단순히 템플릿을 채우는 수준을 넘어, 프레젠테이션의 흐름과 논리 구조까지 스스로 구성하는 수준으로 발전할 것으로 보입니다. 프레젠테이션 제작의 완전한 자동화를 향한 Kimi의 도전이 어떤 결과를 가져올지 주목됩니다.

www.kimi.com/kimiplus/cvvm7bkheutnihqi2100

아침마다 이메일로 편하게 받아보고 싶다면 뉴스레터를 구독해주세요.
aiadjunct.beehiiv.com/

3 months ago | [YT] | 11

AI 겸임교수 이종범

[AI 겸임교수 이종범] 오늘의 뉴스 (2025.08.27)
아침마다 이메일로 편하게 받아보고 싶다면 뉴스레터를 구독해주세요.
aiadjunct.beehiiv.com/

1. 구글 나노 바나나, Gemini 2.5 Flash 이미지 모델 프리뷰 버전 공식 공개

구글 DeepMind가 Gemini-2.5-Flash-Image-Preview(코드명 'nano-banana')를
AI Studio와 Gemini API, 그리고 GEMINI 앱에서 프리뷰 버전으로 공식 공개했습니다.

이번에 공개된 프리뷰 버전은 정식 출시 전임에도 불구하고
이미 놀라운 성과를 보여주고 있습니다.
Image Edit Arena에서 진행된 커뮤니티 평가에서
단 2주 만에 500만 개 이상의 투표를 이끌어내며 1위를 차지했고,
특히 이 모델 단독으로 250만 개 이상의 투표를 획득했습니다.

Arena 평가에서는 역대 최고 기록인 171점의 Elo 점수 격차로
경쟁 모델들을 압도했으며, 이는 사용자들의 높은 만족도를
객관적으로 보여주는 지표라고 할 수 있습니다.

구글이 프리뷰 버전으로 공개한 주요 기능:
- 최신 이미지 생성 및 편집 기술
- 일관된 캐릭터 표현 능력
- 빠른 처리 속도

현재 개발자와 얼리어답터들은 AI Studio와 Gemini API를 통해
이 프리뷰 버전을 직접 테스트해볼 수 있습니다.
구글은 프리뷰 기간 동안 수집된 피드백을 바탕으로
정식 버전을 더욱 개선할 계획으로 보입니다.

Gemini: gemini.google.com/
Google AI Studio: aistudio.google.com/
유튜브 영상: https://youtu.be/b-vCuCtanNo

2. 🤖 Anthropic, 브라우저를 직접 제어하는 AI 에이전트 'Chrome용 Claude' 베타 테스트 시작

Anthropic이 웹브라우저에서 직접 작동하며 사용자를 대신해 다양한 작업을 수행할 수 있는
'Chrome용 Claude' 확장 프로그램을 공개했습니다. 현재 1,000명의 사용자를 대상으로
제한적인 연구 프리뷰 형태로 출시되었으며, Max 플랜 구독자들이 대기 목록에 등록할 수 있습니다.

📌 주요 기능

Chrome용 Claude는 단순한 챗봇을 넘어 브라우저에서 직접 다음과 같은 작업을 수행할 수 있습니다:

- 웹페이지 탐색 및 버튼 클릭
- 온라인 폼 자동 작성
- 기존 캘린더 이벤트에 회의실 추가
- 답장이 필요한 이메일 자동 검색
- 사용자 선호도에 맞는 아파트 검색

이는 AI가 단순히 정보를 제공하는 것을 넘어, 실제로 웹상에서 사용자를 대신해
작업을 수행할 수 있게 되었음을 의미합니다.

⚠️ 보안 위험과 대응 방안

Anthropic은 이 기능이 가져올 수 있는 보안 위험, 특히 '프롬프트 인젝션(prompt injection)'
공격의 위험성을 명확히 인지하고 있습니다. 악의적인 행위자들이 웹사이트, 이메일, 문서 등에
숨겨진 명령어를 삽입하여 AI를 조작할 수 있는 가능성이 있기 때문입니다.

잠재적 위험 시나리오:
- 사용자 계정이나 파일에 무단 접근
- 개인정보 유출
- 사용자 모르게 온라인 구매 진행
- 의도하지 않은 행동 수행

🛡️ 안전 사용 가이드라인

Anthropic은 베타 테스터들에게 다음과 같은 안전 수칙을 권고하고 있습니다:

1. 신뢰할 수 있는 웹사이트에서만 사용
2. 금융 거래, 비밀번호 관리 등 민감한 작업 수행 금지
3. 중요한 작업 수행 전 반드시 검토 및 확인
4. 예상치 못한 동작 발생 시 즉시 신고

🔮 시사점

Chrome용 Claude는 AI 에이전트의 실용적 활용 가능성을 보여주는 동시에,
AI 시스템의 안전성 확보가 얼마나 중요한 과제인지를 다시 한번 상기시킵니다.
이번 제한적 베타 테스트를 통해 Anthropic은 실제 사용 환경에서 발생할 수 있는
다양한 문제점을 파악하고, 더 안전한 AI 브라우저 자동화 기술 개발을 목표로 하고 있습니다.

AI가 웹을 직접 탐색하고 조작할 수 있는 시대가 열리고 있지만,
그만큼 보안과 안전성에 대한 고민도 깊어져야 할 시점입니다.

claude.ai/chrome

대기 목록 신청 (Max 사용자만): docs.google.com/forms/d/e/1FAIpQLScc03qA6A9A0oBRNz…

3. Cursor에 Grok Code 일주일 무료 공개

Grok Code가 이제 Cursor에서 이용 가능합니다! 일주일 동안 무료로 제공됩니다. Sonic으로 불리던 모델이 Grok Code 였네요. 윈드서프도 Grok Code를 1주일간 무료로 공개하긴 하는데 아쉽게도 pro와 Teams 사용자에게만 무료로 제공됩니다.

반면 Klio code에서는 무제한 무료로 이용할 수 있습니다.
Kilo Code는 VS Code용 무료 오픈소스 AI 코딩 확장 프로그램으로, 출시 4개월 만에 24만 다운로드를 돌파했습니다.

Grok Code Fast를 무제한 무료로 이용하는 방법은 다음과 같습니다:

1. VS Code 마켓플레이스에서 Kilo Code를 다운로드하세요:
marketplace.visualstudio.com/items?itemName=kiloco…
20초 만에 무료 계정을 생성하세요.

2. 하단에서 AI 모델로 "Grok Code Fast 1"을 선택하세요

3. 무언가를 만들어 달라고 요청하세요 (예: X의 복제본 ;). 놀라움을 경험하세요

4. Claude Code GitHub 통합 정식 출시

Anthropic이 Claude Code의 GitHub 통합 기능을 정식 출시했습니다.
이번 GA(General Availability) 버전은 단순한 @-claude 멘션을 넘어
훨씬 더 포괄적인 GitHub 이벤트 지원을 제공합니다.

🎯 주요 업데이트 내용

- 확장된 이벤트 트리거: 새로운 이슈 생성, CI 실패, 사용자 지정 조건 등
다양한 GitHub 이벤트에 자동으로 반응
- 서브에이전트 지원: 액션 내에서 더욱 정교한 작업 처리 가능
- 맞춤형 템플릿 제공: 코드 리뷰 등 일반적인 워크플로우를 위한
즉시 사용 가능한 템플릿 제공

💡 실제 활용 시나리오

이제 개발팀은 Claude Code를 활용해 다음과 같은 작업을 자동화할 수 있습니다:

1. 이슈 분류 및 중복 제거 - 새로 생성된 이슈를 자동으로 분석하고 정리
2. CI 실패 자동 수정 - 빌드 오류를 감지하고 해결책 제시
3. 팀 맞춤형 코드 리뷰 - 팀의 코딩 컨벤션에 맞춰 자동 리뷰 수행
4. PR 취약점 실시간 감지 - 새로운 풀 리퀘스트의 보안 취약점 자동 스캔

🚀 시작하기

GitHub에서 Claude Code를 시작하거나 기존 버전을 GA 버전으로
업그레이드하려면 Anthropic의 공식 문서를 참고하시기 바랍니다.

이번 업데이트는 개발 워크플로우의 자동화를 한 단계 더 발전시키며,
개발자들이 더 중요한 창의적 작업에 집중할 수 있도록 지원합니다.

docs.anthropic.com/en/docs/claude-code/github-acti…

5. 🎨 AI 앱 개발의 새로운 전환점: Replit의 포괄적 디자인 지원 시스템

AI 앱 개발의 새로운 전환점: Replit의 포괄적 디자인 지원 시스템

Replit이 AI 앱 개발 분야에서 획기적인 진전을 발표했습니다. 이제 개발자들이 만드는 AI 앱이 마치 전문 디자이너가 직접 작업한 것처럼 일관된 브랜드 아이덴티티를 유지할 수 있게 되었습니다.

주요 업데이트 내용

1. 테마 생성 및 관리 기능 (모든 사용자 이용 가능)
- 색상, 폰트, UI 속성을 앱 전체에 한 번에 적용
- 개별 컴포넌트를 일일이 수정할 필요 없이 즉시 변환
- 저장된 테마를 향후 모든 앱에 원클릭으로 재사용

2. 기업용 디자인 시스템 통합 (엔터프라이즈 베타)
- Figma 디자인 시스템 직접 임포트: 기존 Figma 디자인을 그대로 AI 앱에 적용
- 패키지/라이브러리 임포트: 디자인 토큰과 규칙을 담은 패키지 연결로 모든 앱에 일괄 적용

이번 업데이트가 가져올 변화

기존에는 주로 빠른 프로토타이핑이나 내부 도구 개발에 활용되던 Replit이, 이제는 고객 대면 서비스나 상업용 앱 개발까지 가능한 플랫폼으로 진화했습니다.

여러 팀이나 용도별로 다양한 디자인 시스템을 생성하고 관리할 수 있으며, 언제든지 업데이트가 가능합니다. 현재는 새로 만드는 앱에 우선 적용되며, 기존 앱 지원도 곧 추가될 예정입니다.

더 자세한 정보는 Replit 공식 발표를 참고하세요.

AI와 디자인의 경계가 사라지는 시대, 이제 누구나 전문가 수준의 앱을 만들 수 있는 환경이 열리고 있습니다.

blog.replit.com/introducing-comprehensive-design-s…

6. 구글, 70개 언어 실시간 양방향 통역 기능 출시

구글이 Gemini 모델의 고급 추론 능력과 멀티모달 기능을 활용해 Google Translate에 두 가지 혁신적인 업데이트를 발표했습니다. 이번 업데이트는 서로 다른 언어를 사용하는 사람들 간의 소통을 한층 더 원활하게 만들어줄 전망입니다.

첫 번째 업데이트: 실시간 양방향 통역 기능

오늘부터 Translate 앱에서 "Live translate" 기능을 통해 70개 이상의 언어로 실시간 양방향 대화가 가능해집니다. 음성과 화면 번역이 동시에 제공되어 마치 통역사와 함께 있는 것처럼 자연스러운 대화를 나눌 수 있습니다. 이 기능은 이번 주부터 미국, 인도, 멕시코 사용자들에게 먼저 제공됩니다.

두 번째 업데이트: AI 기반 맞춤형 언어 학습 (베타)

구글은 사용자 개개인의 언어 학습 목표 달성을 돕는 새로운 베타 서비스도 선보입니다. Translate 앱에서 "practice" 탭을 선택한 후, 학습할 언어와 현재 실력 수준을 설정하고 학습 목표를 입력하면, AI가 맞춤형 듣기 및 말하기 연습 프로그램을 생성해줍니다.

이 기능은 이번 주부터 스페인어와 프랑스어를 학습하는 영어 사용자, 그리고 영어를 학습하는 스페인어, 프랑스어, 포르투갈어 사용자들에게 우선 제공됩니다.

이번 업데이트는 언어 장벽을 허무는 기술의 진보를 보여주는 동시에, AI가 개인화된 교육 경험을 어떻게 제공할 수 있는지를 보여주는 좋은 사례입니다. 글로벌 커뮤니케이션과 언어 학습의 미래가 어떻게 변화할지 주목해볼 만합니다.

blog.google/products/translate/language-learning-l…

7. Perplexity, AI 시대 출판사 수익 모델 'Comet Plus' 출시. 월 $5 구독 서비스

📰 AI 시대의 새로운 콘텐츠 비즈니스 모델이 등장했습니다

Perplexity가 오늘 'Comet Plus'라는 획기적인 구독 서비스를 발표했습니다. 이 서비스는 사용자들에게 신뢰할 수 있는 출판사와 저널리스트의 프리미엄 콘텐츠에 대한 접근권을 제공합니다.

🔄 전통적인 인터넷 경제의 한계

지금까지 출판사들은 클릭 수와 페이지뷰라는 구시대적 보상 체계에 갇혀 있었습니다. 아침 커피를 마시며 뉴스를 읽는 것은 '인간 트래픽'이고, AI에게 업계 트렌드를 요약해달라고 요청하는 것은 '인덱스 트래픽'이며, AI 어시스턴트가 일정을 확인하고 관련 기사를 추천하는 것은 '에이전트 트래픽'입니다.

각각은 실질적인 가치를 창출하지만, 기존 모델은 첫 번째 경우에만 보상을 제공했죠.

💡 Comet Plus가 제시하는 솔루션

Comet Plus는 AI 시대에 맞는 첫 번째 보상 모델입니다. 세 가지 유형의 인터넷 트래픽을 모두 인정하고 보상합니다:

- 인간의 직접 방문 (Human Visits)
- AI의 검색 인용 (Search Citations)
- AI 에이전트의 작업 수행 (Agent Actions)

구독자들은 참여 출판사의 콘텐츠에 직접 접근할 수 있고, AI 어시스턴트가 해당 사이트에서 작업을 수행할 수 있도록 권한을 부여할 수 있으며, 고품질 콘텐츠를 기반으로 한 직접적인 답변을 받을 수 있습니다.

💰 구독료와 수익 분배

- 월 $5의 독립 구독 서비스
- Pro 및 Max 구독자에게는 무료 제공
- 수익의 대부분을 참여 출판사에 분배 (Perplexity의 컴퓨팅 비용 제외)

이 모델은 사용자가 정보를 소비하는 방식의 변화를 반영합니다. 수동으로 브라우징하든, AI 생성 답변을 요청하든, 복잡한 작업을 위해 에이전트를 배포하든, 출판사들은 이 새로운 현실에 맞는 보상을 받게 됩니다.

www.perplexity.ai/ko/hub/blog/introducing-comet-pl…

8. 영화급 품질의 AI 휴먼 애니메이션이 무료로 열렸다 - Wan2.2 오픈소스 출시

🎬 영화급 휴먼 애니메이션 AI, 오픈소스로 공개되다

Wan2.2-S2V, 14B 파라미터 규모의 오디오 기반 휴먼 애니메이션 모델이 오픈소스로 공개되었습니다.
이 모델은 단순한 '말하는 얼굴' 수준을 넘어서 영화, TV, 디지털 콘텐츠 제작에 활용 가능한
프로페셔널급 품질을 구현합니다.

📌 핵심 특징
- 긴 영상에서도 일관된 다이나믹한 움직임 유지
- 영화 수준의 오디오-비디오 동기화 생성
- 지시문을 통한 정교한 모션 및 환경 제어
- 영화 제작자, 콘텐츠 크리에이터, 개발자를 위한 완벽한 솔루션

🚀 Wan2.2의 주요 혁신 기술

1. 효율적인 MoE 아키텍처
비디오 디퓨전 모델에 Mixture-of-Experts(MoE) 아키텍처를 도입했습니다.
각 시간 단계별로 특화된 전문 모델을 활용하여, 동일한 연산 비용으로
전체 모델 용량을 대폭 확대했습니다.

2. 영화급 미학적 품질
조명, 구도, 대비, 색조 등 세밀한 라벨링이 된 미학적 데이터를 학습했습니다.
이를 통해 사용자가 원하는 영화적 스타일을 정교하게 제어하고
맞춤형 미적 선호도에 따른 비디오 생성이 가능해졌습니다.

3. 복잡한 모션 생성 능력
Wan2.1 대비 이미지는 65.6%, 비디오는 83.2% 더 많은 데이터로 학습했습니다.
이러한 대규모 학습을 통해 모션, 의미론, 미학 등 다양한 차원에서
일반화 성능이 크게 향상되었으며, 오픈소스 및 클로즈드 소스 모델 중
최고 성능을 달성했습니다.

4. 효율적인 고화질 하이브리드 TI2V
16×16×4 압축 비율을 달성한 Wan2.2-VAE를 활용한 5B 모델을 오픈소스로 공개했습니다.
720P 해상도, 24fps로 텍스트-투-비디오와 이미지-투-비디오 생성을 모두 지원하며,
특히 RTX 4090 같은 소비자용 그래픽 카드에서도 구동이 가능합니다.
현재 이용 가능한 720P@24fps 모델 중 가장 빠른 속도를 자랑합니다.

💡 의미와 전망
Wan2.2의 공개는 고품질 비디오 생성 기술의 민주화를 의미합니다.
이제 독립 제작자나 소규모 스튜디오도 할리우드급 품질의
AI 기반 영상 제작이 가능해졌습니다.
특히 오픈소스로 공개되어 연구자와 개발자들이 자유롭게 활용하고
개선할 수 있다는 점에서 향후 더 큰 혁신이 기대됩니다.

Try it now : wan.video/
Github: github.com/Wan-Video/Wan2.2
Project: humanaigc.github.io/wan-s2v-webpage
Hugging Face Demo: huggingface.co/spaces/Wan-AI/Wan2.2-S2V
Modelscope Demo: modelscope.cn/studios/Wan-AI/Wan2.2-S2V
Hugging Face Weights: huggingface.co/Wan-AI/Wan2.2-S2V-14B
ModelScope Weights: modelscope.cn/models/Wan-AI/Wan2.2-S2V-14B

아침마다 이메일로 편하게 받아보고 싶다면 뉴스레터를 구독해주세요.
aiadjunct.beehiiv.com/

3 months ago | [YT] | 10

AI 겸임교수 이종범

[AI 겸임교수 이종범] 오늘의 뉴스 (2025.08.26)
아침마다 이메일로 편하게 받아보고 싶다면 뉴스레터를 구독해주세요.
aiadjunct.beehiiv.com/

1. 구글 NotebookLM, 80개 언어로 비디오 오버뷰 지원 시작

구글의 AI 기반 노트 정리 도구인 NotebookLM이 전 세계 사용자들을 위한 대규모 업데이트를 발표했습니다.

이번 주부터 순차적으로 적용되는 주요 기능은 다음과 같습니다:

📌 비디오 오버뷰 다국어 지원
이제 80개 언어로 비디오 오버뷰를 생성할 수 있습니다. 한국어를 포함한 대부분의 주요 언어가 지원되어, 언어에 관계없이 콘텐츠를 시각적으로 요약하고 이해할 수 있게 되었습니다.

📌 오디오 오버뷰 길이 조절 기능
영어 외 언어 사용자들을 위해 오디오 오버뷰의 길이를 '짧은 버전'과 '기본 버전'으로 선택할 수 있는 기능이 추가되었습니다. 이를 통해 더 상세하고 긴 오디오 요약도 들을 수 있게 되었죠.

구글 NotebookLM 팀은 "훌륭한 아이디어가 언어의 장벽으로 인해 묻히지 않아야 한다"는 철학 아래, 더 많은 언어 지원을 위해 지속적으로 노력하고 있다고 밝혔습니다.

현재 지원되지 않는 언어가 있다면 피드백을 통해 요청할 수 있으며, 팀은 사용자 의견을 적극 반영하여 서비스를 개선해 나갈 예정입니다.

AI 도구의 접근성이 점차 확대되면서, 언어에 관계없이 모든 사용자가 동등한 기능을 활용할 수 있는 환경이 조성되고 있습니다.

현재 지원 언어 목록: bit.ly/478UdBB

2. 캔바(Canva)를 대체할 AI? 멀티모달을 지원하는 '매직 캔버스' 공개

Canva를 대체할 새로운 오픈소스 AI가 등장했습니다.
Jaaz AI는 단 한 줄의 프롬프트만으로 전문적인 이미지와 영상을 생성할 수 있는 도구입니다. 템플릿도, 복잡한 드래그 앤 드롭도 필요하지 않습니다. 원하는 결과를 설명하기만 하면 됩니다.

Jaaz는 로컬에서 실행되는 오픈소스 AI 에이전트로, 데이터 보안을 유지하면서도 강력한 창작 경험을 제공합니다.
주요 기능은 다음과 같습니다:

1. 매직 캔버스 & 멀티모달 명령어
텍스트, 이미지, 드로잉을 무한 캔버스에 추가한 뒤 "이것을 사이버펑크 스타일의 유튜브 썸네일로 만들어줘"라고 말하면, 즉시 결과물이 생성됩니다.

2. 일관된 대량 생성
여러 장의 이미지나 짧은 영상을 요청하면, 스타일을 유지한 채 한 번에 생성합니다. 반복 작업을 싫어하는 크리에이터에게 특히 유용합니다.

3. 이미지 블렌딩 데모
다양한 이미지를 자연스럽게 섞는 데모를 통해 창작 가능성을 보여줍니다.

Jaaz의 매직 캔버스 기능 덕분에 복잡한 텍스트 프롬프트와 UI는 더 이상 필요하지 않습니다. 이미지, 영상, 창작물을 ‘마법처럼’ 빠르게 만들어낼 수 있죠.

깃허브: github.com/11cafe/jaaz
jaaz.app/

3. ChatGPT 답변에 우리 제품이 나오게 하려면? 'AI SEO' 솔루션 등장

혹시 "이제 사람들은 구글에서 검색하는 대신, AI에게 질문한다"는 말에 대해 어떻게 생각하시나요? 검색의 패러다임이 AI 중심으로 빠르게 이동하면서, 기존의 마케팅 방식에 큰 변화가 요구되고 있습니다. 만약 AI의 답변에 우리 제품이나 서비스가 언급되지 않는다면, 미래의 잠재 고객을 놓치게 될지도 모릅니다.

이러한 변화의 흐름 속에서 Y-Combinator가 주목한 새로운 스타트업이 있어 소개해 드리고자 합니다. 바로 The Prompting Company입니다.

이들은 'AI 검색 최적화(AIO, AI Answer Optimization)'라는 개념을 제시합니다. 고객들이 ChatGPT와 같은 AI에게 질문할 때, 그 답변에 특정 제품이 자연스럽게 언급되도록 돕는 솔루션입니다.

어떻게 작동하나요?

1. 사용자 질문 분석: 먼저 잠재 고객이 AI에게 어떤 질문을 하는지 정확히 찾아내고, 현재 우리 제품이 얼마나 언급되고 있는지 분석합니다.
2. 콘텐츠 생성: 분석 결과를 바탕으로, 어떤 콘텐츠를 어디에, 어떻게 게시해야 AI의 답변에 포함될 확률이 높아지는지에 대한 전략을 제시하고 실행까지 돕습니다.
3. AI 트래픽 전용 페이지 구축: AI를 통해 유입된 사용자를 위해 특별히 최적화된 페이지로 안내하여 전환율을 높입니다.

검증된 창업팀

이들은 이미 두 번의 성공적인 엑싯을 경험했습니다:
- Typedream (AI 웹사이트 빌더) → beehiiv 인수
- Cotter (패스워드리스 인증 SDK) → Stytch 인수

📊 왜 지금인가?
기존 SEO는 구글 검색 최적화에 집중했지만,
이제는 AI 답변 최적화라는 완전히 새로운 영역이 열렸습니다.
먼저 움직이는 기업이 시장을 선점할 것입니다.

promptingcompany.com/

4. 90분 음성 생성, 4인 동시 발화와 노래까지? MS의 오픈소스 TTS 'VibeVoice'

Microsoft가 새로운 텍스트-음성 변환(TTS, Text-to-Speech) 모델인 'VibeVoice'를 전격 공개했습니다.

특히 이번 모델은 1.5B 파라미터 규모의 최고 성능(SoTA) 모델임에도 불구하고, 누구나 자유롭게 사용할 수 있는 MIT 라이선스로 배포되어 커뮤니티의 큰 주목을 받고 있습니다.

VibeVoice가 특별한 이유는 다음과 같습니다.

* 압도적인 생성 길이: 한 번에 최대 90분에 달하는 매우 긴 오디오를 생성할 수 있어, 오디오북이나 강의 제작에 새로운 가능성을 엽니다.
* 다중 화자 지원: 4명 이상의 목소리를 동시에 자연스럽게 생성하여, 여러 사람이 대화하는 오디오 드라마나 팟캐스트 콘텐츠 제작이 용이합니다.
* 언어와 음악의 경계를 넘다: 여러 언어를 넘나드는 크로스링궐(cross-lingual) 합성은 물론, 텍스트를 기반으로 노래까지 만들어내는 놀라운 성능을 보여줍니다.
* 풍부한 감정 표현: 무엇보다 사용자가 감정을 세밀하게 제어할 수 있어, 미묘한 뉘앙스까지 담아내는 표현력 높은 음성 합성이 가능합니다.

Microsoft는 여기서 그치지 않고, 실시간 생성이 가능한 스트리밍 버전과 더욱 강력한 성능의 7B 파라미터 모델도 곧 공개할 예정이라고 밝혀, AI 음성 기술의 미래에 대한 기대감을 더욱 높이고 있습니다.

huggingface.co/microsoft/VibeVoice-1.5B

5. 이제 AI 영상도 틱톡처럼? 세로형 영상에 특화된 AI 모델 등장

Google, Kling에 이어 AI 영상 생성 분야에 새로운 강자가 등장했습니다. 바로 TikTok의 제작사 ByteDance가 선보인 차세대 비디오 생성 AI인 Waver 입니다.

현재 무료로 제한 없이 사용 가능하며, 특히 소셜 미디어에 최적화된 세로형 영상(Vertical-native) 제작에 특화되었습니다.

주요 특징은 다음과 같습니다:

* 🎬 진정한 멀티모달리티 (True Multimodality)
하나의 모델에서 텍스트는 물론 이미지로도 영상을 생성할 수 있습니다. (Text-to-Video & Image-to-Video)

* 📱 세로형 영상 네이티브 (Vertical-Native)
처음부터 세로형 포맷을 완벽하게 이해하고 제작하여, 별도 편집 없이 소셜 미디어에 바로 활용할 수 있습니다.

* 📖 멀티샷 스토리텔링 (Multi-Shot Storytelling)
여러 장면에 걸쳐 동일한 캐릭터와 스타일을 일관성 있게 유지하며, 하나의 완성된 이야기 구조를 만들 수 있습니다.

* 🤸 복잡한 움직임 구현 (Complex Motion)
역동적인 스포츠 장면이나 스케일이 큰 움직임도 놀라울 정도로 자연스럽게 표현합니다.

* ✨ 기간 한정 무료 (Free & Unlimited for now)
현재는 크레딧 걱정 없이 자유롭게 다양한 실험을 해볼 수 있습니다.

디스코드에서 사용해볼 수 있습니다.
링크: discord.gg/YkEhmd4ubq

6. 전문 사진작가도 주목하는 Qwen의 AI 기반 조명 편집 도구 출시

새로운 AI 이미지 편집 툴 소식을 전해드립니다.

알리바바의 AI 모델 'Qwen'이 이미지 속 조명(빛)을 자유롭게 편집할 수 있는 전용 앱, 'Qwen Image Edit Relight'를 공개했습니다.

'리라이팅(Relighting)'에 특화된 이 툴은 기존의 복잡하고 번거로웠던 이미지 조명 편집 과정을 획기적으로 개선한 것이 특징입니다. Qwen 측에 따르면, 이 앱은 리라이팅 작업에 맞춰 빠르고 정밀하게 최적화되었습니다.

이제 복잡한 워크플로우 없이 단 8단계의 간단한 과정만으로 최고 수준(SOTA, State-of-the-art)의 결과물을 얻을 수 있게 된 것입니다.

이미지의 분위기를 좌우하는 '빛'을 AI로 손쉽게 제어할 수 있게 되면서, 디자이너와 크리에이터들의 작업 효율성이 크게 향상될 것으로 기대됩니다.

huggingface.co/spaces/zerogpu-aoti/Qwen-Image-Edit…

아침마다 이메일로 편하게 받아보고 싶다면 뉴스레터를 구독해주세요.
aiadjunct.beehiiv.com/

3 months ago | [YT] | 6

AI 겸임교수 이종범

[AI 겸임교수 이종범] 오늘의 뉴스 (2025.08.25)
아침마다 이메일로 편하게 받아보고 싶다면 뉴스레터를 구독해주세요.
aiadjunct.beehiiv.com/

1. 🚨 크리에이티브 업계 긴급 속보

중국이 새로운 AI 도구를 공개한 지 단 24시간.
벌써 모션 디자이너들이 클라이언트를 잃기 시작했습니다.

이 충격적인 변화의 중심에는 Text to Motion을 해주는 바로 이 도구가 있습니다.
단순한 텍스트 프롬프트 하나로 몇 초 만에 완성도 높은 모션 디자인을 만들어내는 이 기술이
업계에 지각변동을 일으키고 있습니다.

📱 Motion Magic AI인 Dora Studio는 어떻게 작동하나?

이 AI 도구의 가장 놀라운 점은 '자연어 대화'만으로 모든 작업이 완료된다는 것입니다.
복잡한 디자인 툴을 배울 필요도, 전문 지식도 필요 없습니다.
그저 원하는 것을 말하기만 하면 됩니다.

🔄 작동 프로세스 (3단계)

1. 대화하기
AI와 채팅하며 필요한 모션 그래픽을 일상 언어로 설명합니다.

2. 생성하기
AI가 요청을 처리하고 몇 분 안에 전문가 수준의 모션 그래픽을 생성합니다.

3. 다운로드
완성된 결과물을 다양한 포맷으로 다운로드하여 바로 프로젝트에 활용합니다.


💭 이것이 의미하는 것

전문 모션 디자이너가 몇 시간, 며칠씩 걸려 만들던 작업이 이제 몇 분으로 단축되었습니다.
이는 단순한 기술 발전이 아닌, 크리에이티브 산업 전체의 패러다임 전환을 예고합니다.

과연 디자이너만의 창의성과 감성은 AI 시대에도 그 가치를 유지할 수 있을까요?
아니면 우리는 완전히 새로운 형태의 창작 생태계를 맞이하게 될까요?

trydorastudio.com/

2. 100% 오픈소스로 구현한 완벽한 지침 준수 시스템, parlant

🤖 지침을 실제로 따르는 AI Agent 구축이 가능해졌습니다

프로덕션 환경에서 사용 가능한 AI Agent를 만들고 싶으신가요?
그런데 LLM이 지침을 제대로 따르지 않아 고민이셨나요?

이제 그 문제가 해결되었습니다.

새로 공개된 Python 라이브러리는 LLM이 여러분의 지침을 100% 따르도록 보장합니다.
완전한 오픈소스로 제공되어 누구나 무료로 사용할 수 있습니다.

더 이상 AI의 예측 불가능한 응답에 시달릴 필요가 없습니다.
실제 프로덕션 환경에서 신뢰할 수 있는 AI Agent를 지금 바로 구축하세요.

www.zdoc.app/ko/emcie-co/parlant

3. 🔍 Gemini의 숨겨진 3대 신기능 발견

구글 Gemini에서 아직 공개되지 않은 3가지 혁신적인 모드가 발견되었습니다.
이들은 AI 어시스턴트의 미래를 엿볼 수 있는 중요한 단서가 될 것으로 보입니다.


📱 발견된 3가지 히든 모드

1. Gemini GO - "함께 아이디어 탐색하기"
- 향후 Canvas 업그레이드와 연관될 가능성
- 새로운 앱 프로토타이핑 기능 지원 예상
- 사용자와 AI가 협업하여 아이디어를 구체화하는 도구로 발전 전망

2. Immersive View - "질문에 대한 시각적 답변 제공"
- Video Overviews 기능과 연계 가능성
- 이미지 기반 답변을 제공하는 새로운 형태의 인터페이스
- 복잡한 정보를 시각적으로 이해하기 쉽게 전달하는 혁신적 접근

3. Agent Mode - "자율적인 탐색, 계획 및 실행"
- 이미 일부 사용자들에게 목격된 기능
- ChatGPT의 Agent Mode와 유사한 작동 방식 예상
- AI가 독립적으로 작업을 수행하고 문제를 해결하는 차세대 기능


💡 이것이 의미하는 것

이번 발견은 구글이 단순한 대화형 AI를 넘어, 실제로 작업을 수행하고
창의적인 협업이 가능한 진정한 AI 파트너를 목표로 하고 있음을 보여줍니다.

특히 Agent Mode는 AI가 사용자를 대신해 복잡한 작업을 자율적으로
처리할 수 있는 미래를 암시하며, 이는 생산성 도구의 패러다임을
완전히 바꿀 수 있는 잠재력을 가지고 있습니다.

www.testingcatalog.com/google-tests-new-gemini-mod…

4. 🤖 Emergent, 진정한 자율 AI 에이전트 출시

Emergent가 독립적으로 사고하고 실행하는 자율 AI 에이전트를 공개했습니다.
이제 여러분이 원하는 작업을 자연어로 설명하기만 하면, 맞춤형 AI 에이전트가
스스로 판단하고 실행합니다.

💡 진짜 에이전트 vs 가짜 에이전트

현재 많은 플랫폼들이 단순히 프롬프트를 실행하는 도구를 "AI 에이전트"라고
부르고 있습니다. 하지만 Emergent는 명확한 기준을 제시합니다:

- 진짜 에이전트: 문제 발생 시 스스로 복구하고, 실행 중 계획을 유연하게 변경
- 가짜 에이전트: 정해진 워크플로우만 따르는 단순 자동화 도구

🚀 Emergent Pro의 핵심 기능

Emergent Pro는 Linux 가상머신(VM)과 인터넷 접속 기능을 갖춘 진정한
자율 에이전트를 구축합니다. 이는 실제 컴퓨터 환경에서 작업을 수행하며,
예상치 못한 상황에도 대응할 수 있다는 의미입니다.

📱 보너스: 자연어로 모바일 앱 개발

더욱 놀라운 점은 Emergent Pro를 통해 Android와 iOS 모바일 앱을
자연어로 개발할 수 있다는 것입니다. 코딩 지식 없이도 원하는 앱을
설명하면 AI가 직접 구현해줍니다.

🔮 시사점

Emergent의 등장은 AI 에이전트 시장의 새로운 기준을 제시합니다.
단순한 자동화를 넘어 진정한 자율성을 갖춘 AI 도구의 시대가 열리고 있습니다.

bit.ly/emergentai

5. 중국 저장대학교 연구진이 TINKER를 공개했습니다.

이 AI는 1~2장의 사진으로 3D 모델을 편집하며, 모든 각도에서 일관성을 유지하며 재훈련이 필요 없습니다.

어떤 시야도 동영상으로 변환 가능합니다.

5. 중국 저장대학교 연구진이 TINKER를 공개했습니다.

이 AI는 1~2장의 사진으로 3D 모델을 편집하며, 모든 각도에서 일관성을 유지하며 재훈련이 필요 없습니다.

어떤 시야도 동영상으로 변환 가능합니다.

프로젝트 페이지: aim-uofa.github.io/Tinker/

huggingface.co/papers/2508.14811

6. Perplexity의 스터디 모드 출시 예정

아직 공개되지 않았지만 Perplexity에 스터디 모드가 출시 예정이라고 합니다. 퀴즈 및 여러 형태로 공부를 할 수 있도록 UI를 제공해주네요.

아침마다 이메일로 편하게 받아보고 싶다면 뉴스레터를 구독해주세요.
aiadjunct.beehiiv.com/

3 months ago | [YT] | 16

AI 겸임교수 이종범

[AI 겸임교수 이종범] 오늘의 뉴스 (2025.08.24)
아침마다 이메일로 편하게 받아보고 싶다면 뉴스레터를 구독해주세요.
aiadjunct.beehiiv.com/

1.앤드류 응이 예측한 5가지 AI 기회: 2032년까지 13배 성장할 AI 시장의 비밀

앤드류 응(Andrew Ng)의 놀라운 예측 성공률
그는 2008년 딥러닝 혁명, 2011년 온라인 교육 붐, 2014년 중국의 AI 강세를 정확히 예측했습니다. 구글 브레인을 구축하고, 코세라를 공동 창업했으며, 바이두의 AI를 이끌었던 그는 800만 명의 학생을 가르쳤고, 현재 3억 7천만 달러 규모의 AI 펀드를 운용하고 있습니다.
앤드류 응이 예측하면 실리콘밸리가 주목합니다. 그가 최근 공개한 5가지 기회는 이전 그 어떤 것보다 더 많은 백만장자를 만들어낼 것이라고 합니다.


1. 에이전틱 AI가 모델 확장을 압도한다
에이전틱 AI 시장은 2032년까지 51억 달러에서 690억 달러로 폭발적으로 성장할 예정입니다. 7년 만에 13배 성장하는 셈입니다.
모두가 수십억 달러를 들여 거대 모델을 추구하는 동안, 응은 혁명적인 사실을 증명했습니다. 에이전틱 워크플로우를 갖춘 소형 모델이 거대 모델보다 뛰어난 성능을 보인다는 것입니다.
그가 제시한 4가지 설계 패턴:

반성(AI가 스스로를 비판)
도구 사용(API 연결)
계획 수립(복잡한 작업 분해)
다중 에이전트 협업

JP모건은 이미 이 방식으로 비용을 30% 절감했습니다.


2. 군사 AI가 차세대 골드러시다
2025년 2월, 응은 실리콘밸리를 놀라게 했습니다. "구글이 AI 무기에 대한 입장을 바꾼 것을 기쁘게 생각한다"고 말한 것입니다. 그의 포트폴리오 기업들은 이미 자율 드론으로 생명을 구하고 있습니다.


3. AGI는 아직 수십 년 남았다
AGI 달성 여부를 어떻게 알 수 있을까요? 응의 테스트는 간단합니다. "기업들이 모든 지식 노동자를 해고하기 전까지는 AGI가 도래하지 않은 것입니다." 그의 기업들은 화려하지 않지만 수익성 있는 문제에 집중하고 있습니다.


4. 중국이 오픈소스를 통해 지배할 것이다
"이제 중국이 AI에서 미국을 추월할 수 있는 길이 열렸습니다." 더 큰 모델을 통해서가 아니라 속도를 통해서입니다. 똑똑한 창업자들은 이미 중국의 오픈 모델을 10분의 1 비용으로 활용하고 있습니다.

5. 소형 특화 모델이 거대 모델을 이긴다
소형 언어 모델(SLM) 시장은 2032년까지 9억 3천만 달러에서 54억 5천만 달러로 성장합니다.
그 이유는 명확합니다:

토큰 가격이 90% 폭락
엣지 컴퓨팅의 폭발적 성장
2028년까지 엣지 컴퓨팅 지출이 3,780억 달러에 도달

변화는 지금 일어나고 있습니다.

2. GPT-5와 완벽 호환되는 Codex-CLI 0.23 업데이트

OpenAI가 Codex-CLI 0.23 버전을 공식 출시했습니다. 이번 릴리스의 가장 주목할 만한 변화는 ChatGPT Plus 사용자들의 사용 한도가 기존 대비 50% 증가했다는 점입니다.
새로운 버전은 다양한 개선사항을 포함하고 있으며, 특히 GPT-5와의 뛰어난 호환성을 자랑합니다. 이는 개발 커뮤니티, 특히 AI 기반 애플리케이션을 구축하는 개발자들에게 상당히 의미 있는 업데이트입니다.
생산성 향상과 더 많은 작업 처리가 가능해진 이번 업데이트를 통해, 개발자들은 더욱 효율적인 작업 환경을 구축할 수 있을 것으로 기대됩니다.

github.com/openai/codex/releases/tag/rust-v0.23.0

3. "기획서 쓰면 코드가 나온다" - Claude Code가 바꾸는 개발 프로세스

Claude Code PM (Product Manager)이 제품 개발 프로세스를 혁신적으로 자동화합니다.
이 도구는 제품 요구사항 문서(PRD)를 시작으로 에픽(Epic)으로 변환하고, 이를 다시 GitHub 이슈로 세분화한 뒤, 최종적으로 프로덕션 레벨의 실제 코드까지 생성합니다.

특히 주목할 점은 모든 단계에서 완벽한 추적 가능성(traceability)을 보장한다는 것입니다. 기획 단계의 요구사항이 어떻게 코드로 구현되었는지 전체 과정을 투명하게 확인할 수 있습니다.

무엇보다 이 강력한 도구가 100% 오픈소스로 제공되어, 누구나 자유롭게 사용하고 개선할 수 있다는 점이 인상적입니다.

github.com/automazeio/ccpm

4. AI 시스템 확장성의 비밀: 아무도 말하지 않는 LangGraph와 n8n의 진짜 역할

2025년 AI 시스템을 구축한다면 반드시 알아야 할 두 가지 도구가 있습니다: LangGraph와 n8n입니다.
이 선택이 여러분의 AI 시스템이 얼마나 확장 가능한지를 결정짓습니다. 지금부터 아무도 알려주지 않는 핵심 정보를 공개합니다.

먼저 명확히 해야 할 사실
LangGraph와 n8n은 일반적인 의미의 경쟁 도구가 아닙니다. 각각 다른 문제를 해결합니다. 하지만 이들의 역할을 잘못 이해한다면, AI 스택은 시작도 전에 무너질 것입니다.

n8n: 범용 워크플로우 자동화의 강자

개발자 중심의 Zapier라고 생각하면 됩니다
API, 데이터베이스, SaaS 앱을 연결합니다
드래그 앤 드롭으로 오케스트레이션이 가능합니다

최적 활용 분야: 자동화, 통합, ETL 파이프라인, "글루 코드"

LangGraph: AI 에이전트 전용 설계
AI 에이전트를 위해 특별히 제작된 도구입니다. 단순한 API 연결이 아닌, LLM이 여러 단계, 루프, 재시도, 상태를 거쳐 어떻게 생각하고 추론하며 행동할지를 제어합니다.
n8n이 Zapier라면, LangGraph는 AI 에이전트를 위한 ROS입니다.
올바른 활용 전략
"LangGraph와 n8n 중 무엇을 써야 하나요?"라는 질문에 대한 답은 명확합니다:
둘 다 사용하되, 스택의 다른 계층에서 활용하세요.

n8n이 빛나는 영역:

외부 서비스 연결
도구 간 데이터 이동
이벤트 기반 트리거
휴먼 인 더 루프 승인
비-AI 자동화
→ 인프라 접착제 역할

LangGraph가 빛나는 영역:

다중 에이전트 협업
메모리/상태 관리
재귀적 추론
복잡한 도구 호출
n8n에서는 작동하지 않을 에이전틱 워크플로우
→ 추론 엔진 역할

핵심 멘탈 모델
n8n으로 데이터를 이동시키고, LangGraph로 AI를 똑똑하게 만드세요.
이 조합으로 강력하고 유연하며 실제 프로덕션에 바로 적용 가능한 스택을 구축할 수 있습니다.

가장 흔한 실수
많은 개발자가 n8n만으로 에이전트 시스템을 구축하려 합니다. 간단한 데모에는 작동하지만, 루프나 상태 관리, 본격적인 추론이 필요한 순간 시스템은 붕괴됩니다. 이때 LangGraph가 필수가 됩니다.
반대로 LangGraph를 다음과 같은 작업에 사용하지 마세요:

이메일 가져오기
Slack 메시지 전송
Airtable 행 동기화

이런 작업은 n8n의 영역입니다.

2025년의 승리 공식
✅ LangGraph: AI 추론 계층
✅ n8n: 자동화 및 오케스트레이션 계층
이 둘을 적절히 조합하면, 잘못된 도구에 갇혀있는 90%의 팀들을 압도할 수 있습니다.
결론: 미래를 대비하는 플레이북
아무도 이야기하지 않는 이 스택 분리 전략이 바로 벽에 부딪히는 것과 실제 제품으로 확장하는 것의 차이를 만듭니다.
대부분의 사람들은 몇 달을 맹목적으로 실험하며 낭비합니다.
하지만 이제 여러분은 알고 있습니다:

n8n = 접착제
LangGraph = 두뇌
둘의 조합 = 확장성

이것이 바로 성공을 위한 플레이북입니다.

x.com/connordavis_ai/status/1959212761558466829

5. xAI Grok-2 오픈소스 전격 공개

일론 머스크가 이끄는 AI 기업 xAI가 자사의 최신 대규모 언어모델(LLM)인 Grok-2를 오픈소스로 공개하였습니다. GPT-oss를 염두한 공개가 아닌가 싶습니다.

특히 주목할 점은 Grok-2가 이전 버전인 Grok-1과 동일한 아키텍처를 채택했다는 것입니다. 이는 기존 Grok-1 사용자들이 새로운 버전으로 쉽게 전환할 수 있으며, 개발자들이 더욱 안정적으로 모델을 활용할 수 있다는 의미입니다.

현재 Grok-2의 전체 모델과 코드는 AI 개발자 커뮤니티의 중심지인 Hugging Face를 통해 누구나 무료로 다운로드하고 사용할 수 있습니다. 이번 공개는 OpenAI, Anthropic 등 주요 AI 기업들이 폐쇄적 접근을 유지하는 가운데 나온 것이어서 더욱 의미가 깊습니다.

huggingface.co/xai-org/grok-2

6. AI 자율 연구 시대를 위한 차세대 학술 플랫폼, aiXiv

핵심 요약
폭발적으로 증가할 AI 연구자들의 논문을 효율적으로 관리하기 위해, aiXiv는 사람과 AI가 협업하여 제출-리뷰-수정-출판 전 과정을 자동화하는 혁신적인 오픈액세스 플랫폼입니다.

왜 지금 이 플랫폼이 필요한가?
17세기부터 현재까지 인류가 축적한 과학 논문은 약 1.5-2억 편에 달합니다. 그러나 머지않은 미래에는 자율 AI 연구자들이 인간을 뛰어넘는 속도로 가설 설정, 실험 설계, 논문 작성까지 수행하게 됩니다. 이러한 변화가 본격화되면 기존의 저널, 컨퍼런스, 프리프린트 시스템은 폭증하는 논문 물량과 품질 관리 모두에서 심각한 한계에 직면할 것입니다.

aiXiv의 혁신적 해결책

멀티에이전트 연구 파이프라인: AI와 인간이 협력하여 논문을 제출하고, 구조화된 리뷰 과정을 거쳐 반복적으로 개선합니다. 제출→리뷰→개선→판정으로 이어지는 폐루프(Closed-loop) 시스템이 핵심입니다.

확장 가능한 개방형 구조: 다양한 AI 에이전트와 도구들이 자유롭게 연결될 수 있도록 API와 MCP(Model Control Protocol) 인터페이스를 제공합니다. 생태계 차원의 확장성을 염두에 둔 설계가 기존 플랫폼과의 결정적 차이점입니다.

고도화된 리뷰 시스템: 단일 리뷰부터 분야별 메타리뷰까지 구조화된 기준으로 실행 가능한 피드백을 생성합니다. RAG(검색증강생성) 기술로 관련 문헌을 근거로 활용하여 AI의 할루시네이션을 최소화합니다.

강력한 보안 체계: 리뷰 조작을 시도하는 프롬프트 인젝션(숨김 텍스트, 메타데이터 조작, 다국어 변형 등)을 다단계 탐지 파이프라인으로 식별하고 차단합니다.

공정한 심사 메커니즘: 5개의 서로 다른 최상위 AI 모델이 독립적으로 심사하여, 3개 이상이 'Accept'를 내릴 경우 게재됩니다. 게재 시 DOI가 부여되며 명확한 지적재산권 귀속도 보장됩니다.

실질적 성과와 미래 전망
실제 실험 결과, aiXiv의 리뷰-수정 반복 과정을 거친 논문들의 품질이 통계적으로 유의미하게 향상되었으며, 다중 AI 투표에서도 수용률이 크게 증가했습니다.
기존의 인간 리뷰어 중심 시스템과 달리, aiXiv는 대규모 처리 능력과 일관된 품질 기준을 동시에 달성합니다. 특히 체계적으로 설계된 워크플로는 대규모 자율 연구 생태계 운영에 필요한 핵심 모듈들을 명확히 분리하고 연결합니다.

다가올 미래의 청사진
머지않아 AI가 생산하는 연구 콘텐츠가 인류 역사상 축적된 모든 과학 지식을 압도하게 될 것입니다. aiXiv는 이 거대한 지식의 파도를 **열린 접근(Open Access)**과 체계적 품질 관리를 통해 인류 공동의 자산으로 전환하는 핵심 인프라가 되고자 합니다.

arxiv.org/pdf/2508.15126

7. 구글이 직접 알려주는 Veo3 프롬프트 가이드

이번 주말 한정으로 모든 사용자가 Gemini에서 Veo3 비디오를 3개까지 무료로 생성할 수 있습니다.

시작하는 두 가지 방법
gemini.google.com 접속
1. 새 채팅 시작 → 도구 메뉴에서 '비디오' 선택 → 프롬프트 입력
2. 사진을 업로드하여 비디오로 변환

Gemini가 생성하는 결과물
- 8초 길이의 비디오
- 사운드/오디오 포함
- 공유 가능한 링크 제공
- 다운로드 가능한 파일 (모바일 한정)

프롬프트 작성 전략

기본 접근법
간단한 1-2문장 프롬프트로도 충분하지만, 더 구체적인 결과를 원한다면 다음 요소들을 추가하세요:
- 구도: 샷 프레이밍 (와이드샷, 클로즈업, 로우앵글)
- 스타일: 전체적인 미적 요소 (3D, 다큐멘터리 스타일 등)

Mad Lib 방식의 프롬프트 구조
"Create a video that shows..."
- 스타일: [비디오 미학]
- 주체: [캐릭터 설명]
- 행동: [주체가 하는 일]
- 장면: [위치 설정]
- 오디오: [대사 내용]
- 음향 효과: [음성/음악 설명]

사운드 디자인 팁
- 대화: 따옴표를 사용해 캐릭터의 대사 지정
- 음향 효과: "파도 소리가 배경에서 들리는" 같은 구체적 설명
- 음악: 원하는 장르나 스타일 명시
- 노래: 캐릭터가 부를 음악 스타일 지정 (웨스턴, 랩 등)
- 억양: 특정 억양이 필요하면 명확히 언급

사진을 비디오로 변환할 때
- 고품질 이미지 사용 = 더 나은 결과
- 움직임이 명확한 이미지 선택 (자동차, 로켓, 기차, 사람의 동작 순간 등)
- 장면에 누군가 걸어 들어오도록 프롬프트 작성하여 상호작용 생성

동물 관련 프롬프트 팁
- 사실적 표현: "realistic animal" 또는 "documentary style" 포함
- 의상: 과도한 의상은 만화 같은 느낌을 줄 수 있음
- 대화: "lips perfectly sync" 추가 또는 구체적 대사 없이 Gemini가 채우도록 설정
- 손: 동물이 저글링이나 악기 연주 시 사람 손이 나올 수 있으니 "animal hands" 명시

문제 해결 방법
이상한 결과가 나왔다면 새 탭에서 Gemini에게 프롬프트를 공유하고,
무엇이 문제인지 설명한 후 원하는 결과를 얻기 위한 도움을 요청하세요.

8. 퍼플렉시티 PRO 사용자들에게 GPT-5 Thinking 모드 공개

퍼플렉시티에서 PRO 사용자들에게 GPT-5 Thinking 모드를 공개했습니다.
이제 퍼플렉시티에서도 GPT-5 Thinking을 통해서 추론을 할 수 있습니다

9. KLING 2.1 대규모 업데이트: Start & End Frames 기능 정식 출시

영상 크리에이터들이 손꼽아 기다려온 순간이 드디어 찾아왔습니다!
KLING 2.1에 Start & End Frames(시작 및 종료 프레임) 기능이 정식으로 추가되었습니다. 이번 업데이트의 핵심은 바로 '모든 프레임의 완벽한 제어(Every Frame in Control)'입니다.

📊 놀라운 성능 향상

이전 버전(1.6) 대비 235%의 성능 개선 달성
업계 최고 수준의 처리 속도와 품질 구현

🎯 주요 활용 사례
✅ 씬 전환의 혁명: 서로 다른 장면과 씬 간의 매끄러운 연결
✅ 블록버스터급 특수효과: 할리우드 수준의 시각 효과 구현 가능
✅ 창의적인 브랜드 콘텐츠: 제품 및 브랜드를 돋보이게 하는 독창적인 영상 제작
✅ 시네마틱 카메라 워크: 복잡하고 역동적인 카메라 움직임 완벽 구현

이제 시작 프레임과 종료 프레임을 정확하게 지정하여, 원하는 영상 전환과 효과를 자유자재로 만들어낼 수 있습니다.

클링: bit.ly/klingaiv

아침마다 이메일로 편하게 받아보고 싶다면 뉴스레터를 구독해주세요.
aiadjunct.beehiiv.com/

3 months ago | [YT] | 16