AI News
AI news is auto-collected and posted every morning at 9 AM KST.
Anthropic Partner Network: $100M to Lock In Enterprise Before the War Starts
Anthropic launched the Claude Partner Network on March 12, committing $100M to embed Claude into enterprise workflows via major consulting firms—even as the company fights a Pentagon supply-chain designation.
Gemini Hits 750M Users—Then Google SVP Says Ads Are On the Table
Google's Gemini surpassed 750 million monthly active users. One day later, SVP Nick Fox told Wired the company isn't ruling out ads—directly contradicting DeepMind CEO Demis Hassabis's assurances from weeks earlier.
Nvidia GTC 2026: Rubin Architecture and NemoClaw Signal the Next Phase of AI Infrastructure
Nvidia GTC 2026 opens March 16 in San Jose with Jensen Huang's keynote expected to reveal the Rubin GPU architecture (288GB HBM4) and NemoClaw, an open-source enterprise agent platform. The conference marks a pivot toward CPU-centric agentic AI compute.
Anthropic, 트럼프 행정부를 상대로 소송 제기 — 'Supply Chain Risk' 지정 철회 요구와 Code Review 동시 출격
Anthropic이 미 국방부의 'Supply Chain Risk' 지정에 대해 연방법원에 소송을 제기했습니다. 같은 날 Claude Code Review를 출시하며 엔터프라이즈 시장 공략을 가속화하고 있습니다. OpenAI·Google 직원 37명이 Anthropic을 지지하는 법정 의견서를 제출했습니다.
Apple M5 Pro/Max 발표 — LLM 프롬프트 처리 속도 4배, 로컬 AI의 새로운 기준
Apple이 M5 Pro와 M5 Max를 발표했습니다. Fusion Architecture로 LLM 프롬프트 처리 속도가 M4 대비 최대 4배 빨라졌고, GPU 코어마다 Neural Accelerator를 내장했습니다. M5 Max는 128GB 통합 메모리와 614GB/s 대역폭으로 70B 파라미터급 모델을 로컬에서 구동할 수 있습니다.
Browser Use — AI가 브라우저를 직접 조작하는 시대, 8만 스타의 구조를 파헤치다
Browser Use는 AI 에이전트가 웹 브라우저를 직접 조작할 수 있게 해주는 오픈소스 프로젝트입니다. 8만 스타를 넘긴 이 프로젝트는 Playwright 위에 LLM 레이어를 얹어, DOM 파싱부터 클릭, 입력, 스크롤까지 자율적으로 수행합니다. 프로젝트 구조와 브라우저 에이전트의 핵심 기술을 분석합니다.
DeerFlow — ByteDance가 공개한 2.8만 스타 SuperAgent 하네스의 아키텍처
ByteDance의 DeerFlow는 AI 에이전트에게 샌드박스 실행, 영구 메모리, 서브 에이전트 생성 능력을 제공하는 오픈소스 SuperAgent 하네스입니다. LangGraph 기반의 에이전트 오케스트레이션과 Docker 샌드박스 아키텍처, 그리고 확장 가능한 스킬 시스템의 설계를 분석합니다.
Dify — 13만 스타 에이전트 플랫폼의 아키텍처를 뜯어보다
Dify는 LLM 애플리케이션을 시각적으로 구축할 수 있는 오픈소스 에이전트 플랫폼입니다. 13만 스타를 넘긴 이 프로젝트는 RAG, 에이전트 워크플로, 도구 호출을 하나의 플랫폼에 통합합니다. Next.js 프론트엔드와 Flask 백엔드의 구조, 그리고 에이전트 아키텍처의 핵심 개념을 분석합니다.
Firecrawl — 웹 전체를 LLM이 읽을 수 있는 마크다운으로 바꾸는 9만 스타 프로젝트
Firecrawl은 웹사이트를 LLM이 소화할 수 있는 깨끗한 마크다운으로 변환하는 웹 데이터 API입니다. 9만 스타를 돌파한 이 프로젝트는 TypeScript로 작성되어 있으며, JavaScript 렌더링, 구조화된 데이터 추출, 대규모 크롤링을 지원합니다. 프로젝트 구조와 웹 크롤링 → AI 파이프라인의 핵심 기술을 다룹니다.
Karpathy의 autoresearch — 630줄 Python으로 GPU 한 장이 밤새 100개 실험을 돌린다
Andrej Karpathy가 autoresearch를 오픈소스로 공개했습니다. AI 에이전트가 GPU 한 장으로 자율적으로 ML 실험을 수행하는 630줄짜리 Python 프로젝트입니다. 하룻밤에 약 100개 실험을 실행하며, Shopify CEO가 내부 적용해 19% 성능 향상을 보고했습니다.
nanochat — Karpathy가 보여주는 '$100으로 ChatGPT 만들기'의 전체 파이프라인
Andrej Karpathy의 nanochat은 $100, 2시간이면 GPT-2 수준의 LLM을 처음부터 훈련할 수 있는 프로젝트입니다. 토크나이저부터 사전 훈련, SFT, 평가, 채팅 UI까지 LLM의 전체 파이프라인을 하나의 코드베이스에 담았습니다. 4.6만 스타를 기록한 이 프로젝트의 구조와 LLM 훈련의 핵심 개념을 분석합니다.
MiroFish — 1.3만 스타 군집 지능 엔진이 '미래 예측'을 시뮬레이션하는 법
MiroFish는 멀티 에이전트 군집 지능(Swarm Intelligence)으로 사회·경제 시나리오를 시뮬레이션하는 예측 플랫폼입니다. 수천 개의 자율 에이전트가 독립된 성격과 메모리를 갖고 '디지털 평행 세계'를 구성합니다. GraphRAG 기반 지식 그래프와 멀티 에이전트 시뮬레이션 아키텍처를 분석합니다.
Ollama — Go로 만든 로컬 LLM 인프라가 16만 스타를 찍기까지
Ollama는 Go로 작성된 로컬 LLM 실행 도구로, 2026년 3월 기준 GitHub 16만 스타를 돌파했습니다. 단순한 CLI 래퍼가 아니라, GGUF 모델 포맷 위에 자체 모델 레지스트리와 REST API 서버를 올린 완전한 로컬 AI 인프라입니다. 이 글에서는 Ollama의 프로젝트 구조, 핵심 기술, 그리고 로컬 LLM을 이해하기 위한 기반 지식까지 다룹니다.
promptfoo — LLM 앱의 보안을 테스트하는 1.1만 스타 레드팀 도구
promptfoo는 LLM 앱의 프롬프트, 에이전트, RAG 시스템을 테스트하고 레드팀 공격을 수행하는 오픈소스 CLI 도구입니다. 1.1만 스타를 기록한 이 TypeScript 프로젝트의 구조와 LLM 보안 테스트의 핵심 개념을 분석합니다.
RAGFlow — 문서 파싱부터 하이브리드 검색까지, 7만 스타 RAG 엔진의 전체 구조
RAGFlow는 엔드투엔드 RAG 엔진으로, 문서 파싱, 지능형 청킹, 하이브리드 검색, LLM 생성까지 전체 파이프라인을 제공합니다. 7만 스타를 넘긴 이 프로젝트의 아키텍처와 RAG의 핵심 기술인 청킹 전략, 벡터 검색, 리랭킹을 심층 분석합니다.
Superpowers — 7.6만 스타, AI 코딩 에이전트에게 '개발 방법론'을 가르치는 프레임워크
Superpowers는 Claude Code 같은 AI 코딩 에이전트에게 TDD, 코드 리뷰, 체계적 계획이라는 개발 방법론을 강제하는 스킬 프레임워크입니다. 7.6만 스타를 기록한 이 프로젝트의 구조와, '에이전트에게 프로세스를 가르치면 코드 품질이 올라간다'는 핵심 가설을 분석합니다.
vLLM — PagedAttention으로 LLM 추론 성능을 2~4배 끌어올린 서빙 엔진
vLLM은 UC Berkeley에서 시작된 고성능 LLM 추론 및 서빙 엔진입니다. PagedAttention이라는 혁신적인 메모리 관리 기법을 도입해 기존 대비 2~4배 높은 처리량을 달성했습니다. 7만 스타를 넘긴 이 프로젝트의 아키텍처와 핵심 기술을 분석합니다.
ChatGPT 대탈출 — Claude가 미국 앱스토어 1위에 올랐고, 서버가 견디지 못했다
OpenAI의 Pentagon 계약 이후 대규모 사용자 이탈이 발생했습니다. Anthropic의 Claude가 미국 앱스토어 1위에 올랐지만, 급증한 트래픽에 글로벌 장애가 발생했습니다. 일일 가입자 기록 경신, 유료 구독자 2배 이상 증가 등 전례 없는 성장세입니다.
Gemini를 복제하려는 10만 건의 프롬프트 공격 — AI 모델 보안의 새로운 전쟁터
Google이 Gemini AI를 복제하려는 대규모 공격을 공개했습니다. 10만 건 이상의 프롬프트로 내부 추론 과정을 추출하려는 시도였으며, 북한·러시아·중국 등에서 발원한 것으로 추정됩니다. AI 모델 보안이 새로운 사이버 보안 영역으로 부상하고 있습니다.
OpenAI 로보틱스 리더 사임 — Pentagon 계약의 파장이 내부로 번지다
OpenAI의 로보틱스 하드웨어 리더 Caitlin Kalinowski가 Pentagon 계약에 항의해 사임했습니다. '감시와 자율 무기에 대한 가드레일 없이 계약이 서둘러 발표됐다'는 것이 사임 이유입니다. OpenAI 내부에서 군사 AI 계약에 대한 균열이 표면화되고 있습니다.
Qwen 3.5 Small 시리즈 — 4B 모델이 노트북에서 GPT-OSS-120B를 이기다
Alibaba가 Qwen 3.5 Small 시리즈(0.8B~9B)를 오픈소스로 공개했습니다. 4B 모델이 262K 컨텍스트와 멀티모달을 지원하며 8GB VRAM으로 구동됩니다. 9B 모델은 자신보다 13배 큰 GPT-OSS-120B를 다수 벤치마크에서 능가합니다.
Anthropic CEO, 'Claude가 의식이 있을 수 있다' — AI 도덕적 지위 논쟁의 시작
Anthropic CEO Dario Amodei가 Claude의 의식 가능성을 공개적으로 언급했습니다. 동시에 중국 AI 랩 3곳이 24,000개 사기 계정으로 Claude를 무단 사용한 것이 적발됐고, 전례 없는 수요로 서비스 장애도 발생했습니다.
Gemini 3.1 Pro, 115개 모델 중 벤치마크 1위 — Apple도 Siri에 Gemini를 선택했다
Google DeepMind의 Gemini 3.1 Pro가 Artificial Analysis Intelligence Index에서 115개 모델 중 1위를 차지했습니다. Apple은 Siri 업그레이드에 1.2조 파라미터 Gemini 모델을 채택했고, AI Mode Canvas가 미국 전체로 확대됐습니다.
GLM-5, NVIDIA 없이 오픈소스 1위 달성 — Phi-4, Qwen3.5까지, 오픈소스 LLM 경쟁이 뜨겁다
Zhipu AI의 GLM-5가 Huawei 칩만으로 훈련해 SWE-bench 오픈소스 1위를 기록했습니다. Microsoft는 15B 멀티모달 모델 Phi-4를, Alibaba는 Qwen3.5를 공개했습니다. 오픈소스 LLM 경쟁이 새로운 국면에 진입했습니다.
OpenAI GPT-5.4 출시 — 1M Context, Computer-Use 탑재, 그리고 GPT-4o부터 GPT-5까지 대량 은퇴
OpenAI가 GPT-5.4를 출시했습니다. 1M token context, native computer-use, OSWorld 인간 초과 성능을 기록했습니다. 동시에 GPT-4o부터 GPT-5까지 대규모 레거시 모델 은퇴가 진행됩니다.
MCP가 AI의 USB-C가 됐다 — OpenAI, Microsoft, Google 모두 채택한 Anthropic의 프로토콜
Anthropic이 만든 Model Context Protocol(MCP)을 OpenAI, Microsoft, Google이 모두 채택했습니다. AI 모델과 외부 도구를 연결하는 사실상의 업계 표준이 된 것입니다.
Opus 4.6 기본 모델 전환, Sonnet 4.6 1M Context 베타 — Anthropic 모델 라인업 전면 교체
Anthropic이 모델 라인업을 대폭 교체했습니다. Opus 4.6가 기본 모델이 되고, Opus 4/4.1은 퇴역합니다. Sonnet 4.6는 1M token context를 베타로 제공하며, Cowork 기능이 Pro 사용자에게 공개됐습니다.
미 국방부, Anthropic을 'Supply Chain Risk'로 공식 지정 — AI 안전과 국가 안보의 첫 정면충돌
DOD가 Anthropic을 supply chain risk로 지정했습니다. 자율 무기와 대규모 감시에 Claude 활용을 거부한 것이 원인입니다. Anthropic은 법적 대응을 예고했고, 클라우드 3사는 비국방 고객 지원을 계속하겠다고 밝혔습니다.
AI News 자동 포스팅 시스템 가동
매일 아침 9시, Claude/Gemini/GPT 등 주요 LLM 소식을 자동으로 수집하고 포스팅한다.