01. OpenAI, 100만 토큰 컨텍스트 탑재한 GPT-5.4 공개
OpenAI가 3월 5일 최신 플래그십 모델 GPT-5.4를 공식 발표했습니다. 가장 큰 변화는 API와 Codex에서 최대 100만 토큰의 컨텍스트 윈도우를 지원한다는 점입니다. 이는 약 75만 단어, 해리포터 시리즈 7권 전체를 한 번에 프롬프트에 넣을 수 있는 분량에 해당합니다.
GPT-5.4는 단순한 모델 업데이트가 아닙니다. OpenAI의 범용 모델 중 최초로 네이티브 컴퓨터 사용(Computer Use) 기능을 탑재했습니다. 브라우저를 제어하고, 데스크톱 애플리케이션을 조작하며, 복잡한 다단계 워크플로우를 자율적으로 실행할 수 있습니다. 컴퓨터 사용 능력을 측정하는 OSWorld 벤치마크에서 75%를 기록하며 인간 기준선(72.4%)을 넘어섰습니다.
또한 Tool Search라는 새로운 기능이 도입되었습니다. 기존에는 모든 도구 정의를 프롬프트에 미리 포함해야 했지만, 이제는 모델이 필요한 시점에 도구 정의를 검색하여 가져옵니다. OpenAI는 이 방식으로 총 토큰 사용량이 약 47% 감소했다고 밝혔습니다.
정확도 측면에서도 GPT-5.2 대비 개별 주장의 오류율이 33% 감소했고, 전체 응답 기준으로는 18% 더 적은 오류를 보였습니다. 가격은 단축 컨텍스트 기준 입력 100만 토큰당 약 $2.50, 출력 $15부터 시작하며, 272K 토큰 초과 시 할증이 적용됩니다.
GPT-5.4는 100만 토큰 컨텍스트와 네이티브 컴퓨터 사용 기능을 결합하여, 단순 질의응답을 넘어 작업을 자율 실행하는 에이전트로 진화한 모델입니다.
02. Google, 오픈소스 모델 Gemma 4 시리즈 출시
Google DeepMind가 4월 2일 최신 오픈소스 AI 모델 Gemma 4를 공개했습니다. Gemma 시리즈 사상 처음으로 Apache 2.0 라이선스를 적용하여, 상업적 사용, 수정, 재배포에 아무런 제한이 없습니다.
Gemma 4는 Google의 자사 최강 모델인 Gemini 3과 동일한 연구 기술을 기반으로 구축되었으며, 4가지 사이즈로 제공됩니다. E2B(유효 2B)는 스마트폰이나 Raspberry Pi에서 완전 오프라인 구동이 가능하고, E4B(유효 4B)는 좀 더 높은 성능이 필요한 엣지 환경에 적합합니다. 26B A4B는 전체 26B 파라미터 중 추론 시 3.8B만 활성화하는 혼합 전문가(MoE) 모델이며, 31B Dense는 라인업 중 가장 강력한 밀집 모델로 파인튜닝에 특히 적합합니다.
성능 면에서 이전 세대와 비교할 수 없을 만큼 도약했습니다. 31B 모델은 수학 벤치마크 AIME에서 20.8%→89.2%, 코딩 벤치마크 LiveCodeBench에서 29.1%→80.0%로 급등했습니다. 26B MoE 변형은 자신보다 20배 큰 모델들을 능가하는 결과를 보여주었습니다.
모든 사이즈에서 텍스트와 이미지 입력을 처리할 수 있고, 엣지 모델은 음성 인식까지 지원합니다. 에이전트 워크플로우를 위한 네이티브 함수 호출, JSON 출력, 다단계 추론 기능을 기본 탑재하고 있어서, 개인 개발자도 노트북 한 대로 고성능 AI 에이전트를 구축할 수 있게 되었습니다. Hugging Face, Kaggle, Ollama, Google AI Studio에서 바로 사용할 수 있습니다.
Apache 2.0 라이선스로 완전 개방된 Gemma 4는, 스마트폰부터 데이터센터까지 어디서든 구동 가능한 역대 가장 강력한 오픈소스 AI 모델 시리즈입니다.
03. 뉴로-심볼릭 AI, 에너지 소비 100배 절감하며 정확도는 오히려 향상
미국 터프츠 대학교 공과대학의 Matthias Scheutz 교수 연구팀이 AI의 에너지 소비를 최대 100배까지 줄이면서도 정확도를 크게 높이는 뉴로-심볼릭(neuro-symbolic) AI 시스템을 개발했습니다. 이 연구는 2026년 6월 비엔나에서 열리는 ICRA 2026에서 발표될 예정입니다.
뉴로-심볼릭 AI는 기존 신경망의 패턴 인식 능력에 인간처럼 문제를 단계별로 분해하고 규칙을 적용하는 심볼릭 추론을 결합한 하이브리드 방식입니다. 기존의 LLM이나 VLA 모델이 통계적 패턴 매칭에만 의존하는 것과 근본적으로 다른 접근법입니다.
하노이 탑 퍼즐 실험에서 뉴로-심볼릭 VLA는 95%의 성공률을 기록한 반면, 기존 VLA는 34%에 그쳤습니다. 학습하지 않은 복잡한 버전에서도 78%를 달성했지만, 기존 모델은 전부 실패했습니다. 학습 시간은 36시간 이상에서 34분으로 단축되었고, 학습 에너지는 기존의 1%, 추론 에너지는 5%만 사용했습니다.
Scheutz 교수는 현재 AI의 비효율성을 이렇게 설명했습니다. Google 검색 상단의 AI 요약 하나가 아래 웹사이트 목록 생성보다 최대 100배 더 많은 에너지를 소모한다는 것입니다. IEA에 따르면 미국의 AI 시스템과 데이터 센터는 2024년 기준 약 415TWh의 전력을 소비했으며, 이는 미국 전체 전력 생산의 10%를 넘는 수치입니다.
학습 에너지 1%, 추론 에너지 5%만으로 기존보다 3배 높은 성공률을 달성 — 뉴로-심볼릭 AI는 AI 지속가능성 문제의 실질적 해결책으로 부상하고 있습니다.
출처
→ OpenAI 공식 블로그: https://openai.com/index/introducing-gpt-5-4/
→ TechCrunch: https://techcrunch.com/2026/03/05/openai-launches-gpt-5-4-with-pro-and-thinking-versions/
→ DataCamp: https://www.datacamp.com/blog/gpt-5-4
→ Google Blog: https://blog.google/innovation-and-ai/technology/developers-tools/gemma-4/
→ Google DeepMind: https://deepmind.google/models/gemma/gemma-4/
→ Analytics Vidhya: https://www.analyticsvidhya.com/blog/2026/04/googles-gemma-4-open-source-model/
→ ScienceDaily: https://www.sciencedaily.com/releases/2026/04/260405003952.htm
→ Tufts Now: https://now.tufts.edu/2026/03/17/new-ai-models-could-slash-energy-use-while-dramatically-improving-performance
→ Nerd Level Tech: https://nerdleveltech.com/neuro-symbolic-ai-cuts-robot-energy-use
'AI 뉴스' 카테고리의 다른 글
| 2026.04.16 AI 뉴스 (1) | 2026.04.16 |
|---|---|
| 2026.04.15 AI 뉴스 (1) | 2026.04.15 |
| 2026.04.13 AI 뉴스 (0) | 2026.04.13 |
| 2026.04.08 AI 뉴스 (0) | 2026.04.08 |
| 2026.04.02 AI 관련 뉴스 (0) | 2026.04.02 |