The Information에 따르면 Microsoft와 OpenAI가 공동 데이터 센터 프로젝트를 계획하고 알려졌다. 이 프로젝트는 2028년까지 Stargate라는 이름의 대규모 인공지능 슈퍼컴퓨터를 출시하는 것으로 마무리 될 것으로 알려졌다. OpenAI용 소형 슈퍼컴퓨터를 개발과 AI 칩 개발 등 프로젝트 예산이 천 억원을 초과할 수 있다고 예상하고 있다. 프로젝트 재정적 부담의 대부분을 짊어질 것으로 예상되는 Microsoft의 자본 지출이 전년도 인프라 지출을 훨씬 초과할 수 있다고 보여진다.
GPT-5
openAI CEO 샘 알트만은 세계정부정상회의에서 곧 출시될 GPT-5가 잠재적으로 인간 수준의 지능에 접근할 수 있다 설명한 바 있다. GPT-5는 멀티모달 LLM으로 예상되고, 데모에 따르면 고대 언어를 해석하는 모습을 볼 수 있었다고 한다. GPT-5는 현재 학습 중이며 출시 날짜는 공개되지 않았지만 올해 안에 출시될 예정이라 전해진다.
Databricks가 새로운 open LLM을 공개했다. MoE 아키텍쳐로 효율성을 향상시켰으며 추론 속도는 LLaMA2-70B보다 최대 2배 빠르고 Grok-1 대비 40% 크기가 작다. 성능은 표준 벤치마크에서 GPT-3.5와 Gemini 1.0 Pro 와 경쟁이 가능한 SOTA 모델이다.
기존 한국어 언어모델의 벤치마크에서 한계점을 보아 제작했다고 한다. 8개의 카테고리에 대한 질문 10개씩을 LLM에게 주고 답변을 얻은 뒤, GPT-4를 이용해 평가하는 LLM-as-a-judge 라는 LLM 기반의 평가를 진행하는 MT-Bench를 참고해 다양한 주제에서의 사고력에 중심을 두고 제작했다고 한다. 주제는 총 6가지로 추론, 수학, 글쓰기, 코딩, 이해, 문법이고 각 주제에 대해 7가지의 멀티턴 질문을 제작했다.