마이크로소프트, 새로운 생성형 AI 모델 Phi-4 출시
마이크로소프트가 새로운 생성형 AI 모델, Phi-4를 공개했습니다. Phi-4는 마이크로소프트의 파이(Phi) AI 모델 시리즈에서 가장 최근에 추가된 모델로, 이전 모델에 비해 많은 부분에서 성능이 향상되었어요. 특히 수학 문제 해결 능력이 크게 개선되었다고 합니다. 이를 가능하게 한 주된 이유는 학습 데이터의 품질이 개선되었기 때문이라고 마이크로소프트는 밝혔습니다.
Phi-4, 그 성능은 어떻게 달라졌나?
Phi-4는 140억 개의 매개변수를 기반으로 한 소형 언어 모델로, GPT-4o mini, Gemini 2.0 Flash, Claude 3.5 Haiku와 같은 다른 소형 모델들과 경쟁할 수 있는 성능을 자랑합니다. 소형 AI 모델은 상대적으로 빠르고 저렴하게 실행할 수 있어, 많은 기업과 연구자들이 이 모델을 선호하게 되죠. Phi-4는 성능이 향상되었을 뿐만 아니라, 고품질의 사람이 생성한 콘텐츠와 합성 데이터 세트를 사용한 덕분에 더욱 강력한 능력을 보여줍니다.
특히, 이 모델은 Azure AI Foundry라는 개발 플랫폼을 통해 매우 제한적인 환경에서만 사용할 수 있습니다. 즉, 현재는 연구 목적으로만 접근할 수 있으며, 일반 대중에게는 공개되지 않았습니다. 이런 제한적인 접근은 연구자들에게 더 정밀한 실험과 분석을 가능하게 하여, AI 기술의 발전에 중요한 역할을 할 것입니다.
합성 데이터와 후속 훈련의 혁신
Phi-4의 성능 향상에는 합성 데이터와 후속 훈련 과정이 중요한 역할을 했습니다. 요즘 많은 AI 연구소가 합성 데이터의 활용 가능성에 대해 연구하고 있으며, 그 결과로 AI 모델의 성능을 크게 끌어올릴 수 있는 가능성을 보여주고 있습니다. 스케일 AI의 CEO인 알렉산드르 왕은 최근 트위터에서 "우리는 사전 훈련 데이터 장벽에 도달했다"며, 합성 데이터와 사후 훈련의 중요성에 대해 언급했습니다. 이는 기존의 훈련 데이터의 한계를 넘어서는 새로운 길을 열 수 있다는 뜻이죠.
Phi-4, 새로운 시대를 열다
이번 Phi-4 모델은 마이크로소프트 AI 부사장인 세바스티앙 뷔벡이 회사를 떠난 이후에 출시된 첫 번째 Phi 시리즈 모델입니다. 뷔벡은 지난 10월에 마이크로소프트를 떠나 오픈AI로 이직했기 때문에, Phi-4는 그의 부재 이후 개발된 첫 번째 모델입니다. 이 모델은 마이크로소프트의 AI 연구와 개발이 계속해서 혁신을 이루고 있음을 보여주는 중요한 이정표로 볼 수 있습니다.
Phi-4는 수학 문제 해결 뿐만 아니라 다양한 언어적 도전 과제를 해결하는 데 있어 이전보다 월등히 뛰어난 성능을 보입니다. 이는 특히 AI 기술이 실제로 우리 생활에 어떻게 적용될 수 있는지를 보여주는 좋은 사례가 될 것입니다. 연구자들과 개발자들이 Phi-4를 활용해 AI 기술을 더욱 발전시키고, 다양한 산업에 실제로 어떻게 적용할 수 있을지에 대한 기대감도 커지고 있습니다.
이처럼 마이크로소프트는 Phi-4를 통해 소형 AI 모델의 가능성을 한 단계 끌어올렸습니다. 앞으로 이 모델이 어떤 분야에서 어떻게 활용될지, 그리고 AI 기술이 우리 생활에 어떤 변화를 가져올지 매우 기대됩니다.