Written by 기획자J
Meta, Google, Microsoft와 같은 빅테크 기업들은 최고의 언어 모델을 개발하기 위해 치열한 경쟁을 벌이고 있다. LLM이라 부르는 언어 모델은 대규모 텍스트 데이터 세트에서 얻은 지식을 기반으로 텍스트와 다양한 콘텐츠를 인식하고 요약, 번역, 예측, 생성할 수 있는 딥러닝 알고리즘이다. 대규모 언어모델은 방대한 양의 데이터를 이용해 학습을 한다. 인터넷에서 작성된 거의 모든 것을 망라할 만큼 엄청나게 큰 데이터 세트에 의해 훈련되면서 진화 중이다. Meta의 'LLaMA', Google의 'Bard', Microsoft의 'Cosmos-1'이 이를 주도하는 등 각 회사는 저마다의 전략으로 LLM을 개발하고 있다.
Meta는 2022년에 'Galaxica'라는 언어 모델을 도입했다. 이 모델은 과학 콘텐츠에 중점을 두고 약 4,800만 권의 교과서, 강의 노트, 백과사전을 사용하여 학습되었다. 그러나 Galactica는 부정확하다는 비판을 받았고 Meta는 서비스를 중단해야만 했다. 2023년 2월, 메타는 'LLaMA'라는 새로운 모델을 출시했다. Galactica와 달리 LLaMA는 오픈 소스 언어 모델로 시장에 선보였다. 누구나 LLaMA를 사용하여 챗봇이나 검색 엔진과 같은 자신만의 도구를 만들 수 있는 점이 큰 소구 포인트로 내세웠다. 세계에서 가장 일반적으로 사용되는 20개 언어의 텍스트로 훈련되어 다재다능하고 강력해졌다.
Google은 'Lambda'라는 모델을 시작으로 수년간 언어 모델을 개발해 왔다. 람다는 AI 연구에 널리 활용되는 '트랜스포머(Transformer)' 시리즈의 심층신경망을 기반으로 한다. 이 모델은 기계가 인간처럼 의사소통하고 광범위한 주제를 학습할 수 있도록 설계되었다. 2021년에 출시된 람다는 특히 자연스러운 대화를 다루는데 성능이 좋았다. 이후 구글은 'GEMINI'라는 새로운 언어 모델을 만들었다. 2024년 2월, Google은 GEMINI를 AI 챗봇인 'Bard'에 통합하여 Google AI 생태계의 필수적인 부분이 되고 있는 더욱 발전된 시스템을 만들었다.
마이크로소프트는 GPT를 만든 오픈AI(OpenAI)와의 파트너십을 통해 검색 엔진 '빙(Bing)'을 강화하고 있다. Bing은 이제 GPT 3.5를 기반으로 하는 'Prometheus'라는 GPT 버전을 사용하는 중에 있다. Microsoft는 또한 sLLM으로 알려진 더 작고 저렴한 언어 모델을 개발하기 위해 팀을 구성하면서 LLM 대비 가벼운 모델도 함께 준비하고 있다. sLLM은 컴퓨팅 성능이 덜 필요하며 모바일 장치에서도 사용할 수 있다. Microsoft는 또한 시각적 정보와 텍스트 정보를 모두 처리할 수 있는 다중 모드 MLLM(대형 언어 모델)에도 투자하고 있다. 2023년 3월 코스모스-1 출시와 함께 마이크로소프트는 비전과 언어를 결합하는 새로운 방법을 모색하고 있다. 이를 통해 모델이 이미지를 분석하고, 질문에 답변하고, 통찰력 있는 설명을 제공할 수 있게 된다.
Meta, Google 및 Microsoft 간의 경쟁은 LLM 기술의 급속한 발전을 주도하고 있다. 각 회사는 새로운 아키텍처, 교육 기술 및 애플리케이션을 실험하면서 이러한 모델이 수행할 수 있는 작업의 한계를 넓히고 있다.
LLM은 일상 생활에 통합하여 일상적인 작업부터 복잡한 의사 결정에 이르기까지 모든 것을 도와줄 것으로 기대할 수 있다. 더 똑똑해지고, 더 효율적이며, 인간의 요구를 더 잘 이해하고 대응할 수 있도록 진화중이다.
이렇게 빠르게 발전하는 환경 속에서 LLM은 더이상 단순한 기술적 도구가 아닌 파트너가 되어 인간과 함께 상호작용하며 진화하고 있다. 계속 배우고 진화하면서 새로운 기회와 함께 인간과 함께 공존하는 생활 방식의 미래를 개척해 나가고 있다.
Tags: AI, GenAI, 생성형AI, 빅테크, LLM, 메타, 구글, 마이크로소프트, ChatGPT, Galactica, LLaMA, Lambda, Bard, Bing, sLLM, Cosmos-1, DO솔루션, DO-Solution