본문 바로가기
카테고리 없음

프라이빗 LLM 구축의 선두주자 티쓰리큐

by 곰it수다 2024. 4. 19.
728x90

1. 허깅페이스 오픈 LLM 리더보드 수상에 대한 소감

티쓰리큐(T3Q)의 박병훈 대표는 허깅 페이스(세계 최대 기계학습 오픈 소스 플랫폼)에서 7B(70억 개) 이하의 LLM 모델로 글로벌 2위를 차지하고 Ko-LLM 분야에서 1, 2, 3위를 석권했다고 밝혔다. 이 성과는 티쓰리큐(T3Q)가 파인튜닝 분야에서 글로벌 수준에 도달했음을 의미하며, 퍼블릭 및 오픈 소스 LLM 사용 기술을 충분히 확보했고, 프라이빗 LLM을 제공할 준비가 되어 있다고 강조했다.

티쓰리큐 AI 미들웨어
티쓰리큐 AI 미들웨어

2. 프라이빗(Private) LLM 도입 시 고객의 페인포인트(PAIN POINTS) 해결

프라이빗 LLM의 도입이 고객에게 어떤 페인포인트를 해결해 줄 수 있는지에 대해 박 대표는 자세히 설명했다. "프라이빗 LLM은 조직 전용으로 사용되며, 조직의 특정 요구와 데이터를 기반으로 한다. 이는 LLM을 잘 만드는 것뿐만 아니라, 필요한 데이터를 지속적으로 유지하며 최신성을 보장하고, LLM의 약점인 할루시네이션(Hallucination) 문제를 극복하는 등 복합적인 도전을 포함한다." 그는 또한 POC(Proof of Concept) 단계를 포함하여 비용 효율적인 라이센싱 모델을 제공하며 고객의 초기 비용 부담을 줄이는 전략을 사용하고 있다고 밝혔다.

3. 대표적인 프라이빗 LLM 구축 사례

박병훈 대표는 티쓰리큐가 참여한 프라이빗 LLM 구축 사례 중 하나로, 통일부와 협력하여 대국민 북한 정보 제공 서비스를 개발한 사례를 들었다. "이 프로젝트에서는 RAG(Retrieval-Augmented Generation) 기술을 활용하여 실제 서비스에 적용했다. 또한, 국내 여러 대형 건설사와의 협력을 통해 그들의 특정 요구에 맞춘 LLM 솔루션을 제공했다."

4. '대국민 AI포털' 서비스 소개

AI를 누구나 쉽게 접근하고 사용할 수 있도록 만드는 것을 목표로 하고 있다고 설명했다. 그는 2016년부터 AI에 대한 접근을 단순화하려는 노력을 시작했으며, 한글의 구성 원리를 착안하여 AI 데이터 처리와 기능을 쉽게 설명할 수 있는 'AI 훈민정음'이라는 모델을 개발했다. 이 모델은 7가지 데이터 관점과 4가지 기능으로 나누어진 28가지 케이스로 구성되어 있으며, 이는 CES 박람회에도 소개되었다. 박 대표는 AI를 배우고 활용하는 것이 게임처럼 재미있어야 한다고 보고, 'Play to Learn'과 'Play to Earn'을 포함한 AI 생태계, 즉 'AI Playverse'를 구축하는 데 중점을 두고 있다. 이 생태계는 참여자들이 아이디어를 개진하고 개발하여 공유하며, 이를 통해 지속적인 혁신과 가치 창출이 이루어지는 플랫폼이다.

5. AI 경험이 부족한 기업에서 프라이빗 LLM을 구축하려면

박병훈 대표는 LLM에 대한 관점을 냉정하게 가져야 한다고 강조하며, LLM이 현재 많은 인기를 끌고 있음을 언급했다. 그는 LLM의 효과적인 사용을 위해서는 명확한 목적과 그 목적을 달성할 수 있는 충분한 데이터의 중요성을 강조했다. LLM을 사용하기 위해서는 파인 튜닝, 지속적인 시스템 유지, 그리고 할루시네이션 문제의 극복이 필요하다고 설명했다. 또한, 검색 시스템을 통해 데이터를 처리하고, 특정 정보에 맞는 답변을 제공하는 프라이빗 LLM을 생성할 필요가 있다고 덧붙였다. 이 과정은 멀티모달 기반의 지능형 검색 시스템을 사용하여, 이미지, 영상, 위성, 텍스트 등 다양한 데이터 소스를 활용한다. 이를 통해 조직의 특정 목적에 맞는 LLM을 생성하고 업무 효율성을 크게 향상시킬 수 있다고 밝혔다.

6. 오픈AI, MS 코파일럿 등 외부 LLM을 이용하는 방식에 대한 견해

외부 LLM의 사용에 대해 박병훈 대표는 현실적인 제한들을 지적했다. "현재로서는 우리 데이터가 외부로 나갈 수 있는 환경을 가지고 있거나 그들에게 많은 비용을 지불하고 우리가 그들의 기술을 독점적으로 쓰는 것은 사실상 불가능하다. 프라이빗한 LLM을 사용하는 것이 우리 데이터에 대한 보안 때문에 필요하다." 박 대표는 이러한 전략이 기업의 데이터 보안을 강화할 수 있다고 덧붙였다.

7. 엔터프라이즈 LLM 구축 시 필요한 데이터 확보 방안

LLM 구축을 위한 데이터 확보 전략에 대해 박병훈 대표는 기업의 현실적인 상황을 고려한 접근법을 제시했다. "LLM은 대부분 이미 프리트레인 된 모델을 기반으로 하므로, 우리 조직의 데이터를 그 모델에 효과적으로 적용하는 것이 중요하다. 데이터가 많이 필요하지 않은 경우도 있으며, 우리의 언어적 이슈를 고려한 특별한 접근이 필요하다."

8. 국내 AI 기업의 글로벌 경쟁력 수준

국내 AI 기업의 글로벌 경쟁력에 대해 박병훈 대표는 긍정적인 전망을 제시했다. "우리의 데이터가 많기 때문에 한국어 데이터를 기반으로 한 모델은 어느 정도 경쟁력이 있다. 그러나 글로벌 시장에서 지속적으로 경쟁력을 유지하기는 매우 힘들다." 그는 또한 파운데이션 모델과 같은 기술을 이용한 글로벌 경쟁에서 한국어 특화 모델이 중요한 역할을 할 것이라고 덧붙였다.

9. 해외 LLM과 국내 AI 솔루션 기업의 경쟁 또는 협력 전략

국내외 LLM의 경쟁 및 협력 가능성에 대해 박병훈 대표는 현실적인 조언을 제공했다. "국내 AI 기업들이 글로벌 빅테크 기업들과 경쟁하기 위해서는 오픈 소스를 잘 활용하고, 파인튜닝 같은 기술적 접근을 통해 경쟁력을 갖춰야 한다. 또한, 정부와 기업들의 연합 체계를 구축하여 국내 산업을 강화해야 한다."

10. AI가 코딩도 하는 시대에서 개발자가 갖춰야 할 역량

AI가 코딩를 작성하는 시대에 개발자가 갖춰야 할 역량에 대해 박병훈 대표는 명확한 의견을 밝혔다. "커뮤니케이션 능력과 기획, 설계 능력이 여전히 중요하다. AI를 이용한 코딩에서도 증강 개발 이러한 능력은 필수적이다. 그리고 일을 잘 시킬 줄 아는 능력이 LLM 시대에도 필요하다." 그는 기존의 개발자들이 상급 개발자로 성장하기 위해 필요한 기본적인 능력들을 강조했다.

 

투이컨설팅-투이톡의 티쓰리큐(T3Q) 박병훈 대표 인터뷰 자료 요약

 

고이수(goesu4@daum.net)