NC Research는 미래 기술에 대한 열정과 도전을 통해 고객에게는 새로운 가치를 제공하고, NC의 장기적인 성장과 발전을 위해 노력합니다. NC Research에는 R&D 분야별 전문 조직이 구성되어 있어서 최신 기술에 대한 공유 및 집단 연구를 통해 차별화된 경쟁력을 만들어 나가며, 단기 프로젝트 중심의 활동 보다는 장기적인 비전을 통해 미래 지향적이고 지속적인 기술 개발을 수행합니다.
NLP R&D
NC의 NLP R&D는 사람이 하는 말을 기계가 알아듣고, 사고하여 적절한 말을 생성해내는 인간 뇌에 해당하는 AI 기술을 종합적으로 연구합니다. 소통과 분석, 창작 과정에서 NLP 기술을 통해 게임업의 경쟁력을 강화하고, 더 나아가 AI가 엔씨소프트의 새로운 성장 동력이 될 수 있도록 다양한 연구와 시도를 합니다.
NLP R&D는 거대 언어모델과 같은 기반 기술 부터 AI 자동 번역과 같은 응용 기술을 연구하며, 최종적으로는 기술 서비스를 통해 연구의 완성도를 높여가고자 합니다.NLP 기반기술 R&D
- 언어모델과 대화 AI(Language Model & Dialogue AI)
- 언어생성과 번역 AI(Language Generation& Translation AI)
- 다국어 이해 AI (Multi-Lingual Understanding AI)
- 검색 기술 (Intelligent Search Tech)
- 언어 데이터 기술 (Language Data Tech)
NLP 응용기술 R&D
- AI 번역 서비스(AI Translation Service)
- 응용 AI 기술(Applied AI Tech)
- 생성 AI 플랫폼 서비스(Generative AI Platform Service)
언어모델과 대화 AI
Language Model & Dialogue AI
언어 이해와 생성에 기반이 되는 언어모델을 학습하고 사용자와 자연스러운 대화를 할 수 있는 대화기술 개발 및 고도화를 목표로 연구합니다.
대화 시스템은 우리 일상의 필수적인 부분이 되고 있습니다. 매일 수백만 명의 사람들이 스마트폰 또는 IT 디바이스를 통해 자연어 인터페이스를 사용합니다. 우리는 대화와 그 주변의 맥락을 깊이 이해하며 목표 지향적이고 사용자를 이해하며 공감하는 개인화된 서비스를 제공하는 새로운 대화 기술을 만들기 위해 노력합니다. 차세대 대화형 AI 시스템은 사용자에게 창의적이고 현실적인 응답을 제공하기 위해 여러 기술을 통합하고 다양한 서비스에 적용될 것입니다.
🛠️ 주요 업무
NCSOFT의 대화AI를 연구 개발하는 조직으로서 언어의 이해와 생성의 기반이 되는 언어모델을 개발하고 이를 기반으로 다양한 대화서비스를 연구하고 있습니다. 대화기술은 사용자를 이해하고 공감하는 개인화된 서비스를 제공하는 중요한 플랫폼입니다. 지금 이 순간에도 수많은 사용자분들이 스마트폰과 IT 디바이스를 이용하여 자연어 인터페이스를 이용하고 있습니다. 대화기술실은 여러 자연어처리 모델에 기반이 되는 언어모델을 개발하는 조직과 개인화된 대화, 대화모델을 개발하는 조직으로 구성되어 있습니다.
🛠️ 구체적으로 어떤 문제들을 풀고 있습니까?
언어모델 연구 개발
- 언어모델 개발을 위한 대규모 데이터 제작 및 분석
- 언어모델 연구 및 이를 위한 프레임워크 개발
- 언어모델 학습 최적화 및 모델 경량화 연구 및 개발
- 텍스트 외 이미지, 음성 등 멀티모달 입력에 대한 언어모델 연구 및 개발
대화모델 연구 개발
- 자신의 정체성을 가지고 대화하는 페르소나 기반 대화 기술 개발
- AI 윤리를 준수하며 건강하게 대화하는 윤리적 대화 기술 개발
- 정서적인 공감대를 형성할 수 있는 감성 대화 기술 개발
- 다양한 주제에 대해 똑똑하게 대화하는 지식 기반 대화 기술 개발
💬 대화모델팀
대화 모델 팀은 사람처럼 정체성을 가지고 정서적으로 교감하며, 다양한 주제에 대해 건강하게 대화할 수 있는 기술을 만드는 것을 목표로 연구 중입니다. 대화 모델은 상대방의 말을 잘 이해하고 자신의 생각을 정리해서 잘 표현하는 능력을 갖추어야 합니다. 또한 대화에 일관성이 있어야 하며 상대방과의 감정을 교류하는 능력, 다양성을 존중하고 부당한 차별을 하지 않는 기술, 정확한 정보를 전달하는 능력 등이 필요합니다. 이처럼 많은 NLP 기술들을 집약한 AI 대화 서비스를 만들고, 많은 사람들이 AI와 즐겁게 대화하는 날이 오기를 꿈꾸고 있습니다.
🛠️ 주요 기술
대화 모델은 대형 언어 모델을 기반으로 사람들의 채팅 데이터를 Fine-tuning 하는 방식으로 연구가 진행되고 있습니다. 이런 방식은 큰 문법적 오류 없이 대화를 무난하게 이어 나갈 수 있지만, 대화 일관성 유지 문제, 조기에 대화를 끝내려고 시도하는 문제, 챗봇의 발화에 잘못된 지식이 3~40%에 육박하는 문제, 최신 지식을 실시간으로 반영하기 힘들다는 문제, 차별과 혐오 발화를 생성하는 문제 등이 있습니다. 대화 모델의 SOTA라고 할 수 있는 페이스북의 BlenderBot 2.0, 구글의 LaMDA 등의 모델도 위와 같은 문제를 아직 완벽히 해결하지는 못한 상태입니다.
💼 팀에서 하는 일
대화 모델 팀에서는 현재 페르소나 기반 대화 기술로 대화의 일관성을 유지해 보다 사람처럼 느낄 수 있는 기술을 만들고 있습니다. 또한 대화 흐름 상 특정 지식이 필요할 경우에 이를 반영해 보다 구체적인 발화를 생성하는 기술을 연구하고 있습니다. 그리고 인간다운 가치 판단에 근거한, 윤리를 이해하는 대화 기술과 사용자의 감정 상태를 파악하고 대화 모델의 적절한 호응과 주도적인 대화 기술을 연구하고 있습니다.
⚙️ 언어모델팀
언어모델은 자연어 관련 다양한 어플리케이션을 개발하기 위한 가장 기본적인 모델로 언어모델은 NLP 서비스에서 다양한 역할을 수행하고 있습니다. 인간과 자연스러운 대화를 하고 사용자를 공감하는 AI를 개발하기 위해서는 아직도 해결해야할 문제들이 많이 있습니다. 언어모델 연구에 관심이 있으신 분, 초대형 언어모델을 학습해보고 싶으신 분은 주저 말고 저희와 함께 해주세요!
🛠️ 주요 기술
최근 SOTA 언어모델들은 Transformer의 Non-recurrent Sequence-to-Sequence 구조를 가지고 있습니다. 이러한 구조는 기존 RNN에서의 순환 구조로부터 벗어남으로써 병렬처리가 가능하고 컴퓨팅 자원을 최대한으로 사용할 수 있게 되면서 Transformer는 언어모델 을 구성하는데 가장 핵심 구조로 사용됩니다. 이러한 Transformer를 이용한 PLM은 크게 Encoder-only, Decoder-only, Encoder-Decoder 3가지 구조로 구분 됩니다. 이러한 언어모델은 다양한 NLP 태스크에서 기초 모델로 사용되고 있지만 대량의 데이터와 고성능 컴퓨팅이 필요해 쉽게 학습하기는 어렵습니다. 또한 GPT-3, PaLM와 같은 초거대 언어모델은 단일 언어모델로도 다양한 NLP 태스크에서 우수한 성능을 보여주지만 그만큼 학습에 다양한 기술을 필요로 합니다.
💼 팀에서 하는 일
다양한 언어모델을 학습하고 여러 벤치마크 태스크에서 우수한 성능을 보이도록 언어모델을 학습 및 튜닝하는 업무를 진행하고 있습니다. 또한, 초거대 언어모델 학습 및 프롬프트, Zero-Shot learning에 대한 연구도 진행하고 있으며 텍스트 외에 이미지, 비디오, 음성 등을 결합한 멀티모달 언어모델에 대해 연구를 수행합니다.
언어생성과 번역 AI
Language Generation& Translation AI
다양한 형태의 데이터와 정보를 사람이 한눈에 읽을 수 있도록 자연어로 바꾸어 주는 기술, 언어가 달라 읽을 수 없었던 문서나 대화를 번역해 주는 기술을 개발하여 실제 서비스화 할 수 있도록 제공하고 있습니다. 인간이 가장 읽기 쉽고 적합한 형태로 컨텐츠를 전달해 주는 것이 핵심 가치입니다.
🛠️ 구체적으로 어떤 문제들을 풀고 있습니까?
위의 핵심 가치를 실현하기 위해 크게 아래와 같은 목표를 향해 나아가고 있습니다.
- 다양한 정보들을 자연어 형태로 바꾸어 쉽게 읽을 수 있도록 합니다. 세상에는 온갖 정보들이 넘치고 있습니다. 하지만 이 정보들을 사람이 쉽게 받아들일 수 없다면, 실질적으로 이 정보들의 가치는 그다지 높지 않을 겁니다. 우리가 접근 가능한 정보들은 테이블 형태, API 출력 결과, 일반 텍스트, 통계 수치 등등 형태가 다양할 뿐 아니라 그 내용도 가지각색입니다. 이것들을 읽기 쉬운 자연어 형태로 자동 생성하기 위해서는 다음과 같은 기술들이 필요합니다.
- 다양한 형태의 데이터를 텍스트 생성 모델의 입력에 적합한 형태로 바꾸어 줘야 합니다.
- 경우에 따라, 주어진 정보 형태(예: 그래프)에 적합한 인코딩 방식을 개발합니다.
- 문서 단위의 입/출력을 위해, 구조적 인코딩/디코딩 기술이 적용될 수 있습니다.
- 우리가 원하는 입력과 출력을 수행하는 텍스트 생성 모델 학습에 필요한 학습 말뭉치 구축이 필요합니다.
- 일반적인 텍스트 입력이 아닌 특정 구조를 가지는 입력을 가정하기 때문에, 사전 학습 언어 모델을 활용하는 방법을 좀 더 고민해야 합니다.
- 방대한 분량의 텍스트를 읽기 쉬운 형태로 요약합니다. 유용한 정보들을 담고 있는 문서들이 많이 있습니다만, 그것들을 모두 읽기에는 개인의 시간이 너무 부족합니다. 시간이 흐르면서 생성되는 문서들이 점점 많아지고 그 양이 커질수록, 문서의 핵심 내용을 자동으로 요약해 주는 기술의 가치는 더욱 높아질 것입니다. 또한 문서의 단순 요약을 넘어, 사용자가 원하는 개체 또는 주제에 집중해서 요약할 수 있는지에 대해서도 중요하게 생각합니다.
- 긴 문서의 내용을 추상 요약하는 기술을 개발합니다.
- 사용자가 특정 주제나 키워드, 또는 질문을 던져줬을 때, 그것에 적합한 내용을 요약해서 제공할 수 있어야 합니다.
- 기존에 존재하는 텍스트와 사전 학습 언어 모델을 최대한 활용하여 성능을 향상시켜야 합니다.
- 처음에 입력 받은 내용이 왜곡되지 않고 자연어로 제공되도록 노력합니다. 사람이 읽기 편한 형태로 컨텐츠를 제공하는 것은 당연히 가치 있는 일이지만, 만약에 그 정보가 훼손되었다면 의미가 매우 퇴색됩니다. 왜곡된 정보를 제공받고 싶은 사용자는 아무도 없을 것입니다. 따라서 원 정보의 핵심 내용을 온전히 보존한 상태로 자연어 형태로 변환하는 것에 대한 고민은 매우 우선순위가 높을 수밖에 없습니다. 또 하나의 큰 문제는 기계학습 기반 모듈의 특성상 오류율을 줄이는 것인 가능하지만 오류 자체를 완전히 제거하는 것은 상당히 어려운 일인데, 사용자 입장에서는 단 한 번의 오류 발생만으로도 사용자 경험이 크게 훼손된다는 겁니다. 따라서 생성된 텍스트에 대한 후처리 또한 필수적이게 됩니다.
- 원 출처의 키워드 또는 수치 정보를 출력물에 정확히 전달하기 위한 복사(Copy) 기반 텍스트 생성 기술을 개발합니다.
- 학습 데이터 입/출력 상에 사실 관계가 일치하지 않거나 어휘가 불일치하여 정보 보존이 어렵게 되어 있는 경우가 많은데, 이 데이터들을 정보 보존에 유리한 형태로 변환하는 기술이 필요합니다.
- 사실 관계가 얼마나 왜곡되어 있는지를 자동 측정할 수 있는 왜곡 측정 모듈을 개발합니다.
- 텍스트 생성 모델 학습 시, 내용의 훼손을 억제하는 방향으로 학습하는 기술 적용을 연구합니다.
- 최종 생성된 복수 개의 텍스트 결과물에 대해, 다시 한 번 원 출처 정보와의 비교를 통해 정보 일치도를 확인 후 검증된 결과만을 출력하는 과정이 필요합니다.
- 주어진 내용을 바탕으로 우리가 원하는 형태의 텍스트를 생성합니다. 주어진 정보들을 잘 취합하여 사람이 읽기 쉬운 형태로 잘 전달하는 것뿐 아니라, 우리가 원하는 형태로 제공하는 것 또한 중요합니다. 대화 상황과 주제에 적합한 응답을 생성할 때에도 그렇고, 우리가 미리 설정한 챗봇의 성향(예: 상담사, 친구 등)에 알맞은 어투/문체의 문장을 생성해야 할 수도 있습니다. 서비스의 특성에 따라 출력되는 텍스트의 길이에 제약이 존재할 수도 있습니다. 필요에 따라 특정한 감정 또는 행동을 반영하여 영화 지문과 같은 텍스트를 생성할 경우도 있을 겁니다. 이와 같이 실제 서비스 단계에서는 단순히 정보 보존 및 전달만이 아닌 정보가 전달되는 방식 또한 컨트롤할 수 있어야 합니다.
- 미리 정의한 감정, 문장 길이 등의 요소에 부합하여 텍스트가 생성되어야 합니다.
- 주어진 문맥과 상황에 적합한 텍스트가 생성되어야 합니다.
- 발화자의 캐릭터 및 서비스의 성격에 따라 그에 적합한 문체로 변환하는 과정이 필요합니다.
- 텍스트의 특성을 규정짓는 요소들이 많기 때문에 학습 말뭉치 라벨링에 많은 비용이 들어갈 수 있습니다. 따라서 반자동 라벨링 방법 및 비지도 기반 학습도 고려해야 합니다.
- 목표 서비스에 적합한 최적의 번역 결과를 생성합니다. 일반적인 텍스트 번역이 아닌, 서비스 목적에 특화된 번역 결과를 제공하고자 합니다. 예를 들면 게임 내 사용자들간의 채팅 번역은 기존에 오픈된 번역 서비스만으로는 대응하기 어렵습니다. 게이머들이 사용하는 은어와 신조어, 채팅 특유의 어휘 및 문체를 정확히 이해할 수 있어야 제대로 된 번역이 가능합니다. 또한 도메인 특유의 고유명사 또한 일반적인 번역으로 번역할 수 없습니다. 이와 같은 업무 특성, 도메인 특성을 고려하여 최적의 번역 결과를 제공할 수 있는 번역 모델을 개발하는 것이 목표입니다.
- 일반 도메인 번역 모델로부터 도메인 특화 번역 모델을 구축하는 기술을 개발합니다.
- 미리 구축한 도메인 내 용어 사전을 반영하여 번역 가능한 모델을 개발합니다.
- 필요에 따라 문체 변환 기술이 적용될 수 있습니다.
- 실시간으로 발생하는 번역 오류에 대해, 각 유형별로 적절한 성능 개선 방법을 정립하고 이를 자동화하여 다음 모델에 빠르게 반영해야 합니다.
- 여러 국가의 언어를 효율적으로 번역하여 다국어간 번역 경험을 제공합니다. 번역 지원이 필요한 언어가 많아지면 기존의 1-to-1 번역 모델로는 서비스 지원이 거의 불가능합니다. 예를 들어 10개의 언어에 대한 번역이 필요할 경우, 단순 계산으로도 90개의 모델이 필요한데 이를 일일히 구축하여 서비스하는 것은 매우 비효율적입니다. 이와 같은 경우에는 M-to-M, M-to-1과 같이 하나의 모델이 여러 개의 언어를 입력받아 번역해야 합니다. 다국어 번역 모델을 개발할 경우 하나의 모델이 학습해야 할 말뭉치가 늘어나게 되고, 언어가 늘어나는만큼 최종 성능이 기존의 1-to-1 모델에 비해 떨어지게 될 수밖에 없는데 이와 같은 부작용을 최소화하는 것이 중요한 목표가 됩니다.
- 대량의 말뭉치 학습 환경에서의 성능 최적화 기법 연구 및 노하우가 필요합니다.
- 여러 언어를 하나의 모델에서 학습하면서 나타나는 성능 하락을 줄이기 위해, 번역 모델에 적합한 사전 학습 언어 모델을 개발해야 합니다.
- 언어별 학습 데이터의 비율이 다르기 때문에, 이를 극복하기 위한 학습 말뭉치 보강 기법 또는 불균형 데이터를 고려한 학습 방법 연구가 필요합니다.
- 여러 언어 쌍에 대한 번역을 하나의 모델에서 학습할 경우 각각의 최적 학습 시간이 달라 학습 종료 시점에 따라 언어간 성능 차이를 보이는데, 학습 중에 각 언어 쌍 별 성능을 어떻게 유지할 수 있을지에 대해 고민하고 있습니다.
💼 어떻게 일을 하나요?
- 진행 업무 성격에 따라 생성모델팀, 요약모델팀, 번역모델팀 중 하나에 소속되어 업무를 진행합니다.
- 일반적으로 팀 차원에서 주 1회, 실 차원에서 주 1회 업무회의를 진행합니다.
- 최신 연구 동향 파악 및 개인 연구 내용 공유를 위한 회의를 주 1회 진행합니다.
- 텍스트 생성과 번역이라는 주제 하에, 회사 내에서 필수적으로 진행해야 할 개발 및 프로젝트 업무 시간을 제외하고 독립적인 연구 진행이 가능합니다.
- 주요 업무로는 텍스트 생성 모델 구조 및 학습 방법 고도화, downstream task 별 성능 향상 방법 연구, 학습 말뭉치 자동/반자동 가공 및 보강, 텍스트 생성 성능 및 속도 최적화, 최신 연구 결과 재현 및 적용 등을 수행합니다.
💡 이런 역량을 가진 분을 찾고 있습니다.
👍 필요 조건
- 자연어 처리 모델 개발을 위한 기본적인 프로그래밍 수행 능력
- 특히 텍스트 생성 연구 및 개발에 대한 이해도 및 관심
- 최신 기술 논문을 빠르게 이해하고, 재현 및 검증할 수 있는 능력
- 문제를 올바르게 정의할 수 있고, 문제 해결을 위해 팀원과 협업할 수 있는 의사소통 능력
- 개발 기술의 서비스화에 대한 관심과 수행 능력
👍 우대 사항
- 자연어 처리를 위한 신경망/딥러닝 기반 개발 경험
- ML/NLP 관련 학회 및 저널 실적
- AI 관련 Challenge 및 경진대회 수상 이력
- 자연어 텍스트 전/후처리 경험 및 인사이트
- 딥러닝 서비스 배포 및 최적화 경험
다국어 이해 AI
Multi-Lingual Understanding AI
언어 이해 기술은 사람이 의사소통하기 위해 사용하는 자연어를 컴퓨터가 어떤 단계로 어떻게 인식하는지를 연구하는 분야예요. 자연어 이해를 위한 기반 기술을 확보하고 관련된 최신 연구들을 수행하며, 이런 기술들을 기계번역, 텍스트 마이닝, 대화 시스템 등 실제 서비스에 적용하고 고도화 하는 기술을 개발 하고 있어요.
🛠️ 어떤 세부 기술이 있을까요?
자연어 이해에 포함되는 기술은 자연어처리의 광범위한 태스크들을 포함하고 있습니다. 기본적으로 문장 단위의 자연어를 처리하기 위한 문장 분리, 형태소 분석, 구문 분석, 시제 분류 같은 형태/구문론적 분석이 있고요. 이런 분석 결과들은 그 자체로 사용되기도 하고 상위 시스템이나 모듈에 입력으로 사용되기도 합니다.
대화시스템을 위한 자연어이해 기술로는 발화를 분류하는 화행 분석, 의도 분석, 시간 인식 등이 있고, 대화의 의미를 파악하기 위한 개체명 인식, 감정 인식, 의미역 인식, 프레임 분석, 개체 연결, 의미적 텍스트 유사도 등의 기술을 같이 사용하고 있습니다.
텍스트 마이닝이나 전문적인 도메인의 지식을 처리하기 위한 자연어 이해 기술로는 문장이나 문서에서 나타나는 지식을 추출하기 위해 이벤트 추출, 관계 추출, 상호 참조 해결, 지식 그래프 구축, 기계 독해 등의 연구도 수행하고 있습니다.
또한 기계번역의 성능을 높이기 위해 사용자의 단순 실수, 인터넷 용어나 축약어 등에 견고한 시스템을 구축하기 위해 띄어쓰기 교정, 철자 교정, 용어 인식, 이모티콘 인식 등 다양한 전처리 기술도 이해 기술의 세부 기술입니다.💼 어떻게 일을 하나요?
언어이해기술실에서는 보통 프로젝트 업무 미팅은 보통 주 1회 혹은 격 주로 수행하며, 연구자 개인별 자율적인 연구 프로세스로 업무를 수행하고 있어요.
프로젝트의 요구사항이나 필요에 따라 데이터를 직접 구축하거나 자체 보유한 데이터를 핸들링하여 필요한 리소스를 구축하고 통계 기반 혹은 딥러닝 기반의 모델링을 통해 하나의 단위 모듈로 개발을 하고 있습니다.
연구개발 업무의 대부분은 모델의 성능을 높이기 위해 여러 최신 기법들을 적용하고 실험하는 것이 주요 업무이고요. 다른 모듈과의 연동을 위해 API를 개발하거나 개발한 모듈이 효율적으로 작동하도록 엔지니어링을 하는 작업도 같이 수행하고 있습니다.💡 어떤 스킬이 필요한가요?
- 자연어와 데이터를 처리하기 위한 기본적인 프로그래밍 능력
- 형태소분석, 개체명인식, 속성 기반 감정 분석, 의미역 인식, 상호참조해결 등 자연어 이해 태스크에 대한 기본적인 이해
- 통계기반 모델링 혹은 딥러닝 모델링 및 개발 역량
- 최신 연구/개발에 대한 관심
- 개인 역량 성장을 위한 태도
👍 이런 분 우대해 드립니다!
- 자연어 처리 어플리케이션 혹은 언어/대화모델 개발 경험
- 자연어처리 및 머신러닝 관련 주요 학회 및 저널 논문 게재 실적 (NeurIPS, ICML, ICLR, ACL, EMNLP, AAAI, IJCAI, COLING, INTERSPEECH 등)
- AI 관련 Challenge 및 경진대회 수상 이력
검색 기술
Intelligent Search Tech
웹이나 유튜브에서 무언가를 검색해 보는 일은 이제 사람들에게 일상적인 일이 되었습니다. 많은 앱과 서비스에서 사용자가 필요로 하는 정보를 효율적으로 찾아줄 수 있는 검색(search)은 항상 핵심적인 기능 중 하나였습니다. 이러한 검색에 필요한 다양한 기술들에 대해서 연구하고 연구 결과를 서비스로 이어 나가기 위해 노력하고 있습니다.
🛠️ 구체적으로 어떤 문제들을 풀고 있습니까?
위의 핵심 가치를 실현하기 위해 크게 아래와 검색 기술들을 연구 및 개발하고 있습니다.
- 대용량 정형/비정형 데이터 수집 및 전처리
- 질의 및 문서 임베딩, 질의확장, 검색 버티컬 연구 등 검색 기술의 고도화
- 대화 기반 검색 시스템을 위한 기술 연구
- 이벤트와 이벤트 간의 관계 정보를 활용한 이벤트 중심 지식 그래프 (Event-centric Knowledge Graph) 연구
- 이벤트 정보를 활용한 주요 이벤트 추천, 타임라인 생성, 관련 뉴스 추천 등의 서비스 개발
💾 정형/비정형의 다양한 데이터의 수집 및 가공
검색기술실의 데이터처리팀은 정형/비정형 데이터를 크롤링하여 전처리 및 분석하여 연구에 활용할 수 있도록 데이터를 제공하는 업무를 수행하고 있습니다. 또한, 연구개발에 필요한 개발 인프라 구축 및 CI/CD 환경 업무를 지원하고 있으며, 여러 사내 서비스 개발 업무도 수행하고 있습니다.
- Ad-hoc Crawler 및 Targeted Crawler를 활용하여 Web에 있는 대량의 비정형데이터를 수집 및 전처리 프로그램 개발
- 빅데이터 처리를 위한 환경 구축 및 개발된 프로그램을 CI/CD 환경을 통해 서비스 모듈간 통합 및 모듈 배포 업무 수행
- 테라바이트 레벨의 데이터를 분석 및 처리하며, 유의미한 데이터로 가공하는 업무 수행
🔍 검색을 위한 다양한 종류의 기술 연구 및 개발
금융, 미디어, 스포츠 등 다양한 목적에 따라서 사용자가 원하는 정보를 질의 및 검색 컨텍스트에 맞게 검색해 주는 전통적인 의미의 검색기술에 대해 연구합니다. 또한, 이를 실용화하여 가치를 창출할 수 있는 서비스로 연결하거나 기존 서비스의 가치를 높일 수 있는 도구로서의 기능을 제공하기 위해 노력하고 있습니다.
- 질의 확장 등 검색 모델 및 기술 연구: 사용자의 질의 입력 이외에도 질의와 관련 있는 배경지식(Background Knowledge) 및 정보의 분포 등을 활용하여 검색 성능을 향상시키는 업무를 하고 있습니다.
- User context 및 profile을 고려한 결과 생성을 위한 검색 버티컬 연구: 사용자의 컨텍스트 및 검색 의도에 맞는 검색 결과를 제공할 수 있는 버티컬 서치(Vertical Search)를 통한 검색 만족도를 높이기 위한 업무를 하고 있습니다.
- 인덱싱 기법 연구: 문서들은 고유한 특징을 가지고 있으며, 사용자의 검색어 입력 및 제공받기 원하는 형태에 따라 검색엔진 구조가 달라집니다. 이를 위해 개발하고자 하는 시스템에 따라 문서를 효과적으로 저장하고 검색할 수 있도록 하는 인덱싱 기법을 연구 중입니다.
🙋 딥러닝 기반 검색 기술의 연구 및 개발
딥러닝 기술을 다양한 분야에서 최고의 성능을 보여주며 이제껏 풀지 못했던 다양한 NLP 문제들을 해결해 나가고 있습니다. 하지만, 막대한 양의 계산을 필요로 하는 딥러닝 모델을 검색의 대상이 되는 방대한 양의 데이터에 적용하는 것은 아직 도전적인 연구 과제입니다. 검색기술실에서는 최근 빠르게 발전해 나가고 있는 초거대 언어모델을 비롯한 다양한 딥러닝 기술들을 검색에 활용할 수 있도록 해주는 방법들에 대해서 연구를 하고 있으며, 이를 통해 아래와 같은 기술들을 개발하기 위해서 노력하고 있습니다.
- 도메인 별 대규모 문서 임베딩 기법 연구: 문서의 특성 뿐만 아니라 정치, 경제 등의 검색을 하는 목적, 검색 대상이 되는 데이터의 도메인 등에 따라서 검색을 효과적으로 하기 위한 NLP 기법도 그에 따라 적용하여야 합니다. 이러한 도메인에 적합한 문서 임베딩 기법 및 사용자 질의 임베딩 기법을 연구하여 다양한 업무에 적용하는 업무를 합니다.
- Question-Answering 연구: QA 기술은 위에 상술 된 기술 이외에도 수많은 NLP 및 IR 기술의 집합체라 할 수 있습니다. 특히 최근 초거대 언어모델의 대두로 기존의 구글 검색 결과와 같은 순위화 된 리스트 형태의 검색 결과가 아닌 언어모델에 의해 요약되고 재가공 된 검색 결과를 제공하는 대화형 검색 시스템에 대한 관심이 높아지고 있습니다. 검색기술실에서는 최신의 검색기술을 제공하기 위한 연구를 활발히 진행하고 있습니다.
📜 이벤트 추출 및 정보의 내러티브 구축
검색기술실 내러티브팀은 대량의 텍스트에 포함된 이벤트적인 요소와 해당 이벤트 간의 관계, 그리고 이들로 구성된 내러티브에 관련한 연구와 서비스를 수행하고 있습니다. 우리는 텍스트에서 이베트와 이벤트 간의 관계를 식별하고, 이들로부터 금융 도메인과 대화 기술 등의 다양한 분야에 활용하기 위한 내러티브적인 콘텐츠들을 생성합니다. 또한, 이벤트에 필요한 다양한 정보를 추출하기 위한 분류 모델, 클러스터링, 토픽 모델 등의 연구도 함께 수행하고 있습니다.
- 대부분의 지식 그래프 (Knowledge Graph)는 객체 노드들과 이들 간의 관계로 구성되어 있는 객체 중심적인 정보를 가지고 있는 정적인 지식 표현입니다. 이러한 일반적인 지식 그래프는 동적이고 절차적인 지식들을 전달하는 이벤트 정보들을 쉽게 무시하고 있습니다. 그러므로 이벤트 중심 그래프 (Event-centric Knowledge Graph)와 같이 이벤트 중심적인 지식 표현이 필수적이고, 이러한 이벤트 중심 지식들은 검색, 질의응답, 추천, 텍스트 생성, 재무 분석 등의 다양한 분야에 활용되고 있습니다.
- 추출된 이벤트들을 노드로 표현하고, 하위 관계, 시간적인 관계, 인과 관계 등의 이벤트 간의 관계들을 자동으로 파악하는 등의 다음과 같은 과정들이 통해 이벤트 중심 지식 그래프를 구축합니다.
- 이벤트 추출 (Event Extraction)
- 이벤트 관계 추출 (Event Relation Extraction)
- 이벤트 지식 그래프 구축 (Event Knowledge Graph Construction)
- 이벤트 중심 그래프를 구축하는 것은 매우 도전적인 작업이고, 아직 활발하게 조사가 되지 않고 있습니다. 내러티브팀에서는 뉴스, 금융 등의 다양한 분야에서 매일 일어나는 이벤트들을 조직화 된 이벤트 지식 표현인 이벤트 중심 지식 그래프로 저장하고 있습니다.
💡 어떤 스킬이 필요한가요?
- 컴퓨터과학, 컴퓨터 엔지니어링 등 관련 분야 전공하신 분
- LINUX/UNIX 등 기본적인 OS 지식 보유하신 분
- REST 기반의 서버 개발 능력을 보유하신 분
- Java/Python 중 1개 이상의 프로그래밍 언어에 익숙하신 분
👍 이런 분 우대해 드립니다!
- NLP 관련 개발 경험이 있으신 분
- AI Machine learning Framework에 익숙하신 분
- Docker 사용 경험 있으신 분
- kubernetes(k8s) 환경 구축 경험 있으신 분
- Elasticsearch/Solr 등의 검색엔진을 사용한 경험이 있으신 분
- 벡터 검색 등 딥러닝을 이용한 검색 시스템에 경험이 있으신 분
- CI/CD 도구 사용 경험이 있으신 분
언어 데이터 기술
Language Data Tech
자연어처리 기술 개발에 필요한 데이터를 설계, 구축하고 데이터의 효율적인 구축과 품질 향상을 위한 데이터 분석, 처리 기술을 연구 개발합니다. 데이터는 “인공지능 산업의 원유”라고 불릴 정도로 인공지능 개발에 필수적인 원천 요소입니다. 특히 현재와 같이 대부분의 기술이 공유되는 상황에서 데이터의 품질이 인공지능의 성능에 핵심적인 차이를 만든다고 할 수 있습니다. 필요한 기술에 적합한 좋은 품질의 데이터를 효율적으로 구축하는 데 역량을 집중하여 인공지능이 사용자가 만족하는 경험을 제공할 수 있도록 노력합니다.
🛠️ 어떤 세부 기술과 조직이 있을까요?
NLP데이터기술실은 NCSOFT의 NLP 연구개발 조직에 필요한 데이터를 제공하는 부서로서 데이터를 설계, 구축하고 데이터의 효율적인 구축과 품질 향상을 위한 데이터 분석, 처리 기술을 연구 개발하는 조직입니다. NLP데이터기술실은 한국어 자연어처리 기술 개발에 필요한 데이터를 구축하는 언어데이터팀, 기계번역을 비롯한 다국어 병렬 데이터를 구축하는 다국어데이터팀, 다양한 언어 데이터를 분석, 처리, 정제, 증강하는 기술을 연구, 개발하는 데이터엔지니어링팀으로 구성되어 있습니다.
💼 어떻게 일을 하나요?
🔤 언어데이터팀
- 자연어처리 기술 개발에 필요한 언어학적 방법론 및 분류체계 연구
- 디지털 휴먼 개발에 필요한 대화 데이터 설계, 구축, 평가
- 자연어이해 (NLU) 기술 개발에 필요한 데이터 설계, 구축, 평가
- AI 윤리 검증 프로세스 설계
🈸 다국어데이터팀
- 기계번역 기술 개발에 필요한 다국어 병렬 코퍼스 구축, 정제
- 다국어 병렬 개체명 사전 구축, 정제
- 기계번역 평가 방법론 연구
⚙️ 데이터엔지니어링팀
- 데이터 품질 향상을 위한 전처리 및 분석 기술 개발
- 데이터 정제 방법론 연구 및 기술 개발
- 거대언어모델 (LLM) 성능 향상을 위한 프롬프트 엔지니어링 연구
- 학습 데이터의 분포, 균형 등을 탐지하기 위한 탐색적 데이터 분석 (EDA) 기술 연구
- 데이터 증강 (data augmentation) 기술 연구
💡 어떤 스킬이 필요한가요?
- 국어학, 어문학, 언어학, 전산언어학, 문헌정보학 등 관련 분야 전공자
- 사전 및 코퍼스에 대한 지식과 구축 경험 보유
- 다양한 언어 현상에 대한 관심과 분석 역량을 갖추신 분
👍 이런 분 우대해 드립니다!
- 언어 데이터 처리 경험
- 규칙, 통계, 딥러닝 기반 NLP 개발 경험
응용 AI 기술
Applied AI Tech
Data Science 기술을 기반으로 예측하고, 해석하고, 최적화하여 사용자에게 유용하고 가치있는 기능을 제공하는 것을 목표로 연구합니다.
목표 서비스 내 수많은 데이터와 Contents로부터 사용자, Contents, Domain에 대해 분석 및 이해하고, 다양한 정보를 추론하여 Insight를 전달하며, 사용자에게 맞춤 설정된 경험을 제공하는 개인화 (Personalization) 기술을 개발하여 실제 서비스화 할 수 있도록 제공하고 있습니다.구체적으로 어떤 문제들을 풀고 있습니까?
- Applied AI Lab은 AI 기술을 연구하고 개발하는 Research 조직과 AI R&D 결과를 실제 서비스에 안정적으로 제공하기 위한 개발 조직으로 크게 나누어집니다. Research 조직은 집중하는 기술 Set에 따라 Curation팀, Anomaly Detection팀, Sequence Modeling팀으로 구분됩니다.
- Curation팀은 개인화 기술 연구로, 사용자의 선호도 및 과거 행동 데이터를 바탕으로 관심 Contents를 선별하여 전달하는 추천/Push Targeting 기술과 사용자의 흥미, 특성, 행동 패턴 등을 분석하고 모델링하는 User Profiling 기술을 연구/개발하고 있습니다.
- Anomaly Detection팀은 다양한 데이터를 효과적으로 잘 나타낼 수 있는 Graph 기반으로 데이터에서 예상과 다른 패턴을 보이는 ‘이상’을 정의하고 찾아낼 수 있는 모델과 ‘이상’에 대한 근거를 제시하는 XAI (Explainable AI) 모델을 연구/개발하고 있습니다.
- Sequence Modeling팀에선, 우리 주변에서 쉽게 관측할 수 있는 시계열 데이터를 효과적으로 분석 및 모델링하고, 시계열과 다양한 Sequence 데이터에서 인과 관계를 발견하고 분석하는 기술을 연구/개발하고 있습니다.
- 개발 조직인 Data Platform팀은 Research 팀에서 개발한 AI 모델을 상용 서비스에 적용하고 운영하기 위해 인프라를 구축하고 데이터 파이프라인과 AI 어플리케이션을 개발하고 있습니다.
- 최근 Applied AI Lab은 우수한 성능이 입증된 Large Language Model을 활용하여 추천 기술을 고도화하고 메타 휴먼과 챗봇 등에 차별화된 개인화 기능을 적용하기 위한 연구도 시작하였습니다.
어떻게 일을 하나요?
- Researcher의 경우 진행 업무 성격에 따라 Curation팀, Anomaly Detection팀, Sequence Modeling팀 중 하나에 소속되고, AI Engineer의 경우 Data Platform에 소속되어 업무를 진행합니다.
- 활발한 기술 교류를 위해 정기적으로 매주 두 개의 Tech 미팅을 진행합니다.
- 먼저, 주제별로 글로벌 Top Tier 저널과 학회 논문을 선정하고 매주 논문 세미나를 진행하면서 최신 기술 트렌드를 파악합니다.
- 또한, 매주 실 업무 공유회를 통해 각자 팀에서 개발하고 있는 업무 내용과 기술을 발표합니다. 각 팀에서 어떤 일을 하는지 듣고 다른 팀에서 소개한 기술을 함께 고민하거나 본인 업무에 적용하기도 합니다.
어떤 스킬이 필요한가요?
- AI 관련 전공자 및 그에 준하는 경력과 역량을 보유하신 분
- 문제를 논리적으로 Modeling할 수 있는 분
- 기술 탐색 및 연구/문제 해결이 가능한 분
- Python으로 모델 개발과 실험을 수행하는데 익숙하신 분
- Pytorch/Tensorflow 등 최신 딥러닝 Framework에 익숙하신 분
이런 분 우대해 드립니다!
- 연구/프로젝트 리딩 경험이 있으신 분
- 우수한 개발 능력을 보유하신 분
- AI 관련 박사 학위가 있으신 분
- AI 관련 우수 학회 게재 경험이 있으신 분
AI 번역 서비스
AI Translation Service
NCSOFT 내부나 외부의 다양한 번역 요구에 맞춰서 서비스 목적에 특화된 번역 기술을 개발하고, 개발된 번역 기술을 다양한 환경에 서비스하고 안정적으로 운영합니다.
뉴스 등의 일반적인 문어체 텍스트 번역 기술도 제공하지만, 핵심가치는 기존의 오픈된 번역 서비스에서 번역하기 어려운 구어체(채팅 등), 구조적인 문서(테이블, html 문서 등) 및 전문 분야(게임, 금융 등)에 특화된 번역 기술을 제공하는 것입니다.
🛠️ 어떤 세부 기술이 있을까요?
구어체, 구조적인 문서, 전문 분야에서의 번역 성능을 개선하기 위해서 다음과 같은 기술을 연구 및 개발하고 있어요.
- 특수 기호/태그, 이모티콘 등을 전처리하는 기술을 개발합니다.
- 구어체에서 자주 나타나는 사용자 오류를 수정하기 위한 띄어쓰기 교정, 철자 교정 기술을 연구하고 있습니다.
- 번역 성능을 개선하기 위한 자연어이해 기술로 문장분리, 숫자 인식, 개체명/용어 인식, 약어 복원 기술을 개발하고 있습니다.
- 위에서 설명한 기술들은 번역 서비스가 제공되는 언어에 맞춰서 다국어로 개발되고 있습니다. 게임, 금융 등의 전문분야에서 사용하는 전문 용어를 정확한 대역어로 번역하기 위해서 용어 인식 기술을 개발하고 있는데요. 용어 인식기에 필요한 사전을 빠르게 구축하기 위한 용어 사전 관리 프로세스를 정의하였고, 세부 프로세스에 필요한 다양한 기술을 개발하고 있습니다.
- 공식 용어의 동의어로 사용자가 많이 사용하는 축약어를 자동으로 수집하기 위한 기술을 연구하고 있습니다.
- 새로운 용어를 빠르게 인식해서 번역에 적용하기 위한 신조어 인식 기술을 연구하고 있습니다.
- 수집된 용어의 모호성과 중요도를 측정하기 위한 검증 기술을 연구하고 있습니다.
- 용어 사전을 적용한 용어 인식기를 검증하고 개선하기 위한 기술을 연구하고 있습니다.
- 용어 사전을 효율적으로 관리하고, 용어 인식 오류를 빠르게 발견해서 개선할 수 있는 프로세스에 대한 연구도 매우 필요합니다.
💼 어떻게 일을 하나요?
AI번역서비스실은 다양한 조직과 협업을 하고 있습니다.
- 번역 모델 개발은 생성번역기술실 번역모델팀과 협업으로 진행하고 있으며, 번역 성능 개선을 위한 다국어 이해 기술을 다국어이해팀에서 연구하고 있습니다.
- 번역 서비스에 필요한 다양한 관리도구 개발을 위해서 TD 서비스기술팀과 협업하고 있습니다.
- 번역 서비스를 위한 인프라 구축, 서비스 테스트, 서비스 배포를 위해서 TD 플랫폼기술팀과 협업하고 있습니다. AI번역서비스실은 다국어 이해 R&D를 위한 다국어이해팀, 외부 협업을 위한 PM팀, 서비스 운영을 위한 QA팀으로 구성되어 있으며, 연구는 다음과 같이 진행되고 있어요.
- 정기적인 업무 회의는 실 차원에서 주 1회, 팀 차원에서 주 1회 진행하며, 프로젝트 별로 필요한 경우에 실무자 수시 미팅이 진행됩니다.
- 연구 목표와 진행 방향에 대해서 직책자와 협의하여 결정하고, 연구는 담당 업무에 따라 연구원이 자율적으로 진행하고 있습니다.
- 연구에 필요한 데이터는 소량은 개인이 직접 구축하거나, NLP데이터기술실에 요청해서 구축하고 있습니다.
- 연구 업무는 담당 업무에 적합한 모델을 찾아서 개발하고, 서비스 목표를 달성하기 위해서 모델 성능을 개선하는 것이 주요 업무입니다.
- 서비스를 위해서 다른 모듈과의 연동을 위해 API를 개발하거나 개발한 모듈이 효율적으로 작동하도록 엔지니어링 하는 작업도 같이 수행하고 있습니다.
💡 어떤 스킬이 필요한가요?
- 자연어와 데이터를 처리하기 위한 기본적인 프로그래밍 능력
- 문장분리, 형태소분석, 개체명인식, 철자 교정 등의 자연어이해 태스크에 대한 기본적인 이해
- 통계기반 모델링 혹은 딥러닝 모델링 및 개발 역량
- 최신 연구/개발에 대한 관심
- 개인 역량 성장을 위한 태도
👍 이런 분 우대해 드립니다!
- 자연어 처리 어플리케이션 혹은 언어/대화모델 개발 경험
- 자연어처리 및 머신러닝 관련 주요 학회 및 저널 논문 게재 실적 (NeurIPS, ICML, ICLR, ACL, EMNLP, AAAI, IJCAI, COLING, INTERSPEECH 등)
- AI 관련 Challenge 및 경진대회 수상 이력
- 다양한 언어를 이해할 수 있는 언어능력 보유자
AI R&D
NC AI R&D는 사람들에게 새로운 즐거움을, 기업에는 새로운 성장 동력을 만들어 낼 수 있는 AI 기술을 연구합니다. 어떻게 하면 사람이 AI와 함께 재미있고 편리하게 즐기고 일할 수 있는지 고민하며, 나아가 과거에 꿈꾸기 어려웠던 새로운 산업 분야와 NC의 차세대 성장 동력을 만들어 내고자 합니다. 이를 위해 AI R&D는 폭넓은 분야의 AI 원천 기술을 연구하고 있습니다.
디지털 휴먼 관련 기반 기술 R&D
Vision, Speech, Graphics, Decision Making AI 기술을 개발, 통합하여 사람과 감정적으로 교감하고 몰입감을 주는 디지털 휴먼 요소 기술을 개발합니다.
- Vision AI 실사 및 디지털 영상에 대한 시각적 이해를 바탕으로 새로운 영상 컨텐츠 생성을 위한 Vision AI 기술 연구 개발
- Speech AI 일상적인 환경에서 사람의 음성을 이해 및 생성하여 사람과 자연스럽게 커뮤니케이션할 수 있는 음성 AI 개발
- Graphics AI 고품질 디지털 캐릭터를 제작하고 애니메이션 품질을 높이기 위한 딥러닝 기술 기반의 그래픽스 AI 개발
- Intelligent Agent 게임과 일상생활에서 사람의 판단 능력을 대체할 수 있는 강화학습 기반 Decision Making 기술 개발
응용 AI 기술 R&D NC 가 보유한 AI 기술 서비스화를 위한 최적화 기술 및 디지털 휴먼 솔루션 등을 개발합니다.
- Audio-visual Multimodal Recognition AI 사람의 감정과 환경적 맥락을 인지하기 위한 음성/영상 신호를 조합한 고수준의 Recognition AI 개발
- Speech & Music Synthesis AI 사람처럼 자연스럽게 말하고 노래할 수 있으며 목소리, 억양, 분위기 등을 컨트롤할 수 있는 AI 개발
- Visual Acting AI 사람에 가까운 외모와 자연스러운 움직임을 표현하기 위한 차세대 스캔 및 캡쳐 파이프라인, AI기반 애니메이션 기술, Neural Rendering/Nerf 포함한 디지털 휴먼 Rendering 기술 등 개발
- Applied AI Application 게임 및 서비스 개발 및 제작에 필요한 각종 AI 기능 및 AI 기반의 새로운 콘텐츠 개발 및 운영
Vision AI
Vision AI는 현실 세계의 사람과 사물 및 환경에 대한 시각적 이해를 바탕으로, 새로운 디지털 세계를 창조하기 위해 필요한 요소 기술 개발을 목표로 합니다. Vision AI는 게임 컨텐츠 및 디지털 휴먼 제작 프로세스 효율화를 위한 생성 기술을 개발하고, 거대 멀티모달 모델을 활용한 영상 인지에 대한 연구를 진행하고 있습니다. 그 외 Vision AI 기술 적용에 필요한 딥러닝 모델 경량화 및 Serving 기술을 연구 개발합니다.
무슨 연구를 하고 있나요?
- Generation 기술 연구 개발
- GAN, Diffusion을 기반으로 하는 이미지/비디오 생성 기술과 게임 및 컨텐츠 제작 프로세스 효율화를 위한 Generative AI 기술을 개발합니다.
- ✔관련 연구 분야: Image-to-Image Translation, Image Synthesis, Image Editing/Inpainting, Audio-Driven Face Reenactment, RL-based Diffusion Model 개선 연구 등
- Recognition 기술 연구 개발
- 이미지 정보를 식별하는 이미지 인식 기술에 대해 연구하고, 다양한 응용 서비스에 적용 가능한 핵심 기술을 개발합니다.
- ✔관련 연구 분야: Image Classification, Object Detection/Recognition, Instance Segmentation, OCR, Facial Expression/Emotion Recognition, Network Pruning/Quantization, Neural Architecture Search 등
- Video Understanding 기술 연구 개발
- 비디오 분석 및 이해에 필요한 요소 기술을 개발하고, 영상을 활용하는 사내/외에 핵심 요소 기술을 연구합니다.
- ✔관련 연구 분야: Action/Gesture Recognition, Human-Object Interaction Detection/Recognition, Vision-Language Multimodal Model 연구 등
- Neural Rendering 기술 연구 개발
- 영상 기반 3D Human/Scene의 고품질 시각화 및 캡쳐를 위한 요소 기술을 연구하며, 디지털 아바타/디지털 휴먼 등 미래 사업화 창출을 위한 핵심 기술을 연구합니다.
- ✔관련 연구 분야: Neural Rendering, Neural Radiance Field (NeRF), Multi-view Geometry, Pose Estimation, 3D Human Body Recovery, 3D Object/Scene Modeling 등
- Computer Vision Application 서비스 관련 기술 개발
- Vision AI 연구 결과물을 효과적으로 전달하고 서비스하기 위한 Model Serving 및 Web Application 관련 기술을 개발합니다.
- ✔관련 분야: Machine Learning API 개발, Deep Learning Model Serving, Web Application(Frontend) 개발 등
어떻게 일하나요?
Vision AI Lab은 다음과 같이 업무를 진행하고 있습니다.
- 직책자와 협의하여 결정된 프로젝트 목표에 대해서 1~2명으로 이루어진 담당 연구원들이 업무를 진행합니다.
- 프로젝트별로 주 1회 이상 정기 업무 회의를 진행하여, 연구 진행 상황을 파악하고 수정합니다.
- 대체로 ‘선행 기술 탐색→데이터셋 구축 및 초기 모델 구현→실험 및 분석→성능 개선 및 데모 구현’ 순으로 업무가 진행됩니다.
- 다른 팀의 업무를 파악하고 중복된 연구 개발을 방지하기 위해, 연 2회 이상 성과/목표 공유회를 진행합니다.
- 더 다양하고 깊이있는 연구를 위해 국내 유수 대학 연구실과 산학 연구 과제를 수행합니다.
Vision AI Lab은 다양한 조직과 협업하고 기술 공유 활동을 하고 있습니다.
- 규모있는 프로젝트 수행을 위해 AI/NLP Center 내의 Lab 뿐만 아니라, 다양한 게임 개발 조직과 협업합니다.
- 개발된 기술과 서비스 개선을 위해 사내 데이터셋을 수집하고, 사용자 니즈와 피드백을 파악합니다.
- 세미나/강연/기술 블로그를 통하여 사내 R&D 관련 조직에 Vision AI 관련 기술과 지식을 소개합니다.
- 연구원들의 업무 역량 증진과 선행 연구 파악을 위해 국내외 학술대회 및 기술 전시회에 참가합니다.
어떤 역량/스킬이 필요할까요?
- 아래 분야를 전공하신 분
- Computer Vision, Image Processing
- Machine Learning, Pattern Recognition
- 아래 경험을 가지신 분
- 이미지/비디오 처리 및 분석 관련 연구/개발 경험이 있으신 분
- 3D 모델, NeRF 관련 연구/개발 경험이 있으신 분
- 딥러닝 모델 최적화/경량화 및 웹 서비스 개발 경험이 있으신 분
- Docker를 활용한 연구/개발 경험이 있으신 분
- 분산 학습 프레임워크 연구/개발 경험이 있으신 분
- 게임 아트, 게임 엔진, 렌더링 관련 지식이 있으신 분
- CVPR, ICCV, ECCV, NeurIPS, AAAI 등 관련 학회에 논문을 제출한 경험이 있으신 분
이런 분을 찾습니다!
- 문제를 논리적으로 모델링할 수 있으신 분
- 주어진 문제를 해결하기 위해 다양한 기술을 탐색하고 연구하는 적극적인 자세를 가지신 분
- 확보된 기반 기술을 상용화할 수 있는 개발 능력을 갖추신 분
- 딥러닝 프레임워크(TensorFlow, PyTorch 등) 사용 경험이 있으신 분
- 컴퓨터 비전 관련 오픈소스(OpenCV 등) 사용 경험이 있으신 분
Graphics AI
Graphics AI의 목표는 게임으로 대표되는 가상 세계에서 실감 나는 3D 캐릭터를 창조하는 것입니다. 이를 통해 사용자들에게는 이전에 느껴본 적 없는 생생한 경험과 소통의 즐거움을, NC에는 경쟁사와 차별화되는 기술 경쟁력을 제공할 것입니다.
목표 실현을 위한 첫 번째 연구 주제는 영화 수준의 고품질 애니메이션 생성입니다. 우리는 사람 같은 표정을 짓고, 제스쳐를 취하며 소통의 재미를 느낄 수 있는 디지털 휴먼을 제작하고 있습니다. 두 번째 연구 주제는 AI를 이용한 생산성 향상입니다. 디지털 휴먼 제작 공정 자동화를 통해 개성 있는 디지털 휴먼을 대량으로 생성할 수 있습니다.무슨 연구를 하고 있나요?
- [고품질 모션 캡쳐 & 캐릭터 적용] 4D Scan
- 기존 3D Scan 기술은 정적인 얼굴 모습만 획득할 수 있는 반면, 4D Scan 기술은 세세한 피부 움직임을 추출할 수 있는 최신 기술입니다. 이 기술을 통해 사람처럼 표정 짓고, 감정을 표현할 수 있는 디지털 휴먼을 제작할 수 있습니다.
- ✔ 관련 연구 분야: 3D Reconstruction / Image Tracking / 4D Scan / Automatic Rigging / Data-driven Animation
- [고품질 모션 캡쳐 & 캐릭터 적용] Facial Performance Capture
- Facial Performance Capture는 배우의 얼굴 연기를 캐릭터로 옮기는 기술입니다. 헐리우드 영화의 얼굴 애니메이션 품질을 목표로 AI 기반 Facial Tracking, Retargeting 기술을 개발 중이며, 게임 컷신, 시네마틱 영상 제작에 활용할 예정입니다.
- ✔ 관련 연구 분야: Performance Capture / Image Tracking / 3D Registraction / Motion Retargeting
- [AI 기반 애니메이션 생성 기술] 얼굴 표정 자동 생성 기술
- 얼굴 표정 자동 생성 기술은 캐릭터가 말을 할 때 발화에 적절한 입술 움직임과 감정 변화에 따라 달라지는 표정을 자동으로 생성합니다.
- 몇 가지로 고정된 기존 애니메이션과 달리, 상황에 맞게 다양한 움직임을 만들어 낼 수 있기 때문에 살아 숨 쉬듯 움직이는 게임 캐릭터를 보여 줄 수 있습니다.
- ✔ 관련 연구 분야: Data-driven Animation / Audio-to-Animation / Motion Matching
- [AI 기반 애니메이션 생성 기술] 제스처 자동 생성 기술
- 제스처 자동 생성 기술은 각 상황에 적합한 제스처를 생성할 수 있습니다. 또한, 페르소나별 다양한 전신 애니메이션 생성도 가능합니다.
- 동일한 상황에서 내성적인 캐릭터와 외향적인 캐릭터의 동작을 다르게 생성하여 사용자에게 다양한 캐릭터들을 제공할 수 있습니다.
- ✔ 관련 연구 분야: Motion Matching / Motion Synthesis / Data-driven Animation / Audio-to-Animation
- [AI 기반 애니메이션 생성 기술] Diffusion 기반 동작 자동 생성 기술
- Diffusion 기반 동작 자동 생성 기술은 최신 Diffusion 기반 기술을 활용하여 필요한 모션을 쉽게 생성할 수 있습니다. 사용자의 의도와 필요 정보를 Prompt를 통해 생성 모델에게 전달하면 모션 캡쳐 과정 없이도 원하는 모션을 바로 얻을 수 있습니다.
- 이 기술을 통해 생성한 대량의 모션 데이터는 캐릭터별 실시간 모션 생성 모델의 학습 데이터로 사용됩니다.
- ✔ 관련 연구 분야: Motion Diffusion / Generative AI / Motion Synthesis / Physics-based Animation
- 기타 기술
- AI를 이용하여 캐릭터 동작의 효과음을 자동으로 생성해 주는 기술, 움직임을 보다 자연스럽게 보정해 주는 기술, 부드러운 동작 전환 기술 등 다양한 캐릭터 애니메이션 기술을 개발 중입니다.
어떻게 일하나요?
- Graphics AI Lab은 프로젝트 중심의 조직 구조로, 상황과 필요에 맞게 조직이 재편됩니다. 연구는 스크럼 방식으로 이루어집니다. 빠르게 프로토타이핑하고, 더 나은 방법을 찾아 개선합니다.
- 위 과정을 통해 최신 기술을 빠르게 흡수하여 의미 있는 결과물을 도출하고, 서비스에 필요한 다양한 요소 기술들을 내재화합니다.
- Graphics 업무 특성을 살려 결과물은 시각적인 DEMO 형태로 제작합니다. 눈에 보이는 결과물을 활용하여 사용자들에게는 더 정확한 피드백을 받고, 팀원들은 모두가 동일한 목표를 향해 나아갑니다.
어떤 역량/스킬이 필요할까요?
- 아래 분야를 전공하신 분
- Computer Graphics, VR/AR
- Computer Vision, Image Processing,
- AI, Data Science
- Computer Programming
- 아래 경험을 가지신 분
- Character Animation, Inverse Kinematics, Motion Retargeting
- 3D Reconstruction, Real-time Rendering
- Unreal, Unity, Autodesk Maya, Autodesk Max, Autodesk MotionBuilder
- Tensorflow, Pytorch
- Front-end Programming, Program Language( Python, C++, C# 등), Git 등
이런 분을 찾습니다!
- 디지털 휴먼이 사람보다 더 사실적이고 자연스러워질 수 있다고 믿으시는 분
- 목표를 달성하기 위한 끈기와 도전하는 열정을 가지신 분
- 규모 있는 문제를 다루는 협업 과정에서 원활하게 커뮤니케이션하실 수 있는 분
- 팀원들을 배려하고 도움을 줄 수 있는 헌신적인 자세를 갖춘 분
Speech AI
Speech AI는 Speech는 물론 Music, Sound, Effect 등 모든 Audio를 대상으로 인식, 생성, 전처리/후처리 및 기술 통합에 대한 고도화 연구와 선행 연구를 진행하고 있습니다.
Speech AI의 연구는 Audio라는 모달리티에 국한되어 있지 않습니다. 좀 더 나은 성능과 활용성을 위해 여러 모달리티를 통합한 Multi-Modal을 지향하고 있습니다. Audio는 사람이 직접 생성하고 인지할 수 있기 때문에 사람과 가장 밀접한 정보 전달 매개체입니다. 따라서 Speech AI는 연구 산물로서 기술을 항상 곁에 두고 사용할 수 있도록 모델 경량화 및 Standalone동작(예를 들면 휴대폰에서의 동작)에도 큰 노력을 기울이고 있습니다.무슨 연구를 하고 있나요?
- 음성합성 기술 연구 개발
- 머신러닝을 주된 방법론으로, 음성을 생성/변조/변환하는 기술을 연구합니다. 주된 입력 항목은 텍스트와 음성입니다. 사람처럼 자연스럽고 다양한 감정/표현/음색을 표현하기 위한 기술을 개발/고도화하고 있으며, 한국어를 넘어 다국어를 지원하기 위해 노력하고 있습니다.
- ✔관련 연구 분야: Text-To-Speech, Random Speaker Generation, Vocoder, Voice Conversion, Expressive TTS
- Music AI 기술 연구 개발
- 머신러닝을 주된 방법론으로, 음악을 생성/변조/변환 하는 기술을 연구/개발/고도화합니다. 노래하는 가창 음성을 합성/생성하고, 장르에 맞는 멜로디와 화음을 생성하며, 노래를 악보로 받아 적을 수 있습니다. Musical Effect 등의 생성에 대해서도 연구하고 있습니다.
- 응용 기술 연구 개발
- 머신러닝과 전통적인 통계적 방법론을 사용하여, 전처리/후처리로서 잡음제거, 반향제거, 화자분리, 화자인식, 신호 분리 등의 고도화 연구와 선행 연구를 하고 있습니다. 또한, 머신러닝을 주된 방법론으로 사람의 말소리가 아닌 Sound와 Effect를 생성하는 연구를 하고 있습니다.
- 인식 기술 연구 개발
- 머신러닝을 이용하여 사람의 음성을 인식하여 Text로 변환하는 기술을 연구합니다. 단지 사람이 전달 하고자 하는 음성만을 Text로 변화하는 것을 넘어, 주변 소리/감성/환경에 대한 정보도 포함하여 인식할 수 있도록 고도화 연구와 선행 연구를 하고 있습니다.
- 모델경량화 기술 연구 개발
- 머신러닝을 이용하여 학습한 모델은 대게 모델 크기가 방대하여, 어플리케이션에 내재화하기 어렵습니다. 따라서 모델을 경량화/최적화하는 방법을 통해 어플리케이션에 쉽게 내재화할 수 있는 방법들을 연구하고 있습니다.
어떻게 일하나요?
- 연구 주제는 팀 단위로 논의를 통해 정하며, 팀장이 연구를 관리합니다.
- 개발된 연구는 필요에 따라 프로젝트로 통합되며, 팀에 상관없이 구성원을 조직합니다.
- 빠른 구현, Feasibility Test 등은 빠르게 구성되는 TF로 운영하며, 목표 달성 후 해체합니다.
- 연구에 대한 평가는 팀장이, 통합 프로젝트에 대한 평가는 RD(Research Director)의 의견이 반영됩니다.
- 모든 연구와 프로젝트는 성공 여부와 상관없이 재현할 수 있도록 자세히 기록합니다.
- 다양하고 깊이 있는 최신 연구 주제 발굴을 위해 산학 과제를 수행합니다.
- 효율적 연구/개발을 위해 협업 시 타 조직과의 의사소통은 전문 인력이 담당합니다.
어떤 역량/스킬이 필요할까요?
- 아래 분야를 전공하신 분
- 음성인식, 음성합성, 음악합성, 신호처리, 인공지능, 소프트웨어 엔지니어링, 수학, 물리, 통계
- 아래 경험을 가지신 분
- 딥러닝 모델 최적화/경량화 및 웹 서비스 개발 경험이 있으신 분
- Visualization, UX/UI에 대한 개발/연구 경험이 있으신 분
- C/C++이 가능하신 분
- 스크립트 언어 중 하나에 통달하신 분 혹은 머신러닝Framework 사용이 가능하신 분
- 논문을 읽고 이해하고 구현해 보신 분
이런 분을 찾습니다!
- 다른 사람을 논리적으로 설득할 수 있는 분
- 문제 해결을 위해 다양한 기술을 탐색하고 연구하는 적극적 자세를 가지신 분
- 연구 과정의 기록과 공개가 당연하다고 생각하시는 분
- 자신의 연구 결과와 파급효과를 잘 설명하여 그 가치를 극대화할 수 있는 분
Intelligent Agent
Intelligent Agent(이하 IA)은 “고부가가치 창출을 위해 기계 학습 방법으로 지능적인 의사 결정을 수행하는 Agent와 Agent trainer를 만든다.”는 Mission 하에 “의사 결정 AI”를 연구하고 있습니다.
IA는 강화학습 기술을 게임에 적용하여 AI 콘텐츠를 꾸준히 출시해 왔습니다. “Blade & Soul 비무 AI”, “리니지 리마스터 거울전쟁, 전설 대 현역, 기란 무한 대전”에서 사람과 같이 PVP를 즐길 수 있는 Character AI를 만들어왔습니다. 지금도 저희는 의사 결정 AI를 통해 게임 콘텐츠를 더욱 풍부하고 재미있게 만드는 일에 매진하고 있습니다. 또한 새로운 가치 창출을 위해 연구 분야를 넓혀, 매매 의사를 결정하여 자산이 늘어나는 즐거움을 주는 Trading AI도 연구도 진행 중입니다.
앞으로도 IA는 “의사 결정 AI”를 통해 세상에 새로운 가치를 만들어 낼 수 있는 분야를 개척하고, 발전시켜 나가고자 합니다.무슨 연구를 하고 있나요?
- Game AI 기술 연구 개발
- Trading AI 기술 연구 개발
- 강화학습을 핵심 방법론으로 하여, 주식 주문 집행(Order Execution) Agent 기술을 연구하고 있습니다. 이 기술을 통해 우리는 호가창을 하루 종일 들여다보지 않고도 Agent를 통해 유리한 가격에 주식을 사거나 팔 수 있게 될 것입니다. 나아가 궁극적으로는 자산의 매매 자동화를 통해 사용자의 자산을 불려주는 Trading Agent로 발전시켜 나갈 예정입니다.
- ✔관련 연구 분야: Reinforcement Learning, Order Execution, Trading Agent, Portfolio Management, Quant
어떻게 일하나요?
- 수평적 커뮤니케이션 지향: 누구나 자신의 의견을 어려움 없이 이야기 나눌 수 있는 건전한 토론문화를 지향합니다. 서로를 존중하는 토론문화를 통해 한 걸음 더 나아간 아이디어가 나올 수 있다고 믿습니다.
- 상호 권한 존중의 문화: 업무 분담에 따른 의사 결정 권한을 존중합니다. 팀장은 팀원의 문제 해결 방법 선택 권한을 존중하고, 실장은 팀장의 팀 운영 권한을 존중합니다.
- 형식보다 본질을 추구하는 업무 Process: 보고를 위한 보고, 불필요한 회의, 아무도 왜 하는지 모르는 페어퍼 워크를 포함한 각종 형식적인 업무들을 지양합니다. 실질적인 업무 진행에 도움이 되는 프로세스만 남길 수 있도록 업무 프로세스를 계속해서 개선해 나갑니다.
- 지식과 정보 공유회: 주 1회 한 명씩(실장 포함) 전 구성원이 돌아가면서 자신이 배우고 경험한 것을 정리하여 공유하는 시간을 가집니다. 단, 시간은 1시간 엄수~!
- 실 티타임: 매주 목요일 점심 식사 후 엔씨 카페에 모여 일상의 소소한 이야기를 나누는 티타임을 가집니다.
어떤 역량/스킬이 필요할까요?
- 아래 분야의 경험과 지식을 가지신 분
- 강화학습, 지도학습 등 기계학습 관련 전문 지식과 실무 적용 경험을 가지신 분(석사 이상)
- 게임 개발 경험을 가지신 분(서버 or 클라이언트 개발자)
- Quant 관련 경험을 가지신 분
- 아래 스킬을 가지신 분
- 기계학습 및 적용에 필요한 Python 코딩 스킬을 가지신 분
- Pytorch를 능숙하게 활용할 수 있는 분
- C/C++ 코딩 능력을 갖춘 분(개발자의 경우)
이런 분을 찾습니다!
- 끈기를 가지고 기필코 답을 찾아내 문제를 해결하는 열정이 가득한 문제 해결자
- 상대의 의견을 존중할 줄 아는 열린 마인드의 소유자
- 새로운 지식을 배우고 활용하는 자기 계발의 자세를 가지신 분
- 현상의 본질을 꿰뚫는 통찰력을 지니신 분
- 현실에 직접적으로 기여할 수 있는 문제 해결에 관심이 많은 분
AI Production Tech
AI Production Tech는 AI Center 내 개발 중인 기술을 바탕으로 사내외 다양한 사용자들을 위해 애플리케이션 및 서비스를 개발합니다.
특히 게임엔진과 AI 기술을 접목하여 상호작용할 수 있는 디지털 휴먼 솔루션 연구 개발과, 다양한 AI 기술들을 사내 게임에 적용할 수 있도록 AI 서비스 최적화 및 개발, 운영 등을 담당하고 있습니다.무슨 연구를 하고 있나요?
- 디지털 휴먼 응용 기술 개발
- 다양한 AI 기술을 바탕으로 언리얼 엔진으로 상호작용할 수 있는 디지털 휴먼 응용 기술을 연구 개발합니다.
- 게임, 영상 등 디지털 콘텐츠의 효율적인 제작 프로세스를 위한 디지털 액터 기술을 연구 개발합니다.
- ✔관련 연구 분야: Unreal Engine, Meta human, Computer Graphics, Computer Animation, Machine Learning 등
- AI 서비스 개발 및 MLOps
- 자체 AI 기술을 바탕으로 게임 콘텐츠를 개발하거나 응용 서비스를 개발 및 운영합니다.
- 게임 개발 생산성 향상을 위해 다양한 생성형 AI 기반 서비스를 기획하고 개발합니다.
- (출시) B&S의 “무한의 탑”, 리니지(PC)의 “거울 전쟁” 콘텐츠
- (개발 및 운영) Throne & Liberty의 사진 기반 캐릭터 생성 서비스
- ✔관련 연구 분야: Cloud Engineering, Optimization, Web Application(Frontend) 및 Backend Server 개발 등
어떻게 일하나요?
AI Production 실은 AI 기술을 제품화하기 위해 다음과 같이 업무를 진행합니다.
- AI 응용 서비스 개발을 위해 사내 AI 및 외부 AI 기술 등을 다양하게 활용합니다.
- AI 기술 상용화를 위해 성능과 속도를 최적화합니다.
- AI 기술 서비스화를 위해 언어나 방법에 제약을 두지 않고 다양한 방법들을 시도합니다.
- AI 기술 배포 및 운영에 필요한 인프라를 효율적으로 운영할 방안을 모색합니다.
AI Production 실은 다양한 조직과 협업을 하고 있습니다.
- AI Center 각 조직과 AI 모델 최적화, 인터페이스 정의 등을 위해 협업합니다.
- AI 서비스를 운영하기 위해 사내 인프라 담당자 및 사외 클라우드 업체와 협업합니다.
- 필요에 따라, AI 기술 개발을 위한 다양한 학습 환경을 구축하거나 도구를 제작하여 AI Center에 제공합니다.
그 외에도 AI Production 실은 다음과 같은 개발 문화를 갖고 있습니다.
- 주 1회 팀별 업무 회의를 진행합니다.
- 격주로 다양한 주제로 Open Talk 시간을 갖고, 새로운 서비스 개발을 위한 아이디어를 나눕니다.
- 월 1회 세미나를 통해 각자 담당하는 기술과 진행 상황에 대해 공유하고 의견을 나눕니다.
어떤 역량/스킬이 필요할까요?
- 아래 분야를 전공하신 분
- Computer Science & Engineering
- Machine Learning
- 아래 경험을 가지신 분 (디지털 휴먼 분야)
- Unreal Engine 관련 개발 경험이 있으신 분
- Machine Learning 모델 개발 경험이 있으신 분
- Computer Graphics에 대한 이해도가 높으신 분
- 아래 경험을 가지신 분 (MLOps 분야)
- AWS, GCP등 Cloud 및 Kubernetes 기반 서비스 개발 및 운영 경험이 있으신 분
- 웹 Frontend 개발 경험이 있으신 분
- 웹 서비스 Backend 개발 경험이 있으신 분
- AI 서비스 출시 및 최적화 경험이 있으신 분
이런 분을 찾습니다!
- 전반적인 전산학에 대한 이해가 있으신 분
- C/C++, Python, Javascript 등 다양한 언어에 빠르게 적응할 수 있으신 분
- 확보된 기반 기술을 상용화할 수 있는 개발 능력을 갖추신 분
- 문제를 논리적으로 모델링할 수 있으신 분
- 주어진 문제를 해결하기 위해 다양한 기술을 탐색하고 연구하는 적극적인 자세를 가지신 분
- 여러 부서와 협업하기 위한 커뮤니케이션 스킬이 좋으신 분
- 새로운 것을 배우기 좋아하시는 분