카카오

Multimodal LLM Research Engineer (경력)

판교정규직테크

2026.03.16 등록 · pickme가 2026.06.18에 처음 발견했어요

지원은 카카오 공식 채용 페이지에서 진행돼요.

직무 소개

Multimodal Model Training 팀은 카카오의 자체 멀티모달 언어모델인 Kanana 시리즈를 연구·개발하는 조직입니다. 우리는 이미지-텍스트를 이해하는 Kanana-v(비전 언어모델), 오디오/텍스트 입출력이 가능한 Kanana-a(오디오 언어모델), 그리고 다양한 모달리티의 입출력을 통합하는 Kanana-o(멀티모달 통합 언어모델)을 개발하고 있습니다. 궁극적으로는 어떤 형태의 입력과 출력 간에도 자유롭게 상호 이해가 가능한 범용 멀티모달 모델을 만들기 위해, 국내외 최신 연구 동향을 빠르게 분석하고 이를 바탕으로 기술 선도 수준의 모델 경쟁력을 확보하는 것을 목표로 합니다. 연구부터 프로덕트 적용까지 기술 전 과정에 대해 함께 고민하고, 주도적으로 추진해 나갈 분을 기다립니다. - 이미지·오디오·텍스트 등 다양한 모달리티를 다루는 Multimodal LLM 기반 서비스 특화 모델 개발 - SFT(Supervised Fine-tuning) 및 Off-policy/On-policy RL을 통한 서비스 성능 고도화 - 대규모 분산 학습 환경에서의 학습 코드 개발 및 성능 최적화 - 멀티모달 학습을 위한 고품질 데이터 수집, 전처리, 정합성 확보 및 데이터 구축 파이프라인 설계 - 멀티모달 모델 평가 지표 설계 및 벤치마킹, 실사용 시나리오 기반 성능 검증 - 딥러닝 이론과 모델 개발에 대한 깊은 이해와 실무 경험 보유하신 분 - PyTorch, TensorFlow, JAX 등 주요 딥러닝 프레임워크 중 하나 이상에 대한 활용 경험이 있으신 분 - Python 기반의 코드 개발 및 실험 구현에 능숙하신 분 - 딥러닝 관련 분야 석사 또는 박사 학위, 또는 이에 준하는 관련 경력 2년 이상을 보유하신 분 **◆ 우대사항** - Multimodal LLM 기술 및 관련 서비스 개발 경험이 있으신 분 - CVPR, NeurIPS, ICLR, ICCV, ICML 등 AI 분야 최상위 학회 논문 발표 또는 공동 연구 경험이 있으신 분 - ACM ICPC 등 주요 프로그래밍 대회 수상 경력 또는 이에 준하는 알고리즘 역량을 보유하신 분

카카오

자사 채용사이트 · ATS 공고

채용 사이트

pickme는 흩어진 공고를 모아 보여주는 둘러보기 서비스로, 지원 접수나 전형 진행은 하지 않아요.

전체 보기

카카오

LLM Research Engineer (Pre-training) (신입/경력)

판교정규직경력무관테크

4일 전 등록자세히 보기

Multimodal LLM Research Engineer (경력)

직무 소개

LLM Research Engineer (Pre-training) (신입/경력)

서비스/플랫폼 QA 담당자 (경력)

Data Scientist (경력)

직무 소개

카카오의 다른 공고

LLM Research Engineer (Pre-training) (신입/경력)

서비스/플랫폼 QA 담당자 (경력)

Data Scientist (경력)