- 제품 문제를 해결하기 위한 자체 AI 모델을 설계하고 학습합니다
- 초기에는 TTS/STT 모델의 성능 개선과 음성 품질 향상을 주요 과제로 다룹니다
- 데이터 수집 → 전처리 → 학습 → 평가까지 end-to-end ML pipeline을 구축합니다
- 음성 품질(자연스러움, 발음 정확도, 감정 표현 등)을 정량적으로 평가하고 개선합니다
- inference latency 및 비용을 고려한 효율적인 모델 구조와 서빙 방식을 설계합니다
- 제품 엔지니어들과 협업하며 연구 결과를 실제 서비스에 적용합니다
- 소규모 팀에서 기술 방향성과 연구 로드맵을 함께 설계합니다
- 향후 경량 LLM, 라우팅 모델 등 다양한 AI 모델 문제를 탐색하고 연구합니다
- TTS 또는 STT 모델을 직접 학습시키고 서비스에 적용해본 경험
- PyTorch 기반으로 음성 모델을 end-to-end로 학습시켜본 경험
- Transformer 기반 음성 모델 구조에 대한 깊은 이해
- 음성 데이터셋 구축 및 데이터 품질 개선 경험
- GPU 환경에서 모델 학습을 수행해본 경험 (multi-GPU 등)
- 모델 성능 개선 과정에 깊이 관여해본 경험
- 한국어/일본어 등 다국어 음성 모델 학습 경험
- 실시간(streaming) 음성 인식 또는 합성 시스템 구축 경험
- DeepSpeed, FSDP 등 분산 학습 경험
- 음성 관련 논문 구현 또는 연구 경험
- 오픈소스 음성 모델 기여 경험
- inference 최적화 (ONNX, TensorRT 등) 경험
- 경량 LLM 또는 특화 모델 연구 경험
- [서류 제출] > [사전 기술 인터뷰(온라인)] > [1차 인터뷰] > [2차 인터뷰] > [레퍼런스 체크] > [최종 합격] 순서로 진행됩니다.
- 제출하신 서류를 통해 팀에 필요한 기본적인 문제 해결 역량을 갖추고 계신지 확인합니다. 지금까지 수행하신 프로젝트와 도전 과제, 그리고 이를 어떻게 해결해 오셨는지를 구체적으로 작성해 주시면 많은 도움이 됩니다.
- 사전 기술 인터뷰는 온라인으로 진행되며, ML/AI 관련 기술 중심의 Q&A로 30분간 진행됩니다.
- 1차 인터뷰는 1시간 30분 동안 진행되며, 지원자께서 수행하셨던 프로젝트에 대한 설명과 이에 대한 질의응답을 중심으로 진행됩니다. 프로젝트의 배경, 기술적 선택의 이유, 문제 해결 과정 등을 통해 실무 경험과 기술 이해도를 확인합니다.
- 2차 컬처핏 인터뷰는 채널과 핏이 잘 맞는 분인지 알기 위해 편안하게 서로 질문을 할 수 있는 시간을 갖게 됩니다.
