Требования- Понимание принципов работы с моделями машинного обучения и их применения в реальных проектах.
- Владение языком программирования Python.
- Знание архитектур LLM и методов их дообучения (Prompt Tuning, LoRA, Full Fine-Tuning).
- Выпуск и сопровождение обученных моделей в продакшене.
- Знание на уровне администратора ОС Linux и Bash.
- Опыт работы с базами данных.
- Опыт работы с Git и инструментами для автоматизации процессов разработки и деплоя.
Будет плюсом1.Опыт работы с аудио:
- Использование библиотек для обработки звука (Librosa, PyDub, TorchAudio).
- Знание методов шумоподавления, сегментации аудио, извлечения признаков (MFCC, спектрограммы).
- Опыт работы с моделями для транскрибации (например, Whisper, Wav2Vec) и синтеза речи (например, Google Text-to-Speech, WaveNet, FastSpeech).
- Понимание особенностей работы с аудиоданными (частота дискретизации, битрейт, форматы).
2.Опыт работы с текстом:
- Использование NLP-библиотек (Hugging Face, NLTK, SpaCy).
- Работа с задачами классификации текста, генерации текста, извлечения сущностей.
- Знание методов оптимизации моделей (квантование, дистилляция).
- Опыт работы с контейнеризацией (Docker) и оркестрацией (Kubernetes).
- Опыт в математическом и статистическом моделировании, включая теорию вероятностей и статистику (распределения, проверка гипотез, расчет p-value).
Ключевые навыкиPython, Linux, Github, PostgreSQL/MySQL, TensorFlow, PyTorch, NumPу, NLTK/SpaCy, Librosa/PyDub, LoRA, Docker.