Мы – команда GigaChat Data
Готовим данные для обучения всей линейки моделей LLM GigaChat (GigaChat, GigaChat Vision, GigaChat Audio и др.). Мы специализируемся на создании и улучшении промптов (prompt-engineering), которые помогут нам развивать наши продукты, повышая качество взаимодействия моделей с пользователями.
Задачи:
- Разработка и оптимизация сложных системных и пользовательских промптов.
- Интеграция LLM через API в продуктовые сценарии.
- Тестирование промптов, проведение экспериментов и оптимизация их по метрикам качества.
- Проведение фактчекинга и ревью ответов моделей, устранение галлюцинаций и улучшение стиля.
- Анализ датасетов, выявление и устранение узких мест.
- Работа в связке с AI-тренерами, ML-инженерами, аналитиками и продуктовой командой.
Мы ждем от тебя:
- Опыт работы с API LLM (GigaChat, OpenAI, Anthropic, локальные модели и др.).
- Практический опыт создания и оптимизации системных и пользовательских промптов с применением разных методов (few-shot, zero-shot и др.).
- Опыт тестирования и оценки промптов.
- Уверенное владение Python для автоматизации (pandas, requests/httpx, работа с JSON).
- Понимание принципов RAG и tool-calling.
- Понимание принципов работы LLM и базовых статистических метрик.
Будет плюсом:
- Опыт работы с LangChain, GigaChain или аналогами.
- Навык написания пайплайнов генерации и валидации промптов.
- Знание английского языка на уровне чтения технической документации.
Условия:
- Работа в удалённом формате для Казани и Республики Татарстан.
- Ежегодный пересмотр зарплаты и годовая премия.
- Более 400 образовательных программ СберУниверситета для профессионального и карьерного развития.
- Расширенный ДМС и корпоративная пенсионная программа.
- Гибкий дисконт по ипотечному кредиту.
- Бесплатная подписка СберПрайм+ и скидки на продукты компаний-партнеров.