Инженер систем машинного обучения, исследовательские инструменты
Сан-Франциско, Калифорния | Нью-Йорк, Нью-Йорк | Сиэтл, Вашингтон
О компании Anthropic
Миссия Anthropic — создавать надежные, интерпретируемые и управляемые системы искусственного интеллекта. Мы хотим, чтобы ИИ был безопасным и полезным для наших пользователей и для общества в целом. Наша команда — это быстрорастущая группа преданных своему делу исследователей, инженеров, экспертов по политике и бизнес-лидеров, которые работают вместе над созданием полезных систем ИИ.
О роли:
Мы ищем опытного инженера систем машинного обучения для присоединения к нашей команде по кодированию и токенизации в Anthropic. Эта межфункциональная роль будет играть ключевую роль в разработке и оптимизации систем кодирования и токенизации, используемых во всех наших рабочих процессах дообучения (Finetuning). Будучи связующим звеном между нашими командами предварительного обучения (Pretraining) и дообучения (Finetuning), вы будете создавать критическую инфраструктуру, которая напрямую влияет на то, как наши модели учатся и интерпретируют данные. Ваша работа станет основой для исследовательского прогресса Anthropic, позволяя более эффективно и результативно обучать наши системы ИИ, при этом обеспечивая их надежность, интерпретируемость и управляемость.
Обязанности:
- Проектировать, разрабатывать и поддерживать системы токенизации, используемые в рабочих процессах предварительного обучения и дообучения
- Оптимизировать методы кодирования для повышения эффективности и производительности обучения моделей
- Тесно сотрудничать с исследовательскими командами для понимания их меняющихся потребностей в представлении данных
- Создавать инфраструктуру, которая позволяет исследователям экспериментировать с новыми подходами к токенизации
- Реализовывать системы для мониторинга и отладки проблем, связанных с токенизацией, в процессе обучения моделей
- Создавать надежные тестовые фреймворки для проверки систем токенизации на различных языках и типах данных
- Выявлять и устранять узкие места в процессах обработки данных, связанных с токенизацией
- Тщательно документировать системы и ясно коммуницировать технические решения заинтересованным сторонам в разных командах
Вы можете подойти нам, если вы:
- Имеете значительный опыт в разработке программного обеспечения с подтвержденной экспертизой в машинном обучении
- Комфортно ориентируетесь в условиях неопределенности и разрабатываете решения в быстро меняющейся исследовательской среде
- Можете работать самостоятельно, при этом поддерживая тесное сотрудничество с межфункциональными командами
- Ориентированы на результат, с уклоном в гибкость и влияние
- Имеете опыт работы с системами машинного обучения, конвейерами обработки данных или инфраструктурой ML
- Владеете Python и знакомы с современными практиками разработки в области машинного обучения
- Обладаете сильными аналитическими навыками и можете оценивать влияние инженерных изменений на результаты исследований
- Готовы подхватить работу, даже если она выходит за рамки вашей должностной инструкции
- Любите парное программирование (мы обожаем работать в парах!)
- Заботитесь о социальном воздействии своей работы и привержены ответственному развитию ИИ
Сильные кандидаты также могут иметь опыт в:
- Работе с конвейерами обработки данных для машинного обучения
- Создании или оптимизации кодировок данных для приложений ML
- Реализации или работе с алгоритмами токенизации BPE, WordPiece или другими
- Оптимизации производительности систем обработки данных ML
- Решении задач токенизации для нескольких языков
- Исследовательской среде, где инженерные решения напрямую способствуют научному прогрессу
- Распределенных системах и параллельных вычислениях для рабочих процессов ML
- Больших языковых моделей или других архитектур на основе трансформеров (не обязательно)
Логистика
Требования к образованию: Мы требуем как минимум степень бакалавра в смежной области или эквивалентный опыт. Политика гибридной работы в зависимости от местоположения: В настоящее время мы ожидаем, что весь персонал будет находиться в одном из наших офисов не менее 25% времени. Однако некоторые роли могут требовать большего времени в офисе.
Спонсорство виз: Мы спонсируем визы! Однако мы не всегда можем успешно спонсировать визы для каждой роли и каждого кандидата. Но если мы сделаем вам предложение, мы приложим все разумные усилия, чтобы получить для вас визу, и у нас есть иммиграционный юрист, который помогает в этом.
Мы призываем вас подавать заявку, даже если вы считаете, что не соответствуете всем требованиям полностью.