Миссия Anthropic — создавать надежные, интерпретируемые и управляемые системы искусственного интеллекта. Мы хотим, чтобы ИИ был безопасным и полезным для наших пользователей и общества в целом. Наша команда — быстрорастущая группа преданных своему делу исследователей, инженеров, экспертов по политике и бизнес-лидеров, которые работают вместе над созданием полезных систем ИИ.
Наши команды по обучению с подкреплением возглавляют исследования и разработки в области обучения с подкреплением в Anthropic, играя ключевую роль в развитии наших систем ИИ. Мы внесли вклад во все модели Claude, значительно повлияв на автономность и возможности кодирования Claude Sonnet 4.5 и Opus 4.5. Наша работа охватывает несколько ключевых направлений:
Мы тесно сотрудничаем с командами по выравниванию и командами по проверке безопасности Anthropic, чтобы наши системы были одновременно мощными и безопасными. Мы сотрудничаем с командой прикладного производственного обучения, чтобы внедрять инновации исследований в развернутые модели, и стремимся реализовывать наши исследования в масштабе. Наши команды по обучению с подкреплением находятся на пересечении передовых исследований и инженерного мастерства, с глубоким обязательством создавать высококачественные, масштабируемые системы, расширяющие границы возможностей ИИ.
В качестве инженера-исследователя в области обучения с подкреплением вы будете сотрудничать с разнообразной группой исследователей и инженеров для повышения возможностей и безопасности больших языковых моделей. Эта роль сочетает исследовательские и инженерные обязанности, требуя от вас как внедрения новых подходов, так и вклада в направление исследований. Вы будете работать над фундаментальными исследованиями в области обучения с подкреплением, создавая «агентские» модели с помощью использования инструментов для открытых задач, таких как использование компьютера и автономная генерация программного обеспечения, улучшать способности к рассуждению в таких областях, как математика, а также разрабатывать прототипы для внутреннего использования, повышения продуктивности и оценки.
Отсутствует. Заявки рассматриваются по мере поступления.
Для ролей в продажах указанный диапазон — это диапазон целевого дохода ("OTE"), что означает, что он включает как целевые комиссионные/бонусы по продажам, так и годовую базовую зарплату по роли.
£260,000 - £630,000 GBP
Мы призываем вас подавать заявку, даже если вы не уверены, что соответствуете всем требованиям. Не все сильные кандидаты соответствуют каждому из перечисленных требований. Исследования показывают, что люди из недостаточно представленных групп чаще испытывают синдром самозванца и сомневаются в силе своей кандидатуры, поэтому мы настоятельно рекомендуем не исключать себя преждевременно и подавать заявку, если вас интересует эта работа. Мы считаем, что системы ИИ, подобные тем, что мы создаем, имеют огромные социальные и этические последствия. Это делает представительство еще более важным, и мы стремимся включать разнообразные точки зрения в нашу команду.
Чтобы защитить себя от возможных мошенничеств, помните, что рекрутеры Anthropic связываются с вами только с адресов электронной почты @anthropic.com. В некоторых случаях мы сотрудничаем с проверенными рекрутинговыми агентствами, которые представляются как работающие от имени Anthropic. Будьте осторожны с письмами с других доменов. Законные рекрутеры Anthropic никогда не будут просить деньги, сборы или банковскую информацию до вашего первого рабочего дня. Если вы сомневаетесь в каком-либо сообщении, не переходите по ссылкам — посетите anthropic.com/careers напрямую для подтверждения открытых вакансий.
Мы считаем, что исследования ИИ с наибольшим воздействием — это большие научные проекты. В Anthropic мы работаем как единая сплоченная команда над несколькими крупномасштабными исследовательскими инициативами. Мы ценим влияние — продвижение наших долгосрочных целей по созданию управляемого, надежного ИИ — а не работу над мелкими и более специфическими задачами. Мы рассматриваем исследования ИИ как эмпирическую науку, которая имеет столько общего с физикой и биологией, сколько и с традиционными усилиями в области компьютерных наук. Мы — чрезвычайно коллективная группа и регулярно проводим исследовательские обсуждения, чтобы гарантировать, что мы занимаемся наиболее значимыми задачами в любой момент времени. Поэтому мы очень ценим навыки коммуникации.
Самый простой способ понять наши исследовательские направления — прочитать наши последние исследования. Эти исследования продолжают многие направления, над которыми наша команда работала до Anthropic, включая: GPT-3, интерпретируемость на основе цепей, мультимодальные нейроны, законы масштабирования, ИИ и вычисления, конкретные проблемы безопасности ИИ и обучение на основе человеческих предпочтений.
Anthropic — это корпорация общественной пользы с главным офисом в Сан-Франциско. Мы предлагаем конкурентоспособную компенсацию и льготы, опциональное сопоставление пожертвований акциями, щедрый отпуск и декретный отпуск, гибкий график работы и прекрасное офисное пространство для совместной работы с коллегами. Руководство по использованию ИИ кандидатами: Узнайте о нашей политике использования ИИ в процессе подачи заявок.
Хотите строить карьеру в Anthropic? Получайте будущие возможности прямо на вашу электронную почту.
Создать оповещение.* обозначает обязательное поле