Сан-Франциско, Калифорния | Нью-Йорк, Нью-Йорк
Миссия Anthropic — создавать надежные, интерпретируемые и управляемые системы искусственного интеллекта. Мы хотим, чтобы ИИ был безопасным и полезным для наших пользователей и для общества в целом. Наша команда — это быстрорастущая группа преданных своему делу исследователей, инженеров, экспертов по политике и бизнес-лидеров, которые работают вместе над созданием полезных систем ИИ.
Наши команды по обучению с подкреплением играют ключевую роль в развитии наших систем ИИ. Мы внесли вклад во все модели Claude, значительно повлияв на автономность и возможности кодирования наших последних моделей Claude. Наша работа охватывает несколько ключевых направлений:
Мы тесно сотрудничаем с командами Anthropic по выравниванию и передовыми командами по безопасности, чтобы гарантировать, что наши системы одновременно способны и безопасны. Мы сотрудничаем с командой прикладного производственного обучения, чтобы внедрять инновации исследований в развернутые модели, и стремимся реализовывать наши исследования в масштабе. Наши команды по обучению с подкреплением находятся на пересечении передовых исследований и инженерного мастерства, с глубоким обязательством создавать высококачественные, масштабируемые системы, которые расширяют границы возможностей ИИ.
Мы нанимаем в команду Code RL в рамках организации RL. В качестве инженера-исследователя вы будете развивать способность наших моделей писать, редактировать, тестировать, отлаживать и выпускать реальное программное обеспечение — от начала до конца, на реальных кодовых базах, с реальными инструментами — и делать это правильно, быстро и безопасно.
Эта роль сочетает в себе исследовательскую и инженерную работу. Вы будете проектировать среды RL и задачи кодирования, создавать сигналы вознаграждения и проверяющие механизмы, которые отражают, что значит «хороший код», запускать обучающие эксперименты на передовых моделях, диагностировать, почему модель улучшается (или не улучшается) в определённом классе задач программной инженерии, а также улучшать скорость и надежность конвейеров, которые обеспечивают быструю итерацию всего этого. Code RL охватывает несколько областей — от агентных кодирующих поведений и корректности кода до долгосрочной автономной инженерии и высокопроизводительного кода для ускорителей — и мы подберём вам область, в которой вы сможете оказать наибольшее влияние.
Связанные вакансии:
Годовой диапазон компенсации для этой роли указан ниже.
Для ролей в продажах указанный диапазон является диапазоном целевого дохода ("OTE"), что означает, что диапазон включает как целевые комиссионные/бонусы за продажи, так и годовую базовую зарплату по роли.
500 000 - 850 000 долларов США
Степень бакалавра или эквивалентное сочетание образования, обучения и/или опыта
Область, релевантная роли, подтверждённая учебными курсами, обучением или профессиональным опытом
Требуемый опыт будет соответствовать внутренним требованиям уровня должности
В настоящее время мы ожидаем, что весь персонал будет находиться в одном из наших офисов не менее 25% времени. Однако некоторые роли могут требовать большего времени в офисе.
Мы спонсируем визы! Однако мы не можем гарантированно спонсировать визы для каждой роли и каждого кандидата. Но если мы сделаем вам предложение, мы приложим все разумные усилия, чтобы получить для вас визу, и у нас есть иммиграционный юрист, который помогает в этом.
Мы призываем вас подавать заявку, даже если вы не уверены, что соответствуете всем требованиям. Не все сильные кандидаты соответствуют каждому из перечисленных требований. Исследования показывают, что люди из недостаточно представленных групп чаще испытывают синдром самозванца и сомневаются в силе своей кандидатуры, поэтому мы настоятельно рекомендуем не исключать себя преждевременно и подавать заявку, если вас интересует эта работа. Мы считаем, что системы ИИ, подобные тем, что мы создаём, имеют огромные социальные и этические последствия. Это делает представительство ещё более важным, и мы стремимся включать разнообразные точки зрения в нашу команду.
Ваша безопасность важна для нас. Чтобы защитить себя от возможных мошенничеств, помните, что рекрутеры Anthropic связываются с вами только с адресов электронной почты @anthropic.com. В некоторых случаях мы сотрудничаем с проверенными рекрутинговыми агентствами, которые представляются как работающие от имени Anthropic. Будьте осторожны с письмами с других доменов. Законные рекрутеры Anthropic никогда не будут просить деньги, сборы или банковскую информацию до вашего первого рабочего дня. Если вы сомневаетесь в каком-либо сообщении, не переходите по ссылкам — посетите anthropic.com/careers напрямую для подтверждения открытых вакансий.
Мы считаем, что исследования ИИ с наибольшим воздействием будут крупномасштабными научными проектами. В Anthropic мы работаем как единая сплочённая команда над всего несколькими крупными исследовательскими инициативами. И мы ценим влияние — продвижение наших долгосрочных целей по созданию управляемого, заслуживающего доверия ИИ — а не работу над мелкими и более специфическими задачами. Мы рассматриваем исследования ИИ как эмпирическую науку, которая имеет столько общего с физикой и биологией, сколько и с традиционными усилиями в области компьютерных наук. Мы — чрезвычайно совместная группа и часто проводим исследовательские обсуждения, чтобы гарантировать, что в любой момент времени мы занимаемся наиболее значимой работой. Поэтому мы очень ценим навыки коммуникации.
Самый простой способ понять наши исследовательские направления — прочитать наши последние исследования. Эти исследования продолжают многие направления, над которыми работала наша команда до Anthropic, включая: GPT-3, интерпретируемость на основе цепей, мультимодальные нейроны, законы масштабирования, ИИ и вычисления, конкретные проблемы безопасности ИИ и обучение на основе человеческих предпочтений.
Anthropic — это корпорация общественной пользы с головным офисом в Сан-Франциско. Мы предлагаем конкурентоспособную компенсацию и льготы, опциональное сопоставление пожертвований акциями, щедрый отпуск и декретный отпуск, гибкий график работы и прекрасное офисное пространство для совместной работы с коллегами.
Руководство по использованию ИИ кандидатами: Узнайте о нашей политике использования ИИ в процессе подачи заявок.
Будьте осторожны: если работодатель просит войти через Google, iCloud или Госуслуги, прислать код или пароль, запустить ПО или перевести деньги — это мошенники.