Миссия Anthropic — создавать надежные, интерпретируемые и управляемые системы искусственного интеллекта. Мы хотим, чтобы ИИ был безопасным и полезным для наших пользователей и общества в целом. Наша команда — это быстрорастущая группа преданных своему делу исследователей, инженеров, экспертов по политике и бизнес-лидеров, которые работают вместе над созданием полезных систем ИИ.
В качестве старшего научного сотрудника в нашей команде моделей вознаграждения вы будете руководить исследовательскими усилиями по улучшению способов задания и обучения человеческих предпочтений в масштабах. Ваша работа напрямую будет формировать то, как наши модели понимают и оптимизируют то, чего на самом деле хотят люди — позволяя Клоду быть более полезным, более надежным и лучше соответствовать человеческим ценностям.
Эта роль сосредоточена на продвижении передового рубежа моделирования вознаграждения для больших языковых моделей. Вы будете разрабатывать новые архитектуры и методологии обучения для RLHF, исследовать новые подходы к оценке и градации на основе LLM (включая методы на основе рубрик), а также изучать техники выявления и смягчения манипуляций с вознаграждением. Вы будете тесно сотрудничать с командами по всему Anthropic, включая команды по дообучению, науке о согласовании и нашу более широкую исследовательскую организацию, чтобы обеспечить преобразование вашей работы в конкретные улучшения как возможностей моделей, так и безопасности.
Мы ищем человека, который сможет вести амбициозные исследовательские программы и одновременно внедрять практические улучшения в производственные системы. У вас будет возможность работать над одними из самых важных открытых проблем в области согласования ИИ, имея доступ к передовым моделям и значительным вычислительным ресурсам. Ваша работа напрямую продвинет науку о том, как мы обучаем системы ИИ быть одновременно высокоэффективными и безопасными.
Примечание: для этой роли все собеседования проводятся на Python.
Требования к образованию: Мы требуем как минимум степень бакалавра в смежной области или эквивалентный опыт. Политика гибридной работы в зависимости от местоположения: В настоящее время мы ожидаем, что весь персонал будет находиться в одном из наших офисов не менее 25% времени. Однако некоторые роли могут требовать большего времени в офисе.
Спонсорство визы: Мы спонсируем визы! Однако мы не можем гарантированно спонсировать визу для каждой роли и каждого кандидата. Но если мы сделаем вам предложение, мы приложим все разумные усилия, чтобы получить для вас визу, и у нас есть иммиграционный юрист, который помогает в этом.
Мы считаем, что исследования ИИ с наибольшим воздействием — это большие научные проекты. В Anthropic мы работаем как единая сплоченная команда над всего несколькими крупномасштабными исследовательскими инициативами. И мы ценим влияние — продвижение наших долгосрочных целей по созданию управляемого, заслуживающего доверия ИИ — больше, чем работу над мелкими и более специфическими задачами. Мы рассматриваем исследования ИИ как эмпирическую науку, которая имеет столько общего с физикой и биологией, сколько и с традиционными усилиями в области компьютерных наук. Мы — чрезвычайно совместная группа и часто проводим исследовательские обсуждения, чтобы гарантировать, что в любой момент времени мы занимаемся работой с наибольшим воздействием. Поэтому мы очень ценим навыки коммуникации.
Anthropic — это корпорация общественной пользы с головным офисом в Сан-Франциско. Мы предлагаем конкурентоспособную оплату и льготы, опциональное сопоставление пожертвований в акции, щедрый отпуск и декретный отпуск, гибкий график работы и прекрасное офисное пространство для совместной работы с коллегами.