О компании Anthropic

Миссия Anthropic — создавать надежные, интерпретируемые и управляемые системы искусственного интеллекта. Мы хотим, чтобы ИИ был безопасным и полезным для наших пользователей и общества в целом. Наша команда — это быстрорастущая группа преданных своему делу исследователей, инженеров, экспертов по политике и бизнес-лидеров, которые работают вместе над созданием полезных систем ИИ.

О роли

В качестве старшего научного сотрудника в нашей команде моделей вознаграждения вы будете руководить исследовательскими усилиями по улучшению способов задания и обучения человеческих предпочтений в масштабах. Ваша работа напрямую будет формировать то, как наши модели понимают и оптимизируют то, чего на самом деле хотят люди — позволяя Клоду быть более полезным, более надежным и лучше соответствовать человеческим ценностям.

Эта роль сосредоточена на продвижении передового рубежа моделирования вознаграждения для больших языковых моделей. Вы будете разрабатывать новые архитектуры и методологии обучения для RLHF, исследовать новые подходы к оценке и градации на основе LLM (включая методы на основе рубрик), а также изучать техники выявления и смягчения манипуляций с вознаграждением. Вы будете тесно сотрудничать с командами по всему Anthropic, включая команды по дообучению, науке о согласовании и нашу более широкую исследовательскую организацию, чтобы обеспечить преобразование вашей работы в конкретные улучшения как возможностей моделей, так и безопасности.

Мы ищем человека, который сможет вести амбициозные исследовательские программы и одновременно внедрять практические улучшения в производственные системы. У вас будет возможность работать над одними из самых важных открытых проблем в области согласования ИИ, имея доступ к передовым моделям и значительным вычислительным ресурсам. Ваша работа напрямую продвинет науку о том, как мы обучаем системы ИИ быть одновременно высокоэффективными и безопасными.

Примечание: для этой роли все собеседования проводятся на Python.

Обязанности

Руководить исследованиями новых архитектур моделей вознаграждения и подходов к обучению для RLHF
Разрабатывать и оценивать методы градации и оценки на основе LLM, включая подходы, основанные на рубриках, которые улучшают согласованность и интерпретируемость
Исследовать техники обнаружения, характеристики и смягчения манипуляций с вознаграждением и обхода спецификаций
Проектировать эксперименты для понимания обобщения, устойчивости и режимов сбоев моделей вознаграждения
Сотрудничать с командой дообучения для преобразования исследовательских идей в улучшения производственных обучающих конвейеров
Вносить вклад в научные публикации, блог-посты и внутреннюю документацию
Наставлять других исследователей и помогать накапливать институциональные знания по моделированию вознаграждения

Вы можете подойти, если

Имеете опыт исследовательских вкладов в области моделирования вознаграждения, RLHF или близких областей машинного обучения
Имеете опыт обучения и оценки моделей вознаграждения для больших языковых моделей
Уверенно проектируете и проводите масштабные эксперименты с использованием значительных вычислительных ресурсов
Эффективно работаете на стыке исследований и инженерии, быстро итеративно улучшая при сохранении научной строгости
Любите совместные исследования и умеете ясно доносить сложные идеи до разнообразной аудитории
Глубоко заботитесь о создании систем ИИ, которые одновременно высокоэффективны и безопасны

Сильные кандидаты также могут

Иметь опубликованные исследования по моделированию вознаграждения, обучению предпочтениям или RLHF
Иметь опыт работы с подходами LLM в роли судьи, включая задачи калибровки и надежности
Работать с проблемами манипуляций с вознаграждением, обхода спецификаций или связанными задачами устойчивости
Иметь опыт работы с конституционным ИИ, дебатами или другими масштабируемыми методами надзора
Вносить вклад в производственные системы машинного обучения в масштабе
Знакомы с техниками интерпретируемости, применяемыми для понимания поведения моделей вознаграждения

Логистика

Требования к образованию: Мы требуем как минимум степень бакалавра в смежной области или эквивалентный опыт. Политика гибридной работы в зависимости от местоположения: В настоящее время мы ожидаем, что весь персонал будет находиться в одном из наших офисов не менее 25% времени. Однако некоторые роли могут требовать большего времени в офисе.

Спонсорство визы: Мы спонсируем визы! Однако мы не можем гарантированно спонсировать визу для каждой роли и каждого кандидата. Но если мы сделаем вам предложение, мы приложим все разумные усилия, чтобы получить для вас визу, и у нас есть иммиграционный юрист, который помогает в этом.

Чем мы отличаемся

Мы считаем, что исследования ИИ с наибольшим воздействием — это большие научные проекты. В Anthropic мы работаем как единая сплоченная команда над всего несколькими крупномасштабными исследовательскими инициативами. И мы ценим влияние — продвижение наших долгосрочных целей по созданию управляемого, заслуживающего доверия ИИ — больше, чем работу над мелкими и более специфическими задачами. Мы рассматриваем исследования ИИ как эмпирическую науку, которая имеет столько общего с физикой и биологией, сколько и с традиционными усилиями в области компьютерных наук. Мы — чрезвычайно совместная группа и часто проводим исследовательские обсуждения, чтобы гарантировать, что в любой момент времени мы занимаемся работой с наибольшим воздействием. Поэтому мы очень ценим навыки коммуникации.

Присоединяйтесь к нам!

Anthropic — это корпорация общественной пользы с головным офисом в Сан-Франциско. Мы предлагаем конкурентоспособную оплату и льготы, опциональное сопоставление пожертвований в акции, щедрый отпуск и декретный отпуск, гибкий график работы и прекрасное офисное пространство для совместной работы с коллегами.

Research Scientist

О компании Anthropic

О роли

Обязанности

Вы можете подойти, если

Сильные кандидаты также могут

Логистика

Чем мы отличаемся

Присоединяйтесь к нам!

Сопроводим до оффера

Сопроводим до оффера

Похожие вакансии

Data Scientist

Аналитик по внедрению AI

Data Scientist (Анализ цены)

Research Engineer

Data Scientist

Data Engineer

Похожие вакансии

Data Scientist

Аналитик по внедрению AI

Data Scientist (Анализ цены)

Research Engineer

Data Scientist

Data Engineer