Seeking Alpha ищет талантливого и опытного старшего инженера по работе с данными, который присоединится к нам.
В этом В этой роли вы будете проектировать, создавать и поддерживать инфраструктуру, необходимую для анализа больших наборов данных. Будучи экспертом в области управления данными, процессов ETL (извлечение, преобразование, загрузка) и хранилищ данных, вы будете работать с различными технологиями больших данных, такими как базы данных Hadoop, Spark и NoSQL.
Помимо ваших технических знаний , вам понадобятся сильные навыки общения и сотрудничества. Вы будете тесно сотрудничать с командой данных и аналитики, а также другими заинтересованными сторонами, чтобы определять и определять приоритетность проектов по обработке данных, обеспечивая соответствие инфраструктуры данных общим бизнес-целям и задачам.
Почему мы отличная компания работать
Seeking Alpha — ведущее онлайн-направление для заинтересованных инвесторов. У нас есть потрясающий продукт. Наши краудсорсинговые исследования и передовые инструменты инвестирования помогают почти 300 000 платных подписчиков достичь своих финансовых целей.
Мы заботимся о балансе между работой и личной жизнью: мы работаем в основном из дома, предоставляем множество льгот и настаиваем на том, чтобы вы наслаждайтесь ими.
Мы инвестируем в людей. Мы рассматриваем каждого сотрудника как долгосрочную инвестицию и видим ценность в постоянном воспитании и обучении наших товарищей по команде.
Если вы тоже этого ищете, подайте заявку! >
ОБЯЗАННОСТИ
- Тесно сотрудничать с учеными/аналитиками данных и другими заинтересованными сторонами для определения и определения приоритетности проектов по обработке данных и обеспечить соответствие инфраструктуры данных целям и задачам бизнеса.
- Проектировать, создавать и поддерживать оптимальную архитектуру конвейера данных для извлечения, преобразования и загрузки данных из самых разных источников данных, включая внешние API. , потоки данных и хранилища данных.
- Постоянно отслеживайте и оптимизируйте производительность и надежность инфраструктуры данных, а также находите и внедряйте решения для повышения масштабируемости, эффективности и безопасности.
- Будьте в курсе последних тенденций. и разработки в области обработки данных, а также использовать эти знания для выявления возможностей для улучшения и инноваций внутри организации.
- Решайте сложные проблемы в быстро меняющейся и развивающейся среде, сохраняя при этом бескомпромиссное качество.
- Реализовать требования к конфиденциальности и безопасности данных, чтобы обеспечить соответствие решений стандартам и платформам безопасности.
- Расширить возможности команды разработчиков.
< p>
ТРЕБОВАНИЯ- Степень бакалавра или магистра в области компьютерных наук, инженерии или смежных областях
- 2+ года подтвержденного опыта разработки крупных масштабировать программное обеспечение с использованием объектно-ориентированного или функционального языка.
- 5+ лет профессионального опыта в области разработки данных, уделяя особое внимание созданию и обслуживанию конвейеров данных и хранилищ данных.
- Большой опыт работы со Spark, Scala и Python, включая умение писать высокопроизводительный и удобный в сопровождении код.
- Опыт работы с сервисами AWS, включая EC2, S3, Athena, Lambda и EMR.
- Знакомство с концепциями и технологиями хранилищ данных, такими как столбчатое хранилище, озера данных и SQL.
- Опыт оркестрации и планирования конвейеров данных с использованием таких инструментов, как Airflow.
- Умелое решение проблем. навыки и способность работать самостоятельно, а также в команде.
- Английский язык на высоком уровне – обязательно.
- Командный игрок с отличными навыками сотрудничества.
Приятно иметь:
- опыт работы с Vertica или Redshift, включая опыт оптимизации запросов и настройки производительности.
< li>Опыт работы в проектах по машинному обучению и/или науке о данных.- Знание лучших практик управления данными и безопасности, включая правила конфиденциальности данных, такие как GDPR и CCPA.
- Знание внутреннего устройства Spark (настройка). , оптимизация запросов)