# Bot check

# HW_ID: fpmi_ad10
# Бот проверит этот ID и предупредит, если случайно сдать что-то не то.

# Status: not final
# Перед отправкой в финальном решении удали "not" в строчке выше.
# Так бот проверит, что ты отправляешь финальную версию, а не промежуточную.
# Никакие значения в этой ячейке не влияют на факт сдачи работы.

import requests
from time import sleep
import json

import numpy as np
import pandas as pd
import matplotlib.pyplot as plt
import seaborn as sns

sns.set(style="whitegrid", font_scale=1.3, palette="Set2")

URL = "https://api.hh.ru/vacancies"

params = {
    "text": "Data Scientist",
    "area": 1,
    "page": 0,
    "per_page": 10,
}

req = requests.get(URL, params)
data = json.loads(req.content.decode())

data.keys()

dict_keys(['items', 'found', 'pages', 'page', 'per_page', 'clusters', 'arguments', 'fixes', 'suggests', 'alternate_url'])

data["items"][0]

{'id': '119624423',
 'premium': False,
 'name': 'Data Scientist (Middle+/Senior)',
 'department': None,
 'has_test': False,
 'response_letter_required': False,
 'area': {'id': '1', 'name': 'Москва', 'url': 'https://api.hh.ru/areas/1'},
 'salary': None,
 'salary_range': None,
 'type': {'id': 'open', 'name': 'Открытая'},
 'address': {'city': 'Москва',
  'street': 'Западный административный округ, Можайский район, Инновационный центр Сколково, Большой бульвар',
  'building': '30с1',
  'lat': 55.698548,
  'lng': 37.359415,
  'description': None,
  'raw': 'Москва, Западный административный округ, Можайский район, Инновационный центр Сколково, Большой бульвар, 30с1',
  'metro': None,
  'metro_stations': [],
  'id': '4578402'},
 'response_url': None,
 'sort_point_distance': None,
 'published_at': '2025-04-17T09:58:23+0300',
 'created_at': '2025-04-17T09:58:23+0300',
 'archived': False,
 'apply_alternate_url': 'https://hh.ru/applicant/vacancy_response?vacancyId=119624423',
 'branding': {'type': 'CONSTRUCTOR', 'tariff': 'BASIC'},
 'show_logo_in_search': True,
 'insider_interview': None,
 'url': 'https://api.hh.ru/vacancies/119624423?host=hh.ru',
 'alternate_url': 'https://hh.ru/vacancy/119624423',
 'relations': [],
 'employer': {'id': '4977893',
  'name': 'СберМедИИ',
  'url': 'https://api.hh.ru/employers/4977893',
  'alternate_url': 'https://hh.ru/employer/4977893',
  'logo_urls': {'original': 'https://img.hhcdn.ru/employer-logo-original/1372877.png',
   '90': 'https://img.hhcdn.ru/employer-logo/7111410.png',
   '240': 'https://img.hhcdn.ru/employer-logo/7111411.png'},
  'vacancies_url': 'https://api.hh.ru/vacancies?employer_id=4977893',
  'accredited_it_employer': True,
  'employer_rating': {'total_rating': '4.6', 'reviews_count': 9},
  'trusted': True},
 'snippet': {'requirement': 'Опыт работы на позиции <highlighttext>Data</highlighttext> <highlighttext>Scientist</highlighttext> от 2-х лет. Глубокие знания и опыт работы с методами машинного обучения. ',
  'responsibility': 'Участвовать в исследовании новых данных, оценивать их качество и полноту. Разрабатывать, тестировать и поддерживать CV/NLP модели медицинского ИИ. '},
 'show_contacts': False,
 'contacts': None,
 'schedule': {'id': 'remote', 'name': 'Удаленная работа'},
 'working_days': [],
 'working_time_intervals': [],
 'working_time_modes': [],
 'accept_temporary': False,
 'fly_in_fly_out_duration': [],
 'work_format': [{'id': 'REMOTE', 'name': 'Удалённо'}],
 'working_hours': [{'id': 'HOURS_8', 'name': '8\xa0часов'}],
 'work_schedule_by_days': [{'id': 'FIVE_ON_TWO_OFF', 'name': '5/2'}],
 'night_shifts': False,
 'professional_roles': [{'id': '165', 'name': 'Дата-сайентист'}],
 'accept_incomplete_resumes': False,
 'experience': {'id': 'between3And6', 'name': 'От 3 до 6 лет'},
 'employment': {'id': 'full', 'name': 'Полная занятость'},
 'employment_form': {'id': 'FULL', 'name': 'Полная'},
 'internship': False,
 'adv_response_url': None,
 'is_adv_vacancy': False,
 'adv_context': None}

data["found"]

283

data["pages"]

29

df = pd.json_normalize(data["items"])
df.head()

vacancy = df["id"].iloc[0]
vacancy_url = f"https://api.hh.ru/vacancies/{vacancy}"

req = requests.get(vacancy_url)
vacancy_info = json.loads(req.content.decode())

vacancy_info

{'id': '119624423',
 'premium': False,
 'billing_type': {'id': 'standard_plus', 'name': 'Стандарт плюс'},
 'relations': [],
 'name': 'Data Scientist (Middle+/Senior)',
 'insider_interview': None,
 'response_letter_required': False,
 'area': {'id': '1', 'name': 'Москва', 'url': 'https://api.hh.ru/areas/1'},
 'salary': None,
 'salary_range': None,
 'type': {'id': 'open', 'name': 'Открытая'},
 'address': {'city': 'Москва',
  'street': 'Западный административный округ, Можайский район, Инновационный центр Сколково, Большой бульвар',
  'building': '30с1',
  'lat': 55.698548,
  'lng': 37.359415,
  'description': None,
  'raw': 'Москва, Западный административный округ, Можайский район, Инновационный центр Сколково, Большой бульвар, 30с1',
  'metro': None,
  'metro_stations': []},
 'allow_messages': True,
 'experience': {'id': 'between3And6', 'name': 'От 3 до 6 лет'},
 'schedule': {'id': 'remote', 'name': 'Удаленная работа'},
 'employment': {'id': 'full', 'name': 'Полная занятость'},
 'department': None,
 'show_contacts': False,
 'contacts': None,
 'description': '<p>Мы стремимся повышать уровень здоровья людей и для этой цели обеспечиваем врачей и медицинские организации актуальными и удобными решениями.</p> <p>Сейчас в нашу команду мы ищем опытного <strong>Data scientist</strong> для разработки алгоритмов CV/NLP для решения различных медицинских задач.</p> <p><strong>Чем предстоит заниматься:</strong></p> <ul> <li>Участвовать в исследовании новых данных, оценивать их качество и полноту;</li> <li>Разрабатывать, тестировать и поддерживать CV/NLP модели медицинского ИИ;</li> <li>Разрабатывать и внедрять AI-агенты на базе большой языковой модели GigaChat;</li> <li>Разрабатывать код обучения для моделей медицинского ИИ;</li> <li>Анализировать и выбирать подходы к решению поставленных задач.</li> <li>Анализировать большие данные и разрабатывать модели для решения конкретных бизнес-задач;</li> <li>Работать со смежными командами для интеграции моделей и решений в промышленные бизнес-процессы.</li> </ul> <p><strong>Наши ожидания от кандидатов:</strong></p> <ul> <li>Опыт работы на позиции Data Scientist от 2-х лет;</li> <li>Глубокие знания и опыт работы с методами машинного обучения;</li> <li>Опыт работы с моделями CV/NLP;</li> <li>Навыки программирования на Python;</li> <li>Опыт работы с библиотеками машинного обучения (TensorFlow, PyTorch, Scikit-Learn, Numpy, Pandas, Polars);</li> <li>Навыки работы с Git;</li> <li>Умение работать с большими данными и базами данных (SQL, NoSQL).</li> </ul> <p><strong>Мы предлагаем:</strong></p> <ul> <li>Работу с социально значимыми проектами в медицинской сфере.</li> <li>Причастность к созданию инновационных продуктов с использованием алгоритмов ИИ.</li> <li>Перспективу профессионального развития и самореализации в перспективном направлении MedTech.</li> <li>Удаленный формат работы либо красивый, просторный и современный<strong> </strong>офис на территории Инновационного центра Сколково.</li> <li>Стабильность и социальную поддержку от крупнейшей компании страны.</li> </ul>',
 'branded_description': None,
 'vacancy_constructor_template': {'id': 19984,
  'name': 'Общий шаблон',
  'top_picture': {'height': 560,
   'width': 1540,
   'path': 'https://img.hhcdn.ru/branding-pictures/3130950.jpeg',
   'blurred_path': None},
  'bottom_picture': {'height': 704,
   'width': 1540,
   'path': 'https://img.hhcdn.ru/branding-pictures/3130964.png',
   'blurred_path': None}},
 'key_skills': [{'name': 'Machine learning'},
  {'name': 'TensorFlow'},
  {'name': 'PyTorch'},
  {'name': 'NLP'},
  {'name': 'Python'},
  {'name': 'SQL'}],
 'accept_handicapped': False,
 'accept_kids': False,
 'archived': False,
 'response_url': None,
 'specializations': [],
 'professional_roles': [{'id': '165', 'name': 'Дата-сайентист'}],
 'code': None,
 'hidden': False,
 'quick_responses_allowed': False,
 'driver_license_types': [],
 'accept_incomplete_resumes': False,
 'employer': {'id': '4977893',
  'name': 'СберМедИИ',
  'url': 'https://api.hh.ru/employers/4977893',
  'alternate_url': 'https://hh.ru/employer/4977893',
  'logo_urls': {'original': 'https://img.hhcdn.ru/employer-logo-original/1372877.png',
   '90': 'https://img.hhcdn.ru/employer-logo/7111410.png',
   '240': 'https://img.hhcdn.ru/employer-logo/7111411.png'},
  'vacancies_url': 'https://api.hh.ru/vacancies?employer_id=4977893',
  'accredited_it_employer': True,
  'trusted': True},
 'published_at': '2025-04-17T09:58:23+0300',
 'created_at': '2025-04-17T09:58:23+0300',
 'initial_created_at': '2025-04-17T09:58:23+0300',
 'negotiations_url': None,
 'suitable_resumes_url': None,
 'apply_alternate_url': 'https://hh.ru/applicant/vacancy_response?vacancyId=119624423',
 'has_test': False,
 'test': None,
 'alternate_url': 'https://hh.ru/vacancy/119624423',
 'working_days': [],
 'working_time_intervals': [],
 'working_time_modes': [],
 'accept_temporary': False,
 'languages': [],
 'approved': True,
 'employment_form': {'id': 'FULL', 'name': 'Полная'},
 'fly_in_fly_out_duration': [],
 'internship': False,
 'night_shifts': False,
 'work_format': [{'id': 'REMOTE', 'name': 'Удалённо'}],
 'work_schedule_by_days': [{'id': 'FIVE_ON_TWO_OFF', 'name': '5/2'}],
 'working_hours': [{'id': 'HOURS_8', 'name': '8\xa0часов'}],
 'show_logo_in_search': True}

	id	premium	name	department	has_test	response_letter_required	salary	salary_range	response_url	sort_point_distance	...	salary.gross	salary_range.from	salary_range.to	salary_range.currency	salary_range.gross	salary_range.mode.id	salary_range.mode.name	salary_range.frequency	department.id	department.name
0	119624423	False	Data Scientist (Middle+/Senior)	NaN	False	False	NaN	NaN	None	None	...	NaN	NaN	NaN	NaN	NaN	NaN	NaN	NaN	NaN	NaN
1	119496066	False	Data Scientist	NaN	False	False	NaN	NaN	None	None	...	NaN	NaN	NaN	NaN	NaN	NaN	NaN	NaN	NaN	NaN
2	119556787	False	Data Scientist (AI Stylist)	NaN	False	False	NaN	NaN	None	None	...	NaN	NaN	NaN	NaN	NaN	NaN	NaN	NaN	NaN	NaN
3	119495959	False	Junior ML Engineer / Data Scientist	NaN	False	False	NaN	NaN	None	None	...	True	120000.0	200000.0	RUR	True	MONTH	За месяц	NaN	NaN	NaN
4	119647385	False	Data Scientist (Middle)	NaN	False	False	NaN	NaN	None	None	...	NaN	NaN	NaN	NaN	NaN	NaN	NaN	NaN	NaN	NaN

Введение в анализ данных ¶

Домашнее задание 10. Анализ вакансий.¶

Справка по работе с API сервиса hh.ru.¶

Сложная часть¶

Задача 1.¶

Факультативная часть¶

Задача 2.¶

Задача 3.¶

Введение в анализ данных¶

Домашнее задание 10. Анализ вакансий.¶

Справка по работе с API сервиса hh.ru.¶

Сложная часть¶

Задача 1.¶

Факультативная часть¶

Задача 2.¶

Задача 3.¶

Введение в анализ данных ¶