import numpy as np
import matplotlib.pyplot as plt
import seaborn as sns
import pandas as pd

sns.set_palette("Set2")

sample = [4, 23, 69, 90, 5, 45, 19, 21]

sample = [56, 20, 12, 10, 6, 84, 39, 57]

def no_numpy_scalar(v1, v2):
    """
    v1: list[n] --- первый вектор-аргумент длиной n
    v2: list[n] --- второй вектор-аргумент длиной n
    return c: float  --- результат скалярного произведения векторов v1 и v2

    Функция принимает на вход два вектора длиной n
    Возвращает число, равное их скалярному произведению v1 и v2

    Реализуйте скалярное умножение векторов, не используя функции из пакета numpy

    """
    result = sum(x * y for x, y in zip(v1, v2))
    return result


def numpy_scalar(v1, v2):
    """
    v1: np.array[n] --- первый вектор-аргумент длиной n
    v2: np.array[n] --- второй вектор-аргумент длиной n
    return c: float  --- результат скалярного произведения векторов v1 и v2

    Функция принимает на вход два вектора длиной n
    Возвращает число, равное их скалярному произведению

    Реализуйте скалярное умножение векторов, используя функции из пакета numpy
    """
    result = ...
    return result

# Генерация векторов
a = ...
b = ...

product_1 = no_numpy_scalar(a, b)
product_2 = numpy_scalar(a, b)

# проверим корректность:
assert np.allclose(product_1, product_2)

%time product_1 = no_numpy_scalar(a,b)
%time product_2 = numpy_scalar(a,b)

a = np.random.sample((100, 100))
b = np.random.sample((100, 100))

...

sales_data = np.random.randint(50, 200, size=(4, 3, 5))

discounts = np.array(
    [
        [0.9, 0.85, 0.95],
        [0.88, 0.92, 0.87],
        [0.93, 0.89, 0.91],
        [0.86, 0.94, 0.90],
    ]
)

def no_numpy_mult(a, b):
    """
    A: list of "size" lists, each contains "size" floats --- первая матрица-аргумент
    B: list of "size" lists, each contains "size" floats --- вторая матрица-аргумент
    return C: list of "size" lists, each contains "size" floats --- матрица, являющаяся результатом умножения матриц a и b

    Функция принимает на вход две матрицы: A и B размерностью size x size
    Возвращает матрицу их произведения A * B = C
    """

    size = len(a)
    result = [[0] * size for _ in range(size)]
    for i in range(size):
        for j in range(size):
            for k in range(size):
                result[i][j] += a[i][k] * b[k][j]
    return result


def numpy_mult(a, b):
    """
    A: np.ndarray[size, size] --- первая матрица-аргумент
    B: np.ndarray[size, size] --- вторая матрица-аргумент
    return C: np.array[size, size] --- матрица, являющаяся результатом умножения матриц A и B

    Функция принимает на вход две матрицы: A и B размерностью size x size
    Возвращает матрицу их произведения A * B = C

    Реализуйте умножение матриц, используя функции из пакета numpy
    """

    pass

M1 = no_numpy_mult(a, b)
M2 = numpy_mult(a, b)

# проверим корректность
assert np.allclose(np.array(M1), M2)

%time no_numpy_mult(a, b)
%time numpy_mult(a, b)

matrix = ...
transposed_matrix = ...
det = ...
inv_matrix = ...

print("Исходная матрица:\n", matrix)
print("Транспонированная матрица:\n", transposed_matrix)
print("Определитель:\n", det)
print("Обратная матрица:\n", inv_matrix)

coancated_matrix_col = ...
coancated_matrix_row = ...
splited_matrix_col = ...
coancated_matrix_row = ...

print("Объединение по столбцу\n", coancated_matrix_col)
print("Объединение по строке\n", coancated_matrix_row)
print("Разбитая матрица по столбцу\n", splited_matrix_col)
print("Разбитая матрица по строке\n", coancated_matrix_row)

...

...

...

sizes = ...

fig, axs = plt.subplots(figsize="размеры графика", ncols="колличество колонок")

...

plt.show()

# Параметры волны
size = ...  # размер сетки
amplitude = ...  # амплитуда волны
frequency = ...  # частота волны

# Создаем сетку координат
x = np.linspace()
y = np.linspace()
X, Y = ...

# Функция волны
Z = ...

# Построение статического изображения
...

# Параметры волны
frames = 100  # количество кадров

# Функция для обновления анимации


def update(frame):
    Z = ...
    cax.set_array(Z)
    ax.set_title(f"Frame {frame}")
    return (cax,)

import matplotlib.animation as animation
from IPython.display import HTML

# Создаем фигуру и оси
fig, ax = plt.subplots()
cax = ax.imshow(
    np.zeros((size, size)), cmap="viridis", extent=(-5, 5, -5, 5), animated=True
)
fig.colorbar(cax, ax=ax)

# Создаем анимацию
ani = animation.FuncAnimation(
    fig="объект графика",
    func="функция задающая распределение волны",
    frames=frames,
    interval=50,
    blit=True,
)

# Отображаем анимацию в Colab
HTML(ani.to_jshtml())

# Загрузка набора данных
data = sns.load_dataset("mpg")
# Удаление категориальных переменных
data = data.select_dtypes(include=["float64", "int64"])

# Вычисление матрицы корреляции
...

# Создание тепловой карты корреляции
...

# Генерация данных
x = ...  # независимая переменная

y = 2 * x + np.random.normal(
    loc=0, scale=1, size=100
)  # зависимаяпеременная (таргет)

# Построение scatter plot и линии регрессии
...

# Полный список месяцев
months = [
    "Январь",
    "Февраль",
    "Март",
    "Апрель",
    "Май",
    "Июнь",
    "Июль",
    "Август",
    "Сентябрь",
    "Октябрь",
    "Ноябрь",
    "Декабрь",
]

# Полный список индексов
indexes = [
    "Первый",
    "Второй",
    "Третий",
    "Четвёртый",
    "Пятый",
    "Шестой",
    "Седьмой",
    "Восьмой",
    "Девятый",
    "Десятый",
    "Одиннадцатый",
    "Двенадцатый",
]

# Создание Series
...

def complex_transform(x):
    ...
    return ...


def apply_complex_transform(series):
    """Применяет сложное преобразование к каждому элементу Series с
    использованием метода apply.

    Parameters:
    series (pd.Series): Входная Series с числовыми данными.

    Returns:
    pd.Series: Преобразованная Series.
    """
    return ...


def vectorized_operation(series):
    """Выполняет векторизированную операцию умножения всех элементов Series на 2.

    Parameters:
    series (pd.Series): Входная Series с числовыми данными.

    Returns:
    pd.Series: Преобразованная Series.
    """
    return ...

# Создание объекта Series
...

# Результаты преобразований
...

# Замеряем время выполнения функции с apply
%%time
transformed_series_apply = apply_complex_transform(series)

# Замеряем время выполнения векторизированной операции
%%time
transformed_series_vectorized = vectorized_operation(series)

# Создание данных о продажах за первый месяц
sales_january = pd.Series(
    [100, 150, 200, 250, 300, 350, 400],
    index=pd.date_range(start="2023-01-01", periods=7, freq="D"),
)

# Создание данных о продажах за второй месяц
sales_february = pd.Series(
    [450, 500, 550, 600, 650, 700, 750],
    index=pd.date_range(start="2023-02-01", periods=7, freq="D"),
)

# Объединение данных
...

data = pd.DataFrame(
    {
        "Category": [
            "Electronics",
            "Books",
            "Electronics",
            "Books",
            "Furniture",
            "Electronics",
            "Furniture",
        ],
        "Sales": [100, 150, 200, 250, 300, 350, 400],
    }
)

...

# Создание DataFrame с данными о продажах
sales_data = pd.DataFrame(
    {"ClientID": [1, 2, 3, 4, 5], "Sales": [100, 150, 200, 250, 300]}
)

# Создание DataFrame с данными о клиентах
clients_data = pd.DataFrame(
    {"ClientID": [1, 2, 3, 4, 5], "Age": [25, 30, 35, 40, 45]}
)

...

# Создание DataFrame с данными о характеристиках автомобилей
np.random.seed(0)  # Для воспроизводимости результатов

data = pd.DataFrame(
    {
        "Price": np.random.randint(20000, 50000, size=100),
        "Mileage": np.random.randint(1000, 50000, size=100),
        "Horsepower": np.random.randint(100, 400, size=100),
        "FuelEfficiency": np.random.randint(15, 40, size=100),
        "Age": np.random.randint(1, 10, size=100),
    }
)

...

Введение в анализ данных ¶

Задачи для самостоятельного решения¶

Библиотека `numpy`¶

Задача 1¶

Задача 2¶

Задача 3¶

Задача 4¶

Задача 5¶

Задача 6¶

Задача 7¶

Задача 8¶

Задача 9¶

Библиотеки `matplotlib` и `seaborn`¶

Задача 1¶

Задача 2¶

Задача 3¶

Задача 4¶

Задача 5¶

Задача 6¶

Библиотека `pandas`¶

Задача 1¶

Задача 2¶

Задача 3¶

Задача 4¶

Задача 5¶

Задача 7¶

Задача 8¶

Задача 9¶

Задача 10¶

Введение в анализ данных¶

Задачи для самостоятельного решения¶

Библиотека numpy¶

Задача 1¶

Задача 2¶

Задача 3¶

Задача 4¶

Задача 5¶

Задача 6¶

Задача 7¶

Задача 8¶

Задача 9¶

Библиотеки matplotlib и seaborn¶

Задача 1¶

Задача 2¶

Задача 3¶

Задача 4¶

Задача 5¶

Задача 6¶

Библиотека pandas¶

Задача 1¶

Задача 2¶

Задача 3¶

Задача 4¶

Задача 5¶

Задача 7¶

Задача 8¶

Задача 9¶

Задача 10¶

Введение в анализ данных ¶

Библиотека `numpy`¶

Библиотеки `matplotlib` и `seaborn`¶

Библиотека `pandas`¶