# Bot check

# HW_ID: phds_sem10
# Бот проверит этот ID и предупредит, если случайно сдать что-то не то.

# Status: not final
# Перед отправкой в финальном решении удали "not" в строчке выше.
# Так бот проверит, что ты отправляешь финальную версию, а не промежуточную.
# Никакие значения в этой ячейке не влияют на факт сдачи работы.

import numpy as np
import scipy.stats as sps
import matplotlib.pyplot as plt
import pandas as pd
import seaborn as sns

%matplotlib inline
sns.set_style("whitegrid")

sps.t(df=50).rvs(4)

sps.norm(loc=0, scale=1).ppf(0.05)

sps.t(loc=0, scale=1, df=5).ppf(0.05)

alpha = 0.95
dfs =  <...>  # массив степеней свобод

# Ваш код

sample_size = 30
sample = <...>  # выборка

asymptotic_ci = <...>  # асимптотические ДИ

precise_ci = <...>  # точные ДИ

def calculate_asymptotic_confidence_intervals(sample, alpha=0.95):
    '''
    Функция для вычисления асимптотического доверительного интервала
        параметра сдвига для всех подвыборок выборки
    param sample: выборка,
    param alpha: уровень доверия

    return: асимптотический доверительный интервал
    '''

    # ваш код
    return


def calculate_confidence_intervals(sample, alpha=0.95):
    '''
    Функция для вычисления точный доверительного интервала
        параметра сдвига для всех подвыборок выборки
    param sample: выборка,
    param alpha: уровень доверия

    return: точный доверительный интервал
    '''

    # ваш код
    return

def draw_confidence_interval(
    left, right, estimation=None, sample=None,
    ylim=(-10, 10), color_estimation='#FF3300', color_interval='#00CC66',
    color_sample='#0066FF', label_estimation='Оценка',
    sample_label='Семпл', interval_label=None
):
    '''
    Рисует доверительный интервал и оценку в зависимости от размера выборки.

    :param left: левые границы интервалов (в зависимости от n)
    :param right: правые границы интервалов (в зависимости от n)
    :param estimation: оценки (в зависимости от n)
    :param sample: выборка
    :param ylim: ограничение вертикальной оси
    :param color_estimation: цвет оценки
    :param color_interval: цвет интервала
    :param color_sample: цвет выборки
    :param label_estimation: подпись для оценки
    '''

    time = np.arange(len(left)) + 1

    assert len(time) == len(right)

    # ваш код

    plt.legend(fontsize=16)
    plt.ylim(ylim)
    plt.xlabel('Размер выборки')
    plt.title('Зависимость значений \
доверительного интервала от размера выборки')
    plt.grid()

# ваш код

# Установка библиотек
# ! pip install scikit-image
# ! pip install tqdm

import numpy as np
import scipy.stats as sps

import matplotlib.pyplot as plt
import seaborn as sns

from skimage.transform import resize
from tqdm import tqdm

n = 5
images = [plt.imread('animals/animal_{}.jpg'.format(i + 1)) for i in range (n)]
images = [resize(images[i], (500, 500, 3)) for i in range (n)]

images[0].shape

plt.figure(figsize=(10, 3))

for i in range(5):
    plt.subplot(1, 5, i + 1)
    plt.imshow(images[i])
    plt.xticks([]), plt.yticks([])

plt.tight_layout()
plt.savefig('zoo.png', facecolor=(0,0,0,0))
plt.show()

arrow = plt.imread('animals/arrow.png')

plt.figure(figsize=(3, 3))
plt.imshow(arrow)
plt.xticks([])
plt.yticks([]);

def zoo_bootstrap(images, B=6, draw=False):
    '''
    Генерирует B бутстрепных выборок изображений 
    и возвращает среднее по каждой из них. 
    Если указан параметр draw, то рисует процесс на графике.
    '''
    # размер выборки
    n = len(images)
    # средние по бутстрепным выборкам
    bootstrap_means = []  
    
    if draw:
        plt.figure(figsize=(11.5, 9.5))

    for b in tqdm(range(B)):
        # сумма элементов бутстрепной выборки
        sum_bsample = 0

        for i in range(<РАЗМЕР БУТСТРЕПНОЙ ВЫБОРКИ>):
            # генерируем элемент бутстрепной выборки
            ind = <сгенерируйте случайный индекс от 0 до n>

            # добавляем его к сумме по этой выборке
            <добавьте это изображение к сумме элементов бутстрепной выборки>

            # визуализация элемента бутстрепной выборки
            if draw:
                plt.subplot(B, n + 2, b * (n + 2) + i + 1)

                plt.imshow(images[ind])

                plt.xticks([])
                plt.yticks([])
                if i == 0:
                    plt.ylabel('$X^*_{}$:       '.format(b+1), 
                               rotation=0, fontsize=26)
        
        # добавляем среднее по бутстрепной выборке
        current_mean = <посчитайте среднее по всей выборке, используя накопленную сумму sum_bsample>
        bootstrap_means.append(current_mean)

        if draw:
            # стрелка
            plt.subplot(B, n+2, b*(n+2)+i+2)
            plt.imshow(arrow)
            plt.axis('off'), plt.xticks([]), plt.yticks([])
            
            # среднее по бутстрепной выборке
            plt.subplot(B, n+2, b*(n+2)+i+3)
            plt.imshow(bootstrap_means[-1])
            plt.xticks([]), plt.yticks([])
            
    if draw:
        plt.tight_layout()
        plt.savefig('animals/zoo_bootstrap.png', facecolor=(0,0,0,0))
        plt.show()
    
    return bootstrap_means

bootstrap_means = zoo_bootstrap(images, draw=True)

bootstrap_var = <посчитайте дисперсию (не std) средних, полученных бутстрепом с учетом axis=0>
bvar_normed = bootstrap_var / bootstrap_var.max(axis=(0, 1)).reshape((1, 1, 3))

plt.figure(figsize=(10, 10))
plt.imshow(bvar_normed)
plt.xticks([]), plt.yticks([]);
plt.savefig('animals/zoo_bootstrap_var.png', facecolor=(0,0,0,0))
plt.show()

bootstrap_means = zoo_bootstrap(images, B=300)
bootstrap_var = <посчитайте дисперсию (не std) средних, полученных бутстрепом с учетом axis=0>
bvar_normed = bootstrap_var / bootstrap_var.max(axis=(0, 1)).reshape((1, 1, 3))

plt.figure(figsize=(10, 10))
plt.imshow(bvar_normed)
plt.xticks([]), plt.yticks([]);
plt.savefig('animals/zoo_bootstrap_var.png', facecolor=(0,0,0,0))
plt.show()

Phystech@DataScience ¶

Задача 1¶

Распределение Стьюдента¶

Квантили распределения Стьюдента¶

ДИ в нормальной модели¶

Задача 2¶

Звериный бутстреп¶

Phystech@DataScience¶

Задача 1¶

Распределение Стьюдента¶

Квантили распределения Стьюдента¶

ДИ в нормальной модели¶

Задача 2¶

Звериный бутстреп¶

Phystech@DataScience ¶