{ "cells": [ { "cell_type": "markdown", "metadata": { "id": "zjOLc2Kk87oO" }, "source": [ "# Phystech@DataScience" ] }, { "cell_type": "markdown", "source": [ "# Логистическая регрессия" ], "metadata": { "id": "K7S9_RcamDlC" } }, { "cell_type": "code", "execution_count": null, "metadata": { "id": "PkpQ51MRQ_8X" }, "outputs": [], "source": [ "import numpy as np\n", "import pandas as pd\n", "import matplotlib.pyplot as plt\n", "\n", "from sklearn.linear_model import LogisticRegression\n", "from sklearn.model_selection import train_test_split\n", "from sklearn.preprocessing import StandardScaler\n", "from sklearn.metrics import accuracy_score\n", "\n", "import seaborn as sns\n", "sns.set_theme(style='dark', font_scale=1.3)\n", "\n", "import warnings\n", "warnings.filterwarnings('ignore')" ] }, { "cell_type": "markdown", "source": [ "## Физика : [датасет](https://www.kaggle.com/colearninglounge/predicting-pulsar-starintermediate) на предсказание пульсаров" ], "metadata": { "id": "YZ5Y3uGW5JCy" } }, { "cell_type": "markdown", "source": [ "" ], "metadata": { "id": "kqcuJrP8J1Yj" } }, { "cell_type": "markdown", "source": [ "Пульсары - это космические объекты, излучающие в различных диапазонах длины волны. Согласно современным астрофизическим теориям, пульсары представляют собой вращающиеся нейтронные звезды, обладающие магнитным полем, наклоненным относительно оси вращения.\n", "\n", "В используемом датасете есть как примеры ложных обнаружений, так и примеры реальных пульсаров, подтвержденные учеными. Данные получены в результате [The High Time Resolution Universe Pulsar Survey I](https://arxiv.org/abs/1006.5744)." ], "metadata": { "id": "Yry5SfW046KN" } }, { "cell_type": "markdown", "source": [ "
\n", "
1. Hemoglobin: это белок в красных кровяных тельцах (эритроцитах), который отвечает за перенос кислорода из лёгких в ткани и органы, а также за возврат углекислого газа обратно в лёгкие.
\n", "Нормальные значения:
\n", "2. MCH (Mean Corpuscular Hemoglobin): показывает среднее количество гемоглобина в одном эритроците.
\n", "3. MCHC (Mean Corpuscular Hemoglobin Concentration): показывает среднюю концентрацию гемоглобина в единице объёма эритроцитов.
\n", "4. MCV (Mean Corpuscular Volume): показывает средний объём одного эритроцита.
\n", "5. GENDER (Пол): указывает пол пациента (мужской или женский). В данном датасете пол уже закодирован как 0 и 1.
\n", "6. IDENTIFICATION (Идентификация): уникальный идентификатор пациента, который указывает на наличие/отсутствие заболевания.
\n", "Как можно заметить наши данные используются в классификации и выявлении различных типов анемии из реальной жизни.
\n", "\n", "