import pandas as pd
import numpy as np
from sklearn.model_selection import train_test_split
from sklearn.preprocessing import StandardScaler
from sklearn.linear_model import LogisticRegression
from sklearn.metrics import accuracy_score, classification_report
# Загрузка данных (замените на ваш источник данных)
data = pd.read_csv('sports_data.csv')
# Предобработка данных
# Пример: преобразование категориальных переменных в числовые
data['team1'] = data['team1'].astype('category').cat.codes
data['team2'] = data['team2'].astype('category').cat.codes
# Выбор признаков и целевой переменной
X = data[['team1', 'team2', 'team1_score', 'team2_score', 'team1_wins', 'team2_wins']]
y = data['outcome'] # Целевая переменная (победа/поражение)
# Разделение данных на тренировочную и тестовую выборки
X_train, X_test, y_train, y_test = train_test_split(X, y, test_size=0.2, random_state=42)
# Масштабирование признаков
scaler = StandardScaler
X_train = scaler.fit_transform(X_train)
X_test = scaler.transform(X_test)
# Создание и обучение модели логистической регрессии
model = LogisticRegression
model.fit(X_train, y_train)
# Прогнозирование на тестовых данных