kaggle competition on building classification model to predict probas of startup keeping work / closed
TASK: Для каждого стартапа предскажите категориальное значение соответствующее прогнозу ['operating', 'closed'].
Данные:
Датасет состоит из двух файлов: тренировочный набор (около 53к записей) и тестовый набор (около 13к записей).
Тренировочный набор содержит целевой признак status, указывающий на то, закрылся стартап или продолжает действовать.
Временной период - '1970-01-01' по '2018-01-01'. Дата формирования выгрузки - '2018-01-01'
-
kaggle_startups_train_01.csv - информация (53 000) стартапах, которые будут использоваться в качестве обучающих данных.
-
kaggle_startups_test_01.csv - информация (13 000) стартапах, которые будут использоваться в качестве тестовых данных. Ваша задача - предсказать значение 'status' для каждого стартапа из этого датасета.
-
kaggle_startups_sample_submit_01.csv - файл с примером предсказаний в правильном формате.
-
name - идентификатор (название) стартапа в тестовом наборе.
-
status - целевой признак. Описание полей данных
-
name - Название стартапа
-
category_list - Список категорий, к которым относится стартап
-
funding_total_usd - Общая сумма финансирования в USD
-
status - Статус стартапа (закрыт или действующий)
-
country_code - Код страны
-
state_code - Код штата
-
region - Регион
-
city - Город
-
funding_rounds - Количество раундов финансирования
-
founded_at - Дата основания
-
first_funding_at - Дата первого раунда финансирования
-
last_funding_at - Дата последнего раунда финансирования
-
closed_at - Дата закрытия стартапа (если применимо)
-
lifetime - Время существования стартапа в днях