Давайте предположим, что мы хотим получить с помощью данных ECLS ответ на фундаментальный вопрос о роли родителей и образования: влияет ли количество книг в доме на успеваемость ребенка в школе? Хотя с помощью регрессионного анализа невозможно получить ответ именно на такой вопрос, мы можем ответить на немного другой, а именно – насколько лучше учится школьник, в доме которого много книг. Разница между первым и вторым вопросом олицетворяет разницу между причинно-следственной связью (вопрос 1) и корреляцией (вопрос 2). Регрессионный анализ позволяет определить наличие корреляции, однако не может установить причинно-следственной связи. В целом существует несколько типов корреляции двух переменных. X может быть причиной Y; Y может быть причиной X; возможно также, что причиной возникновения и X и Y служит некий третий фактор. Сама по себе регрессия не может сказать вам о том, идет ли снег из‑за того, что на улице низкая температура, или оба этих события просто происходят одновременно.
Данные ECLS показывают, к примеру, что ребенок, живущий в доме с большим количеством книг, обычно получает более высокие оценки по сравнению с ребенком, в доме которого нет книг. Соответственно, между этими двумя факторами имеется корреляция, и это полезно знать. Однако высокие оценки в школе коррелируют и с множеством других факторов. Если вы будете просто сравнивать две группы детей (различающихся между собой по количеству книг в доме), то такое сравнение не будет иметь особого смысла. Возможно, что количество книг в доме ребенка просто показывает, насколько много денег зарабатывают его родители. На самом деле нам необходимо оценить две группы детей, сходных между собой по всем параметрам (за исключением количества книг в доме), и определить, в какой степени этот единственный фактор влияет на школьные отметки.
Следует сказать, что регрессионный анализ является скорее искусством, а не наукой (и с этой точки зрения он имеет много общего с родительским трудом). Однако опытный исследователь вполне может использовать его для того, чтобы определить не только наличие или силу корреляции, но и наличие причинно-следственной связи.
Так что же могут сказать нам данные ECLS о результатах школьников? Несколько вещей. Первая связана с разрывом в оценках между белыми и чернокожими учениками.
Уже довольно давно было отмечено, что результаты чернокожих детей (даже еще до того, как они впервые появляются в школьном классе) оказываются ниже результатов их белых ровесников. Более того, результаты чернокожих детей постоянно оказывались ниже даже при контроле широкого набора переменных. (Контроль переменной, в сущности, означает исключение ее влияния. Отчасти это напоминает фору, которую дает сильный игрок более слабому перед началом матча. В случае научного исследования, такого как ECLS, исследователь должен контролировать любые сравнительные недостатки, которые могут иметься у любого отдельно взятого ученика, сравниваемого со «средним».) Однако новый набор данных помогает нам узнать еще одну историю. После того как контролю было подвергнуто несколько переменных, в том числе уровень дохода и образования родителей, а также возраст матери при рождении первенца в семье, различие между оценками чернокожих и белых детей, начиная с возраста начала учебы в школе, практически исчезло.
Это заключение представляет интерес в двух аспектах. Во-первых, это означает, что чернокожие дети могут наверстать упущенное и догнать своих белых ровесников. Во-вторых, это дает основания предположить, что имеющийся разрыв может быть связан с рядом вполне определяемых факторов. Данные показывают, что черные дети учатся плохо в школе не из‑за своего цвета кожи, а потому, что чаще всего являются выходцами из малообразованных и бедных семей. Стоит, однако, отметить, что два типичных ребенка – белый и черный, – имеющие одинаковое социально-экономическое происхождение, демонстрируют в детсадовском возрасте вполне сопоставимые результаты в математике и чтении.
Отличные новости, правда? Не торопитесь. Прежде всего стоит учесть следующее. Поскольку типичный чернокожий ребенок