методология

Российское социальное исследование

Анкета РСИ  

В РСИ используются четыре вида вопросов

 

  • Международные вопросы из анкеты ESS

  • Национальные вопросы, включенные в список необходимых в международной базе данных (уровень образования, национальность респондента, доход, религия, профессия респондента, супруги(а), родителей, отрасль экономики, где работает респондент, регион проживания респондента).

  • Российские вопросы – включены только в России, не входят в международную базу данных.

  • Методические вопросы а) MTMM; б) Вопросы для интервьюера.

 

Все интервью в РСИ проводятся только на русском языке.

 

Перевод международных вопросов проводится методом TRAPD (Translation, Review, Adjudication, Pretesting and Documentation) – перевод, обсуждение, редактирование, предварительное тестирование и документирование [Harkness, 2003]. Этот метод представляет собой групповую работу над переводом, которая начинается с параллельным переводом двух переводчиков и командной экспертизы различий и трудностей. В экспертную группу для обсуждения в России входят А.В. Андреенкова, А.В. Федотов, А.Е. Бронникова, В.Г. Андреенков, В.С. Магун, М.Г. Руднев и специалисты в отдельных направлениях социологических знаний для перевода ротационных модулей. В ходе работы над анкетой учитываются переводы на русский язык, сделанные в других странах, использующих в опросах русский язык (Латвия, Литва, Эстония, Израиль, Грузия, Украина), но окончательное решение принимается при учете многих факторов.

 

Предварительное тестирование анкеты проводится качественным и количественным методами. В Волнах 3-8 тестирование проводилось методом интервью по полной анкете с респондентами из разных социально-демографических групп. В волнах 9-11 наряду с проведением тестовых интервью по полной анкете также использовались когнитивные интервью для тестирования отдельных новых вопросов.

 

Начиная с волны 9 опрос проводиться с помощью компьютерной программы на планшете или ноутбуке (CAPI). Подготовка программы в системе CAPI осуществляется специалистами ЦЕССИ (руководитель группы Е.В. Обиюх). В программу входит блок Отбора респондента и сведения о контактах, Основное интервью, Вопросы для интервьюера о ходе интервью. Визуальные вспомогательные материалы (карточки) для респондента в Волнах 9-11 используются в трех формах: бумажной печатной, электронной на индивидуальном устройстве (планшете) и электронной на центральном сервере онлайн.

Построение выборки

Генеральная совокупность РСИ:

 

наличное население РФ в возрасте 15 лет и старше, проживающее в жилых помещениях, независимо от национальности, гражданства и юридического статуса. В выборку включаются все, проживающие в отобранном домохозяйстве в течение срока опроса (2-3 месяца). Таким образом в опрос включаются трудовые мигранты, временно переехавшие лица, проживающие в жилых помещениях, студенты в общежитиях, но не включаются гости, приехавшие на короткий срок. К жилым помещениям относятся квартиры в многоквартирных домах, частные жилые дома, студенческие или другие общежития.

 

Исключены из выборки: a) поселения с «закрытым» режимом посещения, некоторые труднодоступные и малонаселенные районы Крайнего Севера, Сибири, Дальнего Востока и Северного Кавказа; б) проживающие в институциональных образованиях, таких как тюрьмы, военные поселения, дома престарелых, монастыри; в) проживающие в местах временного проживания людей - гостиницы, пансионаты, дома отдыха, больницы; г) находящиеся по любым причинам за пределами страны дольше срока проведения опроса (2-3 месяца). В Волне 11 полевые работы также не проводились на территориях боевых действий и закрытого режима.

Модель выборки:

 

Опросы РСИ построены на четырехступенчатой стратифицированной кластерной территориальной выборке.

Одинаковая модель выборки сохранялась на протяжении всех волн исследования. Однако, конкретный дизайн и реализация выборки отличались.

 

Стратификация в волнах 3-6 по 10 социально-экономическим зонам, Волна 7-11 – по федеральным округам (в базу данных включены переменные и СЭЗ и ФО в каждой волне).

 

В волнах 3-6 использовалась 4-ступенчатая выборка, где первичной единицей отбора (ПЕО) выступали городские и сельские населенные пункты, единицами на втором этапе отбора – избирательные участки, на третьем - домохозяйства, на четвертом – индивидуальные респонденты [Андреенков, 2009]. В волнах 7-11 использовалась 3-ступенчатая выборка. Первичной единицей отбора (ПЕО) выступали избирательные участки, на втором - домохозяйства, на третьем – индивидуальные респонденты.

 

В Волнах 3-6 отбор респондента внутри домохозяйства проводился с помощью набора случайно распределенных Бланков отбора на бумаге, в волнах 7-11 – автоматический случайный отбор респондента из членов домохозяйства системой CAPI.

Этапы построения выборки Волна 9-10.

 

Стратификация

Стратификация первичных единиц отбора (ПЕО) по географическому признаку - восьми федеральным округам. Общее количество отобранных ПЕО - 150. 15 крупнейших городов России представляют собой «самопредставительные» ПЕО (Ni > N/150) – численность составляющего эти города населения превышает средний размер ПЕО и они отобраны с вероятностью 1. В сумме эти города составляют 19% общего населения - 38 ПЕО. Остальные 122 ПЕО отобраны внутри каждой страты с вероятностью, пропорциональной численности населения страты от 15 лет и старше, методом систематического случайного отбора.

Ступень 1

Случайный отбор двух избирательных участков в каждом ПЕО с равной вероятностью. Границы и состав участков определены на основе официального деления на последних общенациональных выборах в Госдуму РФ (ЦИК). Участки, где численность избирателей существенно меньше среднего размера участка в 2000 избирателей, объединены с географически соседствующими в одну выборочную единицу.

Ступень 2

Предварительная перепись всех домохозяйств в отобранных избирательных участках методом физического обхода, наличных списков или геолокационной информации. Централизованный отбор домохозяйств из собранной базы данных.

Ступень 3

Перепись членов домохозяйства 15 лет и старше во время первого контакта с домохозяйством. Члены домохозяйства заносятся в список в фиксированном порядке – сначала все мужчины от самого старшего до самого младшего, потом все женщины по возрасту, начиная со старшей. Отбор респондента внутри домохозяйства проводится компьютерной программой CAPI методом случайного отбора.

размер выборки

 

Размер выборки для России в каждой волне составляет около 2500 интервью (см. отдельно по каждой волне), кроме Волны 10, где выборка составила 2000 интервью.

В странах ESS размер выборки в одной волне варьируется от 800 до 3500 интервью на страну в зависимости от типа выборки и предполагаемого уровня кооперации, чтобы достичь приблизительно равного размера эффективной выборки в 1500 кейсов для стран с численностью населения 2 млн. человек или больше и 800 кейсов для других стран.

Реализация выборки

Метод сбора информации в опросе – личные интервью по месту жительства респондента в Волнах 3-6 с помощью бумажных анкет, Волны 7-11 – компьютеризированное интервью CAPI на планшетах.

Каждая отобранная выборочная единица (домохозяйство) посещается не менее 4 раз при несостоявшемся интервью.

Информация об общем уровне достижимости (response rate), детальный анализ результатов контактов и сравнение структуры достигнутой выборки с данными государственной статистики по основным социально-демографическим и территориальным характеристикам представлены в Методических отчетах к каждой волне исследования.

Организация полевых работ

Средняя длительность интервью составляет 60 минут. В каждой волне исследования участвовали 250-300 интервьюеров, работу которых организовывали и контролировали 70-90 полевых менеджеров в разных частях страны.

Исследование проводится согласно «Декларации о профессиональной этике»[1]. В частности:

 

a) Все респонденты информируются о том, что участие в опросе добровольное, до проведения процедуры отбора респондента в семье;

b) Для респондентов, не достигших совершеннолетнего возраста (15-17 лет), получено устное согласие родителей на участие в опросе;

c) Выполняются процедуры сохранения анонимности и конфиденциальности индивидуальных ответов респондентов. Контактная не включается в основную базу данных и хранится отдельно с соблюдением мер безопасности фиксированный период, и используется только для целей проверки качества и уточнения информации, по окончанию периода хранения безопасным образом уничтожается. База данных, представленная в общественное пользование, проверена на потенциальную возможность идентификации конкретных респондентов, используя более переменных в их взаимосвязи. Информация, которая может привести к нарушению требования не-идентификации, либо исключается, либо заменяется (агрегируется до более высокого уровня), согласно формально установленным правилам. В базу данных включены только большие географические единицы в информации о респонденте, что снижает вероятность идентификации.    

 

 

[1] Declaration on Professional Ethics 2010 https://www.isi-web.org/index.php/activities/professional-ethics/isi-declaration

 

Контроль качества

Контроль качества полевых работ проводился методом повторных звонков, проверялись 25% интервью каждого интервьюера.

 

Данные проходят внутреннюю логическую проверку на:

а) несуществующие значения,

б) внутреннюю противоречивость,

в) большое количество пропущенных данных в одном интервью,

г) интервью, длина которых была больше или меньше средней на 25%, а также на и другие существенные параметры.

 

Во всех случаях, когда возникают сомнения, интервью отправляется на дополнительную проверку или уточнение данных методом повторного звонка или визита. В случаях, когда обнаружено несколько случаев неудовлетворительной работы интервьюера, все интервью отправляются на дополнительную проверку, а если провести ее невозможно – то полностью исключаются из базы данных и полевые работы проводятся другими интервьюерами заново.

Обработка данных

В волнах 3-8 при использовании анкет на бумаге, данные вводились в базу данных централизованно группой обработки ЦЕССИ. Для контроля качества использовался двойной ввод 20% анкет, логическая проверка качества и ряд визуальных проверок. Начиная с волны 9, все данные поступают в центральную базу данных с планшетов интервьюеров. Данные проверяются менеджером по обработке на основе комментариев интервьюеров и полевых менеджеров, также проводятся проверки на уровне интервьюера в автоматическом режиме (соотнесение общей длины, отдельных разделов и отдельных вопросов со средними значениями, пропорции пропущенных данных в отдельных вопросах и в целом по анкете, сходности типа заполнения между разными анкетами одного интервьюера). При обнаружении проблем, отдельные интервью или вся работа интервьюера отправляется на дополнительную проверку.

 

Данные в централизованной базе проходят процедуру анонимизации. Цель процедуры – избежать даже потенциальной возможности прямой или косвенной идентификации конкретного респондента. Для этого используется правило минимального размера клетки на пересечении разных параметров. В РСИ используется агрегация географической информации о месте проживания респондентов на минимальном уровне – область.

построение и Использование весов

 

Для корректировки выборочных смещений из-за дизайна выборки (кластеризации) и дифференцированного не-контакта или не-ответа рассчитаны два веса – дизайн-вес (dweight) и пост-стратификационный вес (pspwght).

 

    Dweight – учитывает различия в вероятности отбора на всех этапах выборки.

    Pspweight – постстратификационный демографический вес строится на основе сравнения данных выборки и официальных демографических данных - Всероссийской переписи населения (ВСП 2002 для волн 3-6, ВСП 2010 год для волн 6-9, ВСП 2020 год для волн 10 и 11) по следующим параметрам: половозрастной состав внутри 8 географических регионов.

Начиная с Волны 8 Psgweight строится как общий вес (dweight x pspweight), где принимается во внимание и вероятность отбора, и демографические сравнения с данными Переписи.

В международном файле ESS также включается дополнительный вес:

    pweight – учитывает различия в численности населения разных стран, каждая страна взвешивается до полной численности своего населения.

Начиная с Волны 8 также включается общий кумулятивный вес для анализа (analysis weight):

    Anweight - (dweight x pspweight x pweight).