Главная
/
Журнал
/
Бизнес-наука
/
Репрезентативная выборка: как проводить исследования с высокой точностью

Репрезентативная выборка: как проводить исследования с высокой точностью

Время прочтения: мин.
26
.
11
.
24

Маркетинговые исследования – важная часть бизнеса. Благодаря им компания выбирает правильную стратегию, выпускает успешные продукты и разрабатывает эффективную рекламу. Чтобы результаты исследований были верными, надо опрашивать именно тех людей, которые соответствуют вашей задаче. Для этого используют так называемую репрезентативную выборку. В статье рассказываем, что это и как ее правильно составить.

Что такое репрезентативная выборка

Репрезентативная выборка в маркетинге – часть изучаемой аудитории, которая обладает ее основными характеристиками. Эта группа людей имеет то же мнение, что и большинство представителей ЦА. Поэтому по результатам исследований такой группы можно сделать выводы о всей аудитории.

В математике выборку называют репрезентативной, если для изучения отбирают совершенно случайные элементы. В реальной жизни такой случайный выбор практически невозможен. Поэтому маркетологи и социологи осознанно моделируют выборку, чтобы она соответствовала задачам бизнеса.

Например, компания из Магнитогорска производит товары для дома. Для развития продуктовой линейки она хочет изучить отношение людей к праздникам и исследовать традиции по украшению квартиры к разным датам. То есть в данном случае ваша целевая аудитория – это все население города. Она называется генеральной совокупностью.

Допустим, из переписи населения с сайта Росстат вам известно, что в городе одна треть – это мужчины, а две трети – женщины. Чтобы результаты опроса были верными, надо разработать выборку, в которой будут соблюдены эти пропорции.

Точность исследования зависит и от количества опрошенных. Недостаточно задать вопросы одному мужчине и двум женщинам. Нужно пообщаться с таким числом людей, которые обеспечат корректность результатов.

{{pc}}

Если в городе проживают 1/3 мужчин и 2/3 женщин, то выборка должна иметь такие же пропорции по полу респондентов

{{/pc}}

{{mobile}}

Если в городе проживают 1/3 мужчин и 2/3 женщин, то выборка должна иметь такие же пропорции по полу респондентов

{{/mobile}}

Важный момент: выборку моделируют по тем параметрам, которые значительно влияют на ответы участников. Чаще всего это пол, возраст, уровень дохода, место проживания. Иногда применяют специфические факторы, например, профессию, использование интернета, наличие авто или особые статьи расходов.

Репрезентативная выборка – это группа людей, в которой представлены все подгруппы, важные для исследования. То есть целевая аудитория в миниатюре.

Для решения задачи с изучением праздников достаточно разделить респондентов по полу и возрасту. Но, если компания продает дорогие атрибуты для дома, то стоит использовать еще и доход. Тогда вы получите информацию о мнении каждого сегмента аудитории – эконом, среднего и ВИП.

Когда нужна репрезентативная выборка

Репрезентативную выборку используют при проведении маркетинговых исследований. Они бывают двух типов – качественные и количественные.

В качественных исследованиях

Качественные исследования – это фокус-группы и глубинные интервью. Они нужны, чтобы найти новые идеи и гипотезы, ответить на вопросы «Какой?», «Зачем?», «Почему?» и так далее.

Их основная задача – получить представление о разнообразии мнений целевой аудитории, а не сформировать точную картину по распределению этих мнений. Поэтому выборка для качественных исследований может быть репрезентативной, но небольшой по количеству респондентов.

{{cta_op_banner}}

Например, фокус-группы проводят для 7-10 представителей аудитории, а глубинные интервью – для нескольких десятков человек.

Подписывайтесь на блог Compass в Телеграм: там вы найдете статьи, советы и кейсы о том, как изучить потенциальных клиентов и создать успешный продукт.

В количественных исследованиях

Репрезентативность выборки очень важна при проведении количественных исследований. К ним относятся:

  • все виды опросов – онлайн и офлайн;
  • тестирования альтернатив или А/В-тесты;
  • холл-тесты и хоум-тесты;
  • наблюдение и эксперименты.

Все виды количественного анализа отвечают на вопрос «Какая доля аудитории имеет такое мнение?». Поэтому здесь крайне важно соблюсти основные требования к выбору респондентов. Например, если компания производит косметику, предназначенную для женщин 30-40 лет, то нет смысла опрашивать мужчин, школьниц или пенсионерок – такая выборка будет нерепрезентативной.

Чтобы получить статистически значимые результаты, надо опросить не меньше 100 человек, а лучше 200 или 300. В этом случае размер ошибки является умеренным.

Интересный факт: точность измерений зависит от количества опрошенных людей. Но большой размер выборки не гарантирует корректность результатов. Репрезентативность обеспечивает только правильный отбор участников исследования и использование соответствующих методов сбора данных.

Пример исследования с неудачной выборкой из анекдота: интернет-опрос показал, что 100% населения пользуется интернетом.

Единственный случай, когда не нужно использовать репрезентативную выборку – если вы имеете очень узкую аудиторию. Например, бизнес работает в сфере B2B и сотрудничает с заводами по производству сталеплавильного оборудования. Таких предприятий в стране немного – проще напрямую пообщаться с представителями каждой компании, а не изучать их выборочно.

{{pc}}

Репрезентативность выборки важна при проведении всех типов исследований, если аудитория широкая

{{/pc}}

{{mobile}}

Репрезентативность выборки важна при проведении всех типов исследований, если аудитория широкая

{{/mobile}}

Типы выборки

Выборки бывают случайными и целенаправленными.

Случайная выборка считается самой точной и репрезентативной, но создать ее крайне сложно. Для этого надо иметь доступ ко всем элементам генеральной совокупности. В случае с опросами – это контакты всех людей, которые входят в целевую аудиторию.

Участники для такого опроса выбираются случайным образом. Размер выборки при этом должен быть достаточно большим для получения точных результатов.

Такой метод иногда используется перед выборами или другими массовыми мероприятиями. Технически его можно реализовать двумя способами:

  • Взять базу телефонных номеров и с помощью компьютерной программы выбрать абсолютно случайные контакты для опроса.
  • Составить нумерованный список респондентов и выбирать участников с определенным шагом. Например, взять каждый сотый или каждый тысячный контакт, в зависимости от размера аудитории. Этот способ считается менее точным.

Целенаправленная выборка подразумевает отбор участников по определенным критериям. Их выбирают на основе целей компании: маркетологи моделируют такую выборку, которая соответствует характеристикам целевой аудитории. В качестве параметров берут те факторы, которые больше всего влияют на ответы респондентов.

Например, для изучения качества работы общественного транспорта в городе можно составить выборку по возрасту, а также наличию автомобиля. Ведь те, кто ездят за рулем, имеют другое видение ситуации – их ответы будут отличаться.

Важный момент: соотношение людей каждой подгруппы в выборке должно соответствовать генеральной совокупности. Тогда репрезентативность будет высокой.

Другими словами, если 60% жителей города ездят на авто, а 40% – на общественном транспорте, то и в репрезентативной выборке такая пропорция должна соблюдаться.

Информацию о распределении аудитории по базовым параметрам можно взять из открытых источников, к примеру, с сайта Росстата.

Если данных о распределении по значимым параметрам недостаточно, то работу проводят в два этапа:

  • На первом этапе определяют пропорции аудитории по важным для бизнеса критериям.
  • На втором – формируют репрезентативную выборку и задают респондентам вопросы по теме исследования.

Выборку проще всего составить по одной или двум значимым характеристикам, как в примере ниже. Если критериев больше, то структура получится достаточно сложной.

{{pc}}

Пример распределения выборки по двум параметрам

{{/pc}}

{{mobile}}

Пример распределения выборки по двум параметрам

{{/mobile}}

Как определить объем выборки

Конечно, идеальный размер выборки – это все респонденты, которые входят в изучаемую вами аудиторию. Однако опрашивать всю генеральную совокупность очень долго и дорого.

Кроме того, по законам статистики, результаты опроса 1 500 человек и 10 000 респондентов будут отличаться незначительно – всего на несколько процентов. Значит, нет смысла брать слишком большую выборку – надо найти «золотую середину» между количеством участников опроса и его погрешностью.

Погрешность исследования – это допустимый процент ошибки в результатах. Например, опрос показал, что 50% аудитории знает ваш бренд, размер погрешности при этом составляет 5%. Это значит, что 50±5% от генеральной совокупности в реальной жизни знакомы с продукцией компании, то есть от 45% до 55%.

Как правило, исследования проводят с размером ошибки от 1 до 10%. Наиболее популярное значение погрешности – 3% или 5%. Чем она меньше, тем выше вероятность получить достоверные результаты.

Достоверность (уровень доверия) – это еще один важный показатель, который используется при расчете размера выборки. Он означает долю аудитории, для которой итоги опроса окажутся верными.

Уровень достоверности задают в пределах 80-99%. Если он ниже 80%, то этим данным доверять нельзя, ведь они некорректны для большой части целевой аудитории.

Чаще всего используют достоверность на уровне 95%. Если бюджет позволяет, то можно указать 99% или 99,9%, но тогда и выборка будет больше.

Таким образом, на размер выборки влияют три основных параметра:

  • уровень погрешности – от 1% до 10%;
  • достоверность – от 80% до 99%;
  • размер генеральной совокупности – он может быть известен и неизвестен.

Уровень достоверности и ошибки итоговых данных задает компания, исходя из задачи бизнеса и величины бюджета. Размер генеральной совокупности определяют маркетологи. Если точное значение неизвестно, то его можно вообще не указывать в расчетах. В этом случае выборка будет посчитана «с запасом».

Существуют разные способы, чтобы рассчитать подходящий для исследования размер выборки – это можно сделать самостоятельно или использовать онлайн-калькулятор. Рассмотрим их подробнее.

Метод 1: рассчитать вручную

Вот упрощенная формула, по которой можно самостоятельно определить размер выборки. Просто подставьте в числитель коэффициент, который соответствует выбранному уровню достоверности, а в знаменатель – нужный размер ошибки. Так вы получите число респондентов, которых необходимо опросить.

{{pc}}

Для оценки объема выборки можно использовать эту упрощенную формулу

{{/pc}}

{{mobile}}

Для оценки объема выборки можно использовать эту упрощенную формулу

{{/mobile}}

В формуле не фигурирует размер генеральной совокупности. Это не критично, так как для большой аудитории свыше 100 000 человек ее численность перестает влиять на объем выборки.

Если вы изучаете небольшое сообщество людей и хотите сократить количество респондентов для экономии бюджета, то лучше считать вторым способом.

Метод 2: использовать онлайн-калькулятор

В интернете есть несколько разных вариантов калькулятора для определения размера выборки. Например, сервисы QuestionStar и Socioline.

Они представляют собой окно с полями для заполнения, в которых вы указываете уровень статистической погрешности и достоверности. Если размер генеральной совокупности известен, то вписываете его тоже.

В некоторых калькуляторах есть пункт «Доля признака в генеральной совокупности». До начала исследования его значение неизвестно, поэтому заполнять пункт не нужно.

{{pc}}

В калькуляторе надо указать размер ошибки и достоверности (надежности), остальные пункты – опциональны

{{/pc}}

{{mobile}}

В калькуляторе надо указать размер ошибки и достоверности (надежности), остальные пункты – опциональны

{{/mobile}}

После заполнения всех полей калькулятор выдаст вам значение размера выборки. Вы можете поэкспериментировать с величиной ошибки и уровня достоверности, чтобы определить оптимальное количество респондентов для опроса.

Расчеты показывают, что для аудитории практически любого размера опрос 100 человек дает погрешность около 10%, для 200 респондентов она составит 7%, а для 400 опрошенных – около 5%. Значения приведены для уровня достоверности 95%.

{{pc}}

На размер выборки больше всего влияет величина допустимой ошибки

{{/pc}}

{{mobile}}

На размер выборки больше всего влияет величина допустимой ошибки

{{/mobile}}

Как создать репрезентативную выборку

Чтобы сформировать выборку, которая будет репрезентативной для вашей аудитории, надо выполнить эти основные действия.

1. Сформулируйте цель исследования

Продумайте и запишите цели и задачи работы. Определите:

  • ответы на какие вопросы вы хотите получить;
  • как вы будете использовать результаты исследования.

Если ваша цель – получить новые идеи и гипотезы, то надо провести качественное исследование. Если нужны точные ответы на закрытые вопросы, например, для определения емкости сегмента или эффективности рекламы, то используйте количественные опросы.

2. Опишите целевую аудиторию

Сформулируйте, какую аудиторию вы хотите изучить. Как правило, компания работает сразу с несколькими сегментами. Выберите те группы клиентов, которые обязательно должны быть включены в исследование. Обычно берут ядро целевой аудитории и несколько самых прибыльных сегментов.

{{pc}}

Сегментируйте клиентов и выберите, какие группы людей должны попасть в исследование

{{/pc}}

{{mobile}}

Сегментируйте клиентов и выберите, какие группы людей должны попасть в исследование

{{/mobile}}

Если это возможно, оцените численность аудитории в целом и каждого сегмента по отдельности. Эта информация даст вам понимание размера генеральной совокупности.

3. Выделите главные характеристики ЦА

В зависимости от темы исследования, определите, какие характеристики аудитории больше всего влияют на ответы людей.

Это может быть пол, возраст, доход, место проживания, занятость и образование, социальный статус, основные статьи расходов, использование авто или другой техники, особенности стиля жизни. Выберите от одного до пяти ключевых факторов – они будут задавать структуру выборки.

Например, вы проводите исследование для сети фитнес-центров и хотите выяснить, какие спортивные направления востребованы в крупнейших городах России. Тогда ключевыми параметрами будут:

  • пол – надо опросить и мужчин, и женщин;
  • возраст – от него во многом зависят услуги, которыми пользуется человек;
  • доход – для бизнеса важно узнать, сколько клиент готов потратить на такую статью расходов, как спорт;
  • география проживания – сеть работает в городах-миллионниках, поэтому исследовать надо их.

4. Задайте структуру выборки

В открытых источниках найдите информацию о распределении аудитории по выбранным вами параметрам. В примере с фитнес-центром это доля мужчин и женщин в крупнейших городах страны, а также разбивка по возрасту и доходу. Эти данные можно взять с сайта Росстата.

Если таких данных нет, то организуйте два этапа исследования. На первом – проведите массовый опрос для уточнения пропорций аудитории, на втором этапе задайте вопросы по изучаемой теме.

5. Рассчитайте размер выборки

Если исследование качественное, то размер выборки вычислять необязательно. Достаточно повторить структуру аудитории в фокус-группах или глубинных интервью, даже если респондентов будет немного.

В случае количественного исследования обязательно определите объем выборки – вручную или с помощью онлайн-калькулятора. Для проекта со спортивным клубом можно сделать так:

  • провести исследование в 5 городах;
  • в каждом городе опросить по 200 человек.

Итого количество опрошенных составит 1 000 человек, поэтому в целом по аудитории ошибка в данных будет всего 3%. Кроме того, можно будет детально изучить каждый город по отдельности – погрешность в этом случае составит около 7%.

Резюмируем

Репрезентативная выборка – это группа людей, основные характеристики которой повторяют изучаемую аудиторию. Поэтому выводы, которые мы получаем в результате исследования этой выборки, можно распространить на всю генеральную совокупность – вашу ЦА.

Хорошая репрезентативность нужна при проведении исследований. Для качественных выборка должна повторять структуру аудитории. Для количественных – еще и иметь достаточный объем. В этом случае можно получить статистически значимые результаты.

Объем выборки зависит от трех параметров – допустимой ошибки, уровня достоверности и величины генеральной совокупности. Размер аудитории при желании можно опустить, так как на расчеты он влияет незначительно.

В среднем при опросе 100 человек вы получите результаты с ошибкой данных 10%, для 400 респондентов она составит около 5%, а для 1 000 – всего 3%.

Книга по теме

Зарабатывайте, рекомендуя мессенджер Compass
Зарабатывайте, рекомендуя мессенджер Compass
Поделитесь с нами контактами знакомого руководителя и получайте стабильный ежемесячный доход.
Узнать больше
Ссылка на скачивание Compass для компьютера скопирована