Машинное обучение для государственного управления
Введение
Исследования — это непрерывный процесс, и ученые следуют определенным шаблонам, чтобы решить определенные проблемы и внести свой вклад в существующий объем знаний. Примечательно, что каждый аналитик пытается выявить пробелы в литературе посредством анализа предыдущих документов и намечает методы и процедуры, которые будут использоваться для разработки жизнеспособного решения. В этой статье анализируется статья Анастасопулоса и Уитфорда и показано, как элементы исследовательского процесса были использованы для помощи в разработке результатов исследования и демонстрации будущего применения.
Определение проблемы и обзор литературы
Постановка проблемы формирует исследование, определяя используемые методы, инструменты и аналитические процедуры. Объем данных растет на беспрецедентно высоких уровнях, что представляет собой проблему для ученых и различных практиков. Анастасопулос и Уитфорд (2018) утверждают, что в исследованиях существует постоянный конфликт между теорией и практикой. Эта проблема лежит в основе их исследований, направленных на определение того, как машинное обучение (МО) может обеспечить решение анализа данных в государственном управлении. Авторы не проводили обширного обзора литературы, и ему не посвящен ни один раздел. Однако они полагались на предыдущих исследователей из журнала обзора государственного управления по тенденциям данных и машинному обучению.
Вопросы исследования и гипотезы
Вопросы исследования содержат конкретные элементы, которые ученые хотят рассмотреть в своей работе. В этой статье Анастасопулос и Уитфорд (2018) исследуют применение машинного обучения для преодоления разрыва между теорией и практикой. Их главный вопрос: как можно использовать МО для разработки новых методов, данных и выводов для улучшения исследований в области государственного управления? Пытаясь решить этот вопрос, авторы предполагают, что алгоритмы машинного обучения являются ответом на проблемы больших данных текущего и будущего поколений. Они также показывают, что, хотя объем данных существенно меняется, алгоритмы останутся актуальными для всех смен, что делает их идеальным решением проблемы больших данных в государственном управлении.
Концептуальная модель и связь с теорией
Взаимосвязь между концепциями и их вклад в желаемое решение имеют важное значение для анализа методов, результатов и будущих последствий. Авторы сосредоточили внимание на нескольких концепциях, таких как роль машинного обучения как решения возникающей проблемы, различные применения контролируемых и неконтролируемых алгоритмов машинного обучения, а также связь между машинным обучением и большими данными (Анастасопулос и Уитфорд, 2018). Эта концептуальная основа имеет решающее значение для определения исторических применений ОД и их влияния на будущие тенденции данных государственного управления. Он соединяет теорию с практикой, показывая, что алгоритмы машинного обучения устанавливают компромисс между предвзятостью и дисперсией посредством показателей производительности.
Ключевые переменные и исследования и дизайн опросов
Поскольку целью было применение алгоритмов МО в секторе государственного управления, авторы стремились понять популярность организации через благоприятствование бренда пользователями. Основными переменными, проверяемыми в этом исследовании, были репутация и восприятие, оцениваемые через социальные сети, в частности через платформу Twitter (Anastasopoulos & Whitford, 2018). Авторы разработали исследование, чтобы применить методы человеческого кодирования, чтобы научить алгоритм ML оценивать популярность агентов. Они выбрали 26402 твита из ассортимента агентств 26402. Из них случайным образом были выбраны 200 комментариев и переданы трем людям (Anastasopoulos & Whitford, 2018). Ожидалось, что программисты сгруппируют твиты по соответствующим категориям, которые помогут определить, насколько популярно агентство в социальных сетях. Опрос проводился случайным образом, чтобы включить все соответствующие твиты. Этот дизайн был жизненно важен, поскольку вовлечение программистов с разными уровнями понимания имеет важное значение для устранения предвзятости.
Сбор, анализ и интерпретация данных
После разработки схемы классификации исследователи изучили собранные данные и организации, от которых можно получить информацию. Это приложение содержит информацию о 13 исполнительных агентствах в составе кабинета президента США, которые используют сеть Twitter. Они собрали по 2000 твитов на каждую организацию, доступных в Твиттере примерно с 28 марта 2018 года (Анастасопулос и Уитфорд, 2018). Они использовали программный интерфейс Twitter (API), чтобы гарантировать одинаково представленную выборку среди компаний и выявить врожденные различия в количестве твитов агентств. Они подключились с помощью языка R и извлекли текстовые данные из сообщений Twitter от каждого агентства.
После получения набора данных, закодированных вручную, следующей целью было выяснить, можно ли использовать технику машинного обучения для законной классификации твитов в более крупной базе данных. Данные были разделены на два набора: обучающий и тестовый, путем их случайного смешивания и разделения на два разных набора данных. В этом приложении 70% данных было отведено для обучения, а 30% — для оценки с использованием уровня достоверности 95% (Анастасопулос и Уитфорд, 2018). Это стандартный метод по умолчанию в большинстве компьютеризированных статистических инструментов, и его обычно рекомендуют, когда данные ограничены. Авторы обнаружили, что организации, непосредственно обслуживающие более широкие слои населения или целевые группы населения, беспокоились о своем моральном имидже и использовали социальные сети, чтобы продемонстрировать моральный облик общественности.
Заключение
В заключение, процесс исследования включает в себя несколько элементов, которые облегчают сбор, анализ и интерпретацию данных. Анализируемая здесь статья была основана на роли машинного обучения в решении проблем больших данных в будущих исследованиях государственного управления. По сути, объем и сложность данных меняются непредсказуемо, что требует усовершенствованного алгоритма анализа. Авторы разработали алгоритм машинного обучения для оценки популярности агентства, используя социальные сети в качестве основной платформы публичной коммуникации.
Ссылка
Анастасопулос Л. и Уитфорд А. (2018). Машинное обучение для исследований в области государственного управления с применением к репутации организации. Журнал исследований и теории государственного управления, 29 (3), 491–510.