Вы находитесь на странице: 1из 1

Выявление политической предвзятости в новостных статьях, применяя

анализ заголовков
Рама Рехит Редди Сума Редди Дуггенпуди Радхика Мамиди
Международный Институт Международный Институт
Международный Институт
информационных информационных
информационных технологий,
технологий, Хайдарабад технологий, Хайдарабад
Хайдарабад
@research.iiit.ac.in @research.iiit.ac.in @iiit.ac.in

как дискурс-анализ и контент-анализ. Этот анализ


Аннотация требует больших усилий, концентрации, внимания к
деталям, а также отнимает много времени. Таким
Язык-это мощный инструмент, который можно образом, автоматизация обнаружения этой предвзятости
использовать как для изложения фактов, так и в новостной статье может быть очень полезной и
для выражения наших взглядов и необходимой для проверки фактов СМИ.
представлений. В большинстве случаев мы Предвзятость СМИ может наблюдаться и
обнаруживаем едва заметное предубеждение определяться с помощью различных факторов. В
против кого-то или чего-то. Когда речь заходит политической области она варьируется от выборочной
о политике, СМИ и журналисты, как известно, публикации статей до конкретного выбора для
создают предвзятость с помощью хитроумных освещения некоторых событий, партий и лидеров. Мы
средств, таких как неверное истолкование также сталкиваемся со статьями, где предвзятость
реальности и искажение точек зрения по может быть обнаружена путем наблюдения за
отношению к некоторым партиям. Такое неоднозначными предположениями, языковым
неверное толкование в больших масштабах манипулированием или отсутствием надлежащего
может привести к появлению необъективных контекста. Особенно во время предвыборной агитации
новостей и теорий заговора. Автоматизация из - за нескольких несправедливых факторов СМИ часто
определения предвзятости в газетных статьях настраиваются либо за, либо против каких-то
может стать хорошей задачей для конкретных партий и вместо того, чтобы сообщать
исследований в области НЛП только содержание, тонко добавляют к нему свою
(нейролингвистическое программирование). позицию. Это обычно отражается в заголовке, и если
Мы предложили создать нейросеть для анализа сделать заголовок предвзятым, то это повлияет на
заголовков и обнаружения предвзятости. Наша читателя, который читает статью после
модель имеет две отличительные характеристики: (i) подсознательной регистрации заголовка. Поскольку на
она имеет структуру, которая повторяет телугу не было набора данных, отмеченного как
последовательность действий человека при чтении предвзятое отношение к политике, мы создали набор
новостной статьи; (ii) она имеет механизм внимания, данных, состоящий из 1329 новостных статей,
применяемый к статье на основе ее заголовка, что собранных из различных газет на языке телугу, и
позволяет ей обращать внимание на более аннотировали их на предмет предвзятости по
критическое содержание, чтобы выявить отношению к политической партии. Предвзятость
предвзятость. Поскольку необходимый массив помечается как отсутствие, Если статья является
данных был недоступен, мы создали массив данных, непредвзятой.
состоящий из 1329 новостных статей, собранных из Телугу-это агглютинативный дравидийский язык,
различных газет на языке телугу, и отметили их по широко распространенный в двух штатах Индии, а
показателю предвзятости по отношению к именно в Телангане и Андхра-Прадеше. Согласно списку
конкретной политической партии. Эксперименты, 1
Ethno-logue самых распространенных языков мира,
проведенные на нем, показали, что наша модель Телугу занимает пятнадцатое место в этом списке, и в
превосходит различные стандартные методы в общей сложности 85 миллионов носителей Телугу
значительной степени. существуют по всему миру. В двух государствах,
говорящих на языке телугу, существует только 5 основных
1 Вступление политических партий. Мы рассматриваем проблему
выявления политической предвзятости как
Предвзятое отношение к новостям- это повсеместное классификационную проблему. Политические партии
явление, потенциально присутствующее в большинстве можно рассматривать как метки, и цель будет
газет. Первый шаг в борьбе с предвзятостью в новостях- заключаться в том, чтобы ставить метки на каждой
это подтверждение предвзятости Таким образом, новостной статье. Любая новостная статья, отклоняющая
выявление необъективности к политической партии своего читателя от содержания самой новости в пользу
сегодня привлекло к себе внимание. Такие новостные политической партии, считается предвзятой.
статьи в основном отбираются и анализируются
вручную с помощью процесса, называемого _________________
кодированием или теоретическими основами, такими
1
https://www.ethnologue.com/statistics/size
77
Proceedings of the Second BlackboxNLP Workshop on Analyzing and Interpreting Neural Networks for NLP, pages 77–
84 Florence, Italy, August 1, 2019. Qc 2019 Association for Computational Linguistics