У дома Отзиви Използване на математиката за намиране на най-тъпите (и най-умните) коментатори в мрежата

Използване на математиката за намиране на най-тъпите (и най-умните) коментатори в мрежата

Съдържание:

Видео: Вот мы и дома (Септември 2024)

Видео: Вот мы и дома (Септември 2024)
Anonim

съдържание

  • Използване на математиката за намиране на най-тъпите (и най-умните) коментатори в мрежата
  • В списъка…
  • Дъното на цевта

Някога хората се надяваха, че World Wide Webbernet ще обедини хората от всички слоеве на живота в новия дух на цифровата kumbayaness. Въпреки че технологиите наистина ни обединиха по безпрецедентни начини, тя също така дава възможност на онези, които имат малък интерес към гражданството, но с много свободно време да анонимно да изричат ​​гневни, фактически дефицитни ALL-CAPS думи, пукащи се из Интернет.

Разделите за коментари от цялата мрежа резонират с обаждания на „GAY !!!“, „LIBTARD !!!!“, „NAZI !!!“ и „RON PAUL 2016 !!!!“ Защото това е начинът, по който Интернет обсъжда наболелите проблеми на деня. (И нека не забравяме безкрайните теории за конспирация, които се вплетат в напълно несвързани постове.)

Но замисляхте ли се някога коя интернет общност най-много липсва в комуникационните умения? Със сигурност имате мнение по въпроса. Всички можем да назовем поне един уебсайт, когато мислим за тези хора .

За съжаление всеки опит за създаване на коментарна йерархия е длъжен да бъде опетнен с петното (или поне външния вид) на пристрастия. Въпреки това наистина може да има начин да премахнете всички предразсъдъци и идеология от въпроса и да използвате студен, воден от числа анализ на относителната глупост на различните общности за коментари.

„Калкулаторът за четене“ на Online-utility.org присвоява оценки според редица различни тестове за четимост, като например индекса Gunning Fog.

Тези резултати са резултат от уравнения, които определят количествено измерими атрибути като броя на думите, изреченията и сричките. Уравнението за индекса на Гунинг изглежда така:

Резултатът съвпада с броя години на официално образование в САЩ, на които човек би трябвало лесно да разбере текста. И така, оценка 12 означава, че тя отговаря на нивото на четене на някой от дванадесети клас, докато оценка 4 показва, че текстът е бил на ниво за четене в четвърти клас и т.н.

За да видим как това може да се приложи в мрежата, взехме извадка от секциите за коментари на осем популярни уебсайта от различни краища на англоезичния цифров интернет: (изброени тук по азбучен ред) CNN, Fox Nation, Gawker, New York Times, PCMag (да, ние включваме себе си), Reddit, The Atlantic и YouTube. Прокарахме ги чрез калкулатора за четене в търсене на студените твърди факти за това кой има най-умните и най-тъпите коментатори.

Констатациите може да ви изненадат.

Първо, бързо представяне на нашата методология:

За всеки уебсайт, включен в нашето проучване, подбрахме три силно коментирани истории, които да използваме като набор от данни. Когато е налице, ние избрахме от самия сайт за най-коментирани сайтове (или от подобен списък с „най-популярните“ истории - нещо, което показваше, че тези парчета са силно активни).

След това копирахме топ 50 коментара от всяка история в документ на Word. След това, чрез сложна поредица от операции за намиране и замяна, отделихме текста на коментара от всички външни отломки на сайта, като аватари, имена на коментари, подписи във времето и т.н.

След това ни остана документ, пълен с чист, неподправен потребителски генериран текст като този:

След това комбинирахме дестилирания текст в главен текст, който пуснахме в „Калкулатор за четене“.

Като бърз пример анализирахме първата глава от класическия Moby Dick на Херман Мелвил (достъпен като документ за обществено достояние тук) и установихме, че е получил следните резултати за четене.

Индекс на Gunning Fog: 12.02

Индекс на Coleman-Liau: 8.62

Степен на Flesch-Kincaid: 10.16

ARI (индекс на автоматизирана четимост): 9.97

SMOG индекс: 11.33

В този случай резултатът за мъгла показва, че текстът е на нивото на четене на старши в гимназията. За повечето писания, насочени към широката публика, лингвистите смятат, че идеалната оценка е някъде около 7 или 8.

Останалите индекси (които всеки използва различни уравнения за изчисляване на резултата си) откриват, че човек може да се нуждае от всяко образование между осми и 11-ти клас, за да разгледа лесно Моби Дик .

Схванах го? Добре, прочетете, за да видите как са постигнати най-добрите уеб сайтове.

Продължете да четете: в списъка>

Използване на математиката за намиране на най-тъпите (и най-умните) коментатори в мрежата