У дома Мненията Големите данни са просто голяма измама | Джон c. Дворжак

Големите данни са просто голяма измама | Джон c. Дворжак

Видео: Маленькое королевство Бена и Холли - Вылазка ⭐Лучшие моменты (Септември 2024)

Видео: Маленькое королевство Бена и Холли - Вылазка ⭐Лучшие моменты (Септември 2024)
Anonim

Нововъзникналият мем "големи данни" никога не е дефиниран по някакъв смислен и окончателен начин. Това е най-аморфният нов термин, който съм виждал от десетилетие. Това е един от онези термини на "окото на гледача", използвани за оживяване на семинара и евентуално накисване на инвеститорите.

Нека започнем с въпроса какво означават големите данни? Много данни? Повече данни, отколкото можете да обработвате? Аморфни данни? Извън контролните данни? Полезни данни за анализ? Безполезни данни? Претоварване с информация?

Ако прочетете достатъчно за големите данни, това е всичко по-горе и повече. Ключът не са данните, а предизвикателството как да обработваме данните и какво да правим със самите данни.

С други думи, как можем да направим тази огромна купчина данни, която сме успели да натрупаме, да бъде полезна по нови и печеливши начини? Пулове от данни могат да идват отвсякъде чрез различни изчислителни механизми като Facebook публикации, регистрационни файлове в NSA, пощенски списъци, клиенти и т.н.

Бих твърдя, че повечето читатели на тази колона са самите хранилища на големи данни. Току що купих 3 Terabyte устройство за архивиране. Имам много данни за архивиране! Голяма информация!

Полезен инструмент, който мога да си представя, би бил инструмент за анализ на големи данни, който полицията би могла да използва, за да ви признае за виновни за някакво произволно престъпление, като премине през вашите файлове. Или поне да намерите нещо, което би ви смутило. Голяма информация!

Всичко това се връща към коментар, направен от бивш главен изпълнителен директор на American Express, който каза на публика, че ако компанията иска (и това се отнася за всички компании с кредитни карти), тя може да използва вашите лични навици за покупка и тенденции, за да събере пълна досие и определено кажете дали имате афера или не. Голяма информация!

От това, което мога да кажа, точно това е най-добрите данни, шпионирайки хората.

Популярният коментар от бранша е, че по някакъв начин огромни бази данни, които съдържат информация за вас, ще бъдат използвани в ваша полза. Да, знаете, така че ще се справите с неща, които всъщност се интересувате. Целенасочена реклама. Това е от полза за всички!

Ето как става това. Интересувам се да си купя нов фотоапарат и да чуя за новия Bogus One. Прочетох статия на PCMag.com за камерата, след това отивам в Amazon и проверявам цените и отзивите на потребителите. Изглежда, че никой не харесва камерата. Това е очевидно парче глупости. Всички рецензенти отбягват камерата. Купувачите мразят камерата. Това не е камера, която искам. Но софтуерът за анализ на големи данни решава да ми даде стотици реклами на всяка уеб страница, която посещавам, като всичките показват камерата на Bogus One. Голяма информация!

По-лошо е от това. Ако нещата тръгнаха в другата посока и реших, че харесвам и искам фотоапарата и всъщност закупих камерата, пак ще получа реклами, насърчаващи ме да си купя камерата. Голяма информация!

Насочената реклама на "големи данни" е най-голямото зареждане на балон, някога.

Добре, така че нека забравим това фиаско и да преминем към използването на големи данни за тенденциите. Големите данни могат да намерят различни игли в различни сено. Така че ще получите нещо подобно: Четиридесет процента от всички купувачи на Subaru са вегетарианци / вегани, а 80 процента от тях са демократи. Но този брой се увеличи съответно до 60 и 90 процента, ако говорим за Subaru Outback. Освен това тя се увеличава до 99 процента вегетарианец / веган и 99 процента демократ, ако колата е боядисана в зелено.

Теоретиците за големи данни ще имат полев ден на семинара с тази информация. Но игнорира всички променливи, които могат да променят изчисленията и тенденциите, които са безкрайни. Колко дълго ще се задържи някоя от тези конкретни големи данни, ако главният изпълнителен директор на Subaru стигне до събиране в зелен Outback и декларира, че „Всички китове трябва да бъдат унищожени!“?

Дори не е нужно толкова много, за да промените динамиката на заключенията с големи данни. Въпреки това, което казва човекът на American Express, данните всъщност са слепи. Ето защо получавате реклами за вече закупени продукти.

Големите данни биха ви накарали да стигнете до заключения.

Ако някой купи десет книги за това как да направи бомба, означава ли това, че иска да взриви Федералната сграда? Ами ако беше експерт по обезвреждане на бомби и това не беше включено в длъжностното му звание като полицейски консултант? Големите данни все още не могат да знаят всичко. Не може да знае какво мислиш. Мисля си например, че камерата на Bogus One е гадно. Големите данни не могат да знаят това, ако не съм разпитан. И може би ще излъжа за това.

Нищо от това не звучи добре или здравословно за обществото. Прескачане до заключения, правене на предположения, действайки на фалшиви предположения. Насаждане на обществото с безполезни s.

Големите данни като високо понятие никога няма да се дефинират напълно и да умрат нещастна смърт. Надявам се.

Големите данни са просто голяма измама | Джон c. Дворжак