У дома Отзиви Как предприятията могат да имат смисъл от пазара на големи данни

Как предприятията могат да имат смисъл от пазара на големи данни

Видео: 5 НОВЫХ ЛАЙФХАКОВ С КОНСТРУКТОРОМ LEGO 4K (Ноември 2024)

Видео: 5 НОВЫХ ЛАЙФХАКОВ С КОНСТРУКТОРОМ LEGO 4K (Ноември 2024)
Anonim

Предприятията не получават точки за това колко ефективно работи инфраструктурата им или колко високо могат да подреждат всички големи данни, които събират. Това, което се отчита, е качеството на анализите и интелигентността, които данните произвеждат.

През последните няколко години Hadoop е думата, която стана най-синоним на приемане, обработка и трансформиране на данни. Тази рамка с отворен код за разпределено съхранение и обработка на данни породи собствено корпоративно пространство и интегрира своя път във всички основни облачни платформи. Hadoop далеч не е единствената технология за Big Data, за която си струва да се говори, но тя се превръща в тази, върху която са изградени много други.

Проблемът за бизнеса е, че пространството на Hadoop е пълно с дистрибуции и опции за инструменти и както обясни директорът на изследователската компания Gartner Ник Хюдекер, много от тях изглеждат еднакво. Heudecker, чието изследване обхваща управлението на информация, включително пространствата Big Data и NoSQL, заяви, че ако разглеждате общите опции за обработка на данни, много доставчици предлагат много сходни функции.

Разбиване на пазара

Съществуват три основни стартъпа на Hadoop - Cloudera, Hortonworks и MapR - и те непрекъснато нарастват през 2015 г. Според Gartner, всеки има приблизително 700 клиенти, дава или взема 10 процента, поставяйки глобалния пазар между 2100-2400 Hadoop клиенти по целия свят. И трите предлагат както безплатен, така и корпоративен слой от разпространението си в Hadoop, като всеки от тях прави значителни отворени приноси за проекти под знамето на Apache Software Foundation (ASF).

„Нашите данни показват, че 44 процента от употребата на Hadoop в момента не е платена“, каза Хюдекер. "Има ли ясен лидер? Не мисля, че е така. Всички те грабват пазарен дял, защото това е съвсем ново пространство."

През последните няколко месеца голяма част от конкуренцията между тримата се свежда до конкуренция за възможности за анализ на данни и креативни начини за интегриране на Apache Spark, механизъм за обработка на големи данни с отворен код с използване на случаи от потоци данни в реално време до машинно обучение, Наскоро MapR обяви MapR Streams като част от "конвергирана платформа за данни", интегрираща Hadoop, Spark-базирана обработка на потоци и анализи. Hortonworks внедри актуализация на платформата за данни на Hortonworks (HDP) с анализи в паметта Spark, а Cloudera предлага разнообразни интеграции на Spark с отворен код чрез своята платформа за инициатива One Platform, заедно с предлагане на учебни часове за Spark.

„Много неща се случват в пространствата за управление на информацията и информационната инфраструктура и не всичко е Hadoop“, обясни Хюдекер. "Има огромен импулс зад модела за обработка на данни на Spark за скорост и памет, въпреки че разработката на Spark все още е в начален стадий. Spark ще бъде друга lingua franca в обработката на данни, подобна на SQL днес, и определено показва признаци, че има някои крака тъй като все повече компании инвестират в него."

Heudecker също подчерта значението на облачните играчи в Big Data; техническите гиганти, които са интегрирали Hadoop и други технологии за големи данни в съществуващите си предложения за инфраструктура като услуга (IaaS).

Amazon Web Services (AWS) използва своята услуга Amazon Elastic MapReduce (EMR) за облачно базирана Hadoop оркестрация. Microsoft предлага цял набор от големи данни в рамките на своята облачна платформа Azure, като си партнира с Hortonworks за неговата HDInsight услуга за управление на Apache Hadoop, Spark, HBase и Storm, заедно със своите базирани на SQL Azure Data Lake и Azure Data Analytics. IBM разполага както с локалната си IBM Open платформа, предлагаща за Hadoop и IBM BigInsights, пакет за анализи, който ще работи над него, заедно с управлявани Hadoop и Apache Spark-as-a-service в своя облак Bluemix. Списъкът продължава и предприятията намират по-приложимите случаи на използване в облака.

"Смятаме, че AWS сам има около 5000 клиенти, така че това е над два пъти по-голяма от клиентската база от чисто комбинираните игри, " каза Heudecker. „Едно от предимствата на преместването в облака е, че получавате екосистема. Можете да получите дистрибуциите на Hadoop с чисто възпроизвеждане на всяка от IaaS офертите. MapR е наличен във всички облаци, за които се сетите, освен в IBM; същото за Cloudera и Hortonworks. Не видяхме наличието на облак да стане твърде много фактор при избора между един доставчик и друг."

Избор на стратегия за данни на предприятието

И за малки и средни предприятия (SMBs), и за разрастващи се предприятия, когато инвестират в решения за обработка на данни и анализи, Heudecker заяви, че решаващият фактор е коя платформа може да осигури най-високото ниво на обслужване. Според Gartner най-голямото предизвикателство за бизнеса е разликата в уменията - да разберат кой ще управлява платформата, след като е инсталирана и внедрена.

"Ако компаниите търсят партньор на платформата за данни, кой ще им помогне при поглъщане на данни? Кой ще им помогне да изграждат аналитичното приложение? Що се отнася до трите чисто играещи Hadoop-и, критериите за оценка обикновено са около зрялост на инструментите и конзолите за управление, инструментите за управление на данните и ефективността."

Другият интересен аспект при избора на платформа Hadoop е липсата на лоялност. Компаниите преоценяват платформата си Hadoop толкова често, колкото на всеки 6-12 месеца, за да проверят дали компонентите за обработка на данни все още са правилните, поради колко бързо се променя пространството и колко малко са се разграничили големите играчи. Хюдекер заяви, че 20 процента от компаниите, за които е говорил, имат множество дистрибуции на Hadoop, работещи в техните центрове за данни или облак, или дават възможност на различни екипи да избират избраната от тях платформа или умишлено диверсифицират, за да не се забият само с едно разпространение на Hadoop.

Този вид разнообразно портфолио на платформата се подхранва от това, което Франк Буйтендейк, вицепрезидент по изследване на Gartner и отличен анализатор, фокусиран върху дигиталната стратегия, нарича „информацията като предимство“. Както не можете да управлявате бизнес без капитал, труд, материали и физически или виртуални съоръжения, Буйтенджик каза, че не можете да управлявате бизнес без информация.

"Преди разглеждахме бизнеса по отношение на трите потока: основният поток са стоки, вторичният поток е пари, а третичният поток е информация, за да се гарантира, че стоките и парите са изравнени. Сега в повечето бизнеси е обратното.. Основният поток е информация, от идентификация и конфигуриране до маркетинг на съдържание и т.н. Независимо дали се обаждате на Big Data или не, всъщност няма значение."

"Големите данни" са остарели

Buytendjik каза, че не вижда Big Data като отделна технология за бизнеса, а като една тема или мислене в рамките на цялостната ви дигитална стратегия.

"Не вярвам в стратегията за големи данни", каза Буйтенджик. „Едва ли има бизнес стратегия без цифрови компоненти, така че вярвам в дигитална стратегия, в която всички видове технологии дават критични възможности. Това включва мобилни, социални, облачни, IoT, интелигентни машини и големи данни.“

Хюдекер вярва, че ще започнем да говорим за „Големите данни“ все по-малко, защото сега това са само данни. Това е начинът, по който се прави бизнес. Масивните обеми и висока скорост на данните вече не са обезсърчаващи.

"Големите данни отново се превръщат в информация и анализи", каза Хюдекер. "Категорията Big Data е откровено не се разграничава. Винаги ни питат какъв е размерът на пазара на Big Data, но какво означава това дори? Big Data всъщност не е пазар, това е концепция. За бизнеса, който мисли за Big Data като нещо уникално и специално, което е коренно различно от това, което сте правили преди, е грешка. В този момент данните са просто нормални."

Как предприятията могат да имат смисъл от пазара на големи данни