У дома Бизнес Google опростява машинното обучение с sql

Google опростява машинното обучение с sql

Съдържание:

Видео: Understanding the core components of SQL Server | lynda.com overview (Ноември 2024)

Видео: Understanding the core components of SQL Server | lynda.com overview (Ноември 2024)
Anonim

Сега Google добави възможности за машинно обучение (ML) към своя Google BigQuery, предлаганата от облака база данни за петабайт (PB) на компанията. Сега наречена BigQuery ML, новата версия ви позволява да използвате прости SQL структури на заявления за структуриране и внедряване на ML модели за прогнозна анализа.

Това не е само добра новина за учените с данни, които използват Google. Също така е добре за бизнес операторите, които се интересуват от повишаване на възможностите си за анализ на данни, тъй като добавя още един ефективен конкурент към доста малък списък от доставчици, способни да предоставят това ниво на усъвършенстване чрез облака. Другите две най-известни имена са услугата за релационни бази данни на Amazon и Azure SQL на Microsoft, а можете да намерите повече в скорошното ни обзорно обслужване на облачни бази данни.

Основата на всички доставчици на продукти и купувачи на данни винаги е била разликата в уменията. Това важи особено за тези, които се интересуват от ML и прогнозна анализа, тъй като тези дисциплини често изискват познаване на нови технологии и езици за заявки.

„За всеки един учен с данни има стотици анализатори, които работят с данни и повечето използват SQL“, каза пред PCMag Sudhir Hasbe, директор „Управление на продукти“ в Google Cloud. Нещо трябваше да даде, ако силата на армия анализатори на данни трябва да бъде откопчена от тясното място, създадено от твърде малко и твърде претоварени учени с данни.

Отговорът на Google на тази дилема не е нищо забележително. Въпреки че ML е гореща тенденция и се появява в продукти от всякакъв вид навсякъде, тя все още е твърда територия на учените за данни. Множество доставчици се насочиха към опростяването на технологията, но грозната истина е, че можете да я опростите с много и все още е твърде трудно за използване от над 99 процента от човешкото население. И все пак, ние трябва да можем да го използваме, защото ML може да направи повече и да го направи по-бързо, отколкото група супер умни хора могат.

Google засажда ML в Google BigQuery, така че да се намира по-близо до данните. Приложението ще донесе възможностите на ML по-бързо от традиционните модели на ML отчасти, защото анализите на данни могат да се извършват в източника. Сега в бета версия, BigQuery ML дава възможност на анализаторите (и учени с данни) да изпълняват прогнозна анализация като прогнозиране на продажбите и създаване на клиентски сегменти точно върху данните, където се съхраняват. Само това е респектиращо и забележително надграждане.

Google обаче отиде по-далеч от това, като добави възможност, която позволява на анализаторите на данни да използват прости SQL изявления за изграждане и внедряване на ML модели. В момента вариантите са линейна регресия и логистични регресионни модели за прогнозен анализ, тъй като това са двата модела, които най-често се използват.

Ето илюстрация, която Google предостави, за да демонстрира как анализаторите на данни биха използвали тази възможност:

Google планира да добави повече възможности за ML към тази възможност във времето, според Hasbe. „Трябва да чуем от нашите клиенти кои модели искат да добавим, така че първо да предоставим най-полезните“, каза той.

Допълнителни надстройки на Google BigQuery

Начело на съществения списък на ъпгрейдите след ML са възможност за клъстериране, BigQuery географски информационни системи (BigQuery GIS), нов конектор за данни на Google Sheets и нов конектор за данни на Google Sheets.

Клъстерирането също е в бета версия и дава възможност за създаване на клъстерирани таблици в ход за оптимизиране на данни, който групира редове с подобни клавирни клавиши заедно. Това намалява разходите, тъй като подобрява производителността и дава възможност на Google BigQuery да таксува потребителя само за сканираните данни, а не за цялата таблица или дял.

Понастоящем BigQuery GIS е в алфа и се използва за анализ на геопространствени данни. Докато екипът на Google Cloud си партнира с Google Earth Engine за изграждане на BigQuery GIS, трябва да внесете собствените си геопространствени данни в таблицата. Това не е проблем в и в няколко индустрии, включително свързани автомобилни системи, Интернет на нещата (IoT), производство, търговия на дребно, интелигентни градове и телематика. Да не говорим за правителствените агенции, вариращи от Агенцията за опазване на околната среда (EPA) и Националната агенция за геопространствено разузнаване до Националната администрация за океан и атмосфера (NOAA) и всички военни клонове, разбира се.

BigQuery GIS използва библиотеката S2, която вече има над милиард потребители чрез различни продукти като Google Earth Engine и Google Maps. Ако имате нужда от повече геопространствени данни, тогава федералното правителство споделя огромно количество от тях в GeoPlatform.

Нов конектор за данни на Google Sheets вероятно ще зарадва много анализатори на данни, просто защото е толкова практичен за ежедневна употреба. Можете да получите достъп до Google BigQuery от Google Sheets (програма за електронни таблици) и да използвате инструментите на Google Sheets като Explore, което е комбинирано средство за сътрудничество, визуализация на данни и запитвания за естествен език.

Google BigQuery вече има и нов потребителски интерфейс (UI) в бета версия. Един от по-интересните елементи е функцията за визуализация с едно щракване, която Google Data Studio поддържа. Всичко казано, това е страхотен кръг от ъпгрейди за вече елегантно обслужване. Тези ъпгрейди ще бъдат тествани в следващия кръг на рецензиите на PCMag's Database-as-a-Service (DBaaS), след като бъговете са разработени и продуктите са преминали отвъд съответните им алфа и бета състояния.

PCMag EIC Dan Costa обсъжда бъдещето на данните:
Google опростява машинното обучение с sql