У дома Отзиви Преглед и рейтинг на Google bigquery

Преглед и рейтинг на Google bigquery

Съдържание:

Видео: Простая и дешёвая бизнес-аналитика на базе Google BigQuery / Алексей Паршуков (DocDoc) (Октомври 2024)

Видео: Простая и дешёвая бизнес-аналитика на базе Google BigQuery / Алексей Паршуков (DocDoc) (Октомври 2024)
Anonim

Google BigQuery, която е безплатна за 10 гигабайта (GB) на месец, е огромният склад за данни на гиганта, петабайта (PB) за анализи. Това е корпоративен продукт, SQL продукт и големите данни са в ДНК на Google. Всички инструменти и услуги на компанията са доказателство за това. Накратко, ако искате да направите каквото и да било с данни, тогава можете да се обзаложите, че Google има инструмент, с който да се случи. Ако имате масивни набори от данни или натрупвате данните си, като ги смесвате с публични или търговски набори от данни, тогава Google BigQuery може да бъде солиден избор. Той е предназначен за сканиране на терабайти (TBs) за секунди и PB за минути. Най-голямата заявка до момента е 2, 1 PB и Google BigQuery се справи с нея без проблеми. Въпреки тези възможности, анализа на големите данни е предизвикателство и ако работите с по-малки набори от данни, може да е прекалено голям. И все пак Google BigQuery е солиден избор, който се намира точно зад базата данни на Microsoft Azure SQL и MongoDB Atlas, избор на редактори в нашата кръга за преглед на решения на DBaaS.

Модел за ценообразуване

Google BigQuery е модел за анализ на сървър без данни. Разделянето на съхранението и изчисляването ви дава по-добър контрол върху цените, който е по-интересен за хората, които изпълняват изключително големи проекти. Съхранението се определя на фиксирани цени и се изчислява на процента на използване. Първите 10 GB хранилище са безплатни всеки месец и разходите започват от 2 цента на GB на месец след това. Например, ако съхранявате 1 терабайт (TB) за един месец, тогава цената ще бъде 20 долара. Вмъкванията на поточни данни започват от 1 цент на 200 мегабайта (MB). Първите 1 TB заявки са безплатни, с допълнителен анализ от $ 5 на TB след това. Операциите с мета данни са безплатни.

Имате и възможност да плащате, докато отидете, или месечна фиксирана такса. Някои разработчици предпочитат фиксираната такса за бюджетно облекчение на тревожност. Тъй като съхранението вече е с фиксирана такса, тази опция просто означава, че изчисленията също са на една плоска, месечна такса. Но преди да се развълнувате твърде много от регистрацията за фиксиране на цените, имайте предвид, че само сметките с $ 40 000 + в месечни разходи за анализи отговарят на условията за тази опция.

Безплатният слой на Google BigQuery осигурява до 1TB данни, анализирани всеки месец, и 10 GB съхранение на данни, но сериозно, ако сте много под тази марка, има и други инструменти, по-подходящи за задачата, като Microsoft Azure SQL база данни, IBM Db2 в облак или Google Cloud с Google Analytics 360.

Стъпка по стъпка

Ще ви трябва акаунт в Google, така че да го настроите, ако вече нямате такъв. Ще ви трябва, за да се регистрирате за акаунт в Google Cloud Platform, което също ще изисква кредитна карта, за да използвате безплатната пробна версия. Но не се притеснявайте, тъй като в края на пробния период няма да бъдете надстроени автоматично и таксувани. Трябва да извършите ръчно надграждане за каквото и да е таксуване с вашата кредитна карта.

От потребителския интерфейс на Google Cloud (UI) отидете на BigQuery. Потребителският интерфейс на BigQuery е малко обикновен - Jane, но неговата прецизност го прави и лесен за използване. Google ми казва, че сега работи върху нов потребителски интерфейс. С текущия потребителски интерфейс, ако просто искате да проучите, щракнете върху Създаване на заявка и изберете един от публичните набори от данни на приветствената страница. Напишете стандартна SQL заявка в полето за заявки, като използвате Редактор на заявки или Редактор на дефинирани от потребителя (UDF) редактор и излезте.

Ръководствата за бързо стартиране са полезни при прехвърляне на данни или завъртане на собствена база данни в Cloud Bigtable, Cloud Spanner, Cloud SQL или Cloud Datastore (база данни NoSQL). BigQuery използва SQL-съвместим Американски национален институт по стандартизация (ANSI), както и драйвери за отворена база данни (ODBC) и драйвери за база данни на Java (JDBC), за да се интегрира с данни в други облачни продукти и допълнителни типове приложения. Уникалните SQL реализации, предназначени да изгладят заявките, означава, че има няколко SQL диалекта, което може да бъде объркващо. Забелязах, че докато по подразбиране е "Legacy SQL", бих могъл да премахна отметката от диалоговото поле на SQL, за да се върна към истинския стандартен SQL.

Google BigQuery разполага и с механизъм за поглъщане на потоци за събиране и анализ на данни в реално време. Използвайте раздела Създаване на набор от данни в падащото меню Моят първи проект, за да създадете набор от данни. Въведете идентификатора на набора данни, изберете местоположението на данни (САЩ, Европейския съюз или Азия-Североизток) и задайте изтичането на данните. Google BigQuery може автоматично да открие схема. След като набор от данни е настроен, вие сте готови да стартирате заявки.

Кутията с инструменти

Има конектори към повечето инструменти за бизнес разузнаване (BI). Но може да искате да използвате Data Studio, който е BI инструмент за визуализация на Google и е безплатен. Списъкът с инструменти на Google, които можете да използвате, е дълъг. Препоръчвам ви да започнете с преглед на списъка с безплатни нива на Google Cloud Platform.

Google Cloud Platform има 15 региона, 45 зони, над 100 точки присъствие и добре поддържана глобална мрежа със 100 000+ мили оптичен кабел. Получавате по-добри цени с помощта на глобалната услуга, но сте свободни да посочвате региони според желанието си.

Резервните копия и споразуменията на ниво услуга (SLAs) попадат под егидата на Google SQL Cloud. Пълният SLA е тук. Cloud SQL поддържа седем автоматизирани архивирания за всеки случай. Резервните копия от първо поколение (gen) улавят всичко и са включени в разходите за инстанция (на модела за употреба). Тяхното пространство за съхранение не се отчита на разпределеното ви място за съхранение. Резервните копия от втори ген прихващат само променените данни и тяхното съхранение се зарежда с намалена скорост.

Като цяло Google BigQuery е блестящо проектиран. Той е по-подходящ за огромни масиви от данни и за тези, които са квалифицирани да работят с тях. Ако се занимавате с писане на приложения за машинно обучение (ML) или проектирате данни за обучение на ML, тогава особено ще харесате този продукт. Същото се отнася и за разработчиците, работещи в приложенията на Internet of Things (IoT) или всякакви разработки, изискващи гъвкаво приемане на данни и масивен анализ на данни.

Преглед и рейтинг на Google bigquery