У дома Бизнес Бизнес ръководството за машинно обучение

Бизнес ръководството за машинно обучение

2024

Съдържание:

Практическо определение
Дълбоко обучение срещу евтино обучение
Как работи евтиното обучение?
2018 и отвъд: Къде е ML сега

Видео: Dias Ð´Ð° Ð¸Ð»Ð¸ Ð½ÐµÑ- (Ð-Ð¸Ð¼Ð°Ñ- - Ð-ÐµÑ-ÐºÐ° OST Ð¤Ð¸Ð·Ñ-Ã (Ноември 2024)

От обработката на естествен език (NLP) до дълбокото обучение и след това машинното обучение (ML) е навлязло в много аспекти на най-популярните бизнес технологии. ML е само един фактор в революцията на изкуствения интелект (AI), но той е важен. ML алгоритмите са жизненоважен интелектуален слой, който е включен в продуктите, които използваме, и само ще го видим как се влива в повече случаи на използване в бъдеще.

ML алгоритмите са вградени в тъканта на голяма част от технологиите, които използваме всеки ден. ML иновациите, обхващащи компютърното зрение, задълбоченото обучение, NLP и по-нататък са част от по-голяма революция около практическия AI. Те не са автономни роботи или живи същества, а вид интелект, интегриран в нашите приложения, софтуер и облачни услуги, който комбинира AI алгоритми и Big Data под повърхността.

Тенденцията е още по-изразена в бизнеса. ML вече не се използва единствено за специализирани изследователски проекти, предприети от екип от учени. Сега предприятията използват ML, за да получат възприемчиви бизнес анализи (BI) и прогнозна анализа от непрекъснато увеличаващи се количества данни. Ето защо е по-важно от всякога не само да знаете какво е ML, но и да научите най-ефективните стратегии за това как да го използвате за осезаема стойност.

Тед Данинг, доктор на науките, е главният архитект на приложения в MapR, който предоставя големи данни за разпространение и инструменти за управление на данни за предприятията, а също така е и съавтор на две книги за това, което той нарича „Практическо машинно обучение“. Ветеранът от Силиконовата долина работи в областта десетилетия наред, наблюдавайки техниката на ИИ и пространството се развива до момента, в който напредъкът в когнитивните изчисления и наличието на инструменти с отворен код наистина доведоха МЛ в основния поток. Дънинг говори с PCMag, за да пресече жаргона, да обясни какво всъщност означава ML и да представи някои мъдрости и най-добри практики за това как предприятията могат да извлекат максимума от своите инвестиции в ML.

Практическо определение

Правото определение на ML дава възможност на системите да действат и итеративно да учат и да правят корекции, без изрично програмиране. Дънинг каза, че ML е клон на статистиката, но клон, който е много практичен. Той подчерта, че в контекста на реалния бизнес трябва да бъдете прагматични и реалистични с това как го прилагате. Основната задача на ML е да създаде повтарящ се, надежден и изпълним бизнес процес.

„Машинното обучение не се състои в това да поглеждаме назад към научните данни и да се опитваме да решим какви изводи са жизнеспособни“, каза Дънинг. „Става въпрос за гледането напред и за въпроса какво можем да прогнозираме за бъдещето и какво ще се случи при различни сценарии. Когато се стигне до правенето на бизнес с тези данни, говорим за много ограничени ситуации, при които искате възпроизводимост.“

Кредитна снимка: Тод Джакит от Futurism.com. Кликнете, за да разгънете пълната инфографика.

Дълбоко обучение срещу евтино обучение

Можете да разбиете тази основна идея в няколко различни области в ML, но Дънинг посочи две по-специално в двата края на спектъра: задълбочено обучение и това, което той нарича „евтино обучение“. Дълбокото обучение е по-сложната концепция.

"Искахме машинното обучение да се задълбочи. Това е произходът на термина", каза Дънинг. „През последните 10 или 15 години са разработени техники, които всъщност го правят. Използвани за да изискват много инженерна работа, за да направят връзките в данните видими за алгоритмите, които дълго време не бяха толкова умни, колкото ние исках те да бъдат. Трябваше да подадете алгоритми на тези приятни данни на табела, така че използвахме да кодираме ръчно всички тези функции, които системите сега правят сами."

Дълбокото обучение е там, където се крие голяма част от иновациите около невронните мрежи. Той комбинира сложни техники като компютърно зрение и NLP в слоеве на „по-дълбоко“ обучение, които доведоха до огромни крачки в области като разпознаване на изображения и текст. Това е чудесно за сложно моделиране, но може да бъде излишно за по-прости, ежедневни бизнес приложения, които могат да разчитат на установени рамки и техники за ML с много по-малко параметри.

Евтиното обучение, обясни Дънинг, означава прости, ефективни, изпитани техники, при които предприятията не трябва да инвестират скъпи ресурси, за да изобретяват колелото.

"При изчисляването говорим много за ниско висящи плодове. Наличието на данни и огромното увеличение на изчислителния капацитет означава, че сме свалили цялото дърво", обясни той. "Простото машинно обучение вече не е само за учените по данни."

Как работи евтиното обучение?

Основните ML алгоритми могат да идентифицират корелациите и да дават препоръки или да правят преживяванията по-контекстуални и персонализирани. Дънинг каза, че има възможност в почти всеки аспект от това как взаимодействаме с компютрите, за да използват евтино обучение, за да направят нещата да работят по-добре.

Един пример за евтино обучение на практика е откриването на измами. Банките и търговците се занимават с широко разпространени измами, но често се разпръскват и се отнасят до достатъчно ниски стойности, за които не се съобщава. Дънинг обясни, че използвайки алгоритъм за евтино обучение (тоест съществуващ ML тест, програмиран за тази конкретна задача), търговците могат по-лесно да идентифицират общите точки на компромис, които излагат потребителите на риск и хващат модели на измами, които иначе не биха били видими.

"Да предположим, че искате да намерите кои търговци изглежда да изтичат данни, които водят до измама. Можете да използвате тест G ^2, за да откриете кои търговци са прекалено представени в историите на транзакциите на жертви на измама срещу потребители без измама, " Данинг казах. "Това изглежда твърде просто, за да се нарече машинно обучение, но намира лоши момчета в реалния живот. Разширенията на тази техника могат да се използват за увеличаване на малко по-модерни техники, позволяващи по-прости алгоритми за учене, за да успеят там, където може да се провалят в противен случай."

Евтиното обучение може да се използва по най-различни начини, така че Дънинг даде още един пример как онлайн бизнесът може да го използва. В този случай той обясни как съществуващ ML алгоритъм може да реши обикновен проблем с класирането на коментарите.

"Да предположим, че имате статия с редица коментари към нея. Какъв ред трябва да бъдат поставени? Какво ще кажете за подреждането на коментарите според това колко интересни хора мислят за тях? Можете да преброите броя на хората, които четат коментара и как много пъти го отменят, но все още има нужда от малко магия “, каза Дънинг.

„Една печалба от един четец вероятно всъщност не е по-добра от осем актуализации от 10 читатели“, обясни той. "Още по-лошото е, че ако поставите ранни победители отгоре, другите коментари никога не виждат светлината на деня и така никога не научавате за тях. Една малка част от машинното обучение, наречена Sampson sampleling, може да реши това по начин, който събира данни за нови коментари и където класирането е несигурно, но като цяло ги подрежда по начин, който дава на потребителите най-доброто изживяване."

Dunning изложи и набор от най-добри практики за това как вашият бизнес може да се възползва максимално от ML. За разбивка на това как логистиката, данните и арсеналът от различни алгоритми и инструменти се превръщат в успешна бизнес стратегия, вижте нашите 7 съвета за машинно обучение за успех.

2018 и отвъд: Къде е ML сега

Може би това не ви изненадва, но Big Data и свързаното с тях пространство от бази данни бързо нарастват, за да кажа най-малко. По време на конференцията BigData SV 2018 в Сан Хосе, Питър Бърис, главен изследователски директор на фирмата за технологични аналитици Wikibon Research, представи констатации, показващи, че приходите от глобалната индустрия за големи данни се изчисляват да нараснат от 35 милиарда долара през 2017 г. до 42 милиарда долара през 2018 г. На всичкото отгоре, Бърис прогнозира приходите да достигнат 103 милиарда долара до 2027 година.

За да се справят ефективно с всички тези данни, интелигентните ML решения ще станат още по-необходими, отколкото сега. Очевидно е, че МЛ ще продължи да бъде гореща тема в обозримото бъдеще. Когато за последно говорихме с Dunning от MapR преди година, той наблегна на изчисления и реалистичен подход към МЛ за бизнеса. Но една година е много време, когато говориш за технологии. Наскоро настигнахме Дънинг и според него нещата останаха приблизително същите след последния ни разговор. "На това по-високо ниво не много се е променило", каза Дънинг. „Основната идея да разсъждаваме от доказателства със сигурност не е новина през последната година, но някои от инструментариума се промениха.“

Имайки това предвид, Дънинг също каза, че има повече играчи на терена, отколкото преди само една година, но този факт не е непременно добро нещо. „Едно нещо, което се случи, е появата на все повече и повече продавачи, които говорят за„ магическо “машинно обучение, за да кажат гадна дума за това“, обясни той. „Съществува голямо погрешно схващане, че можете просто да хвърлите данните си в продукт и да извлечете някои красиви впечатления от него.“

Защо машинното обучение е бъдещето Защо машинното обучение е бъдещето
Comet.ml иска да промени начина, по който взаимодействаме с машинното обучение Comet.ml иска да промени начина, по който взаимодействаме с машинното обучение
Google опростява машинното обучение с SQL Google опростява машинното обучение с SQL

Очакването на магически резултат от ML може да бъде "подкопаване", според Дънинг. "Все още трябва да мислите какъв проблем всъщност има значение. Все още трябва да събирате данни и все още трябва да управлявате разполагането на вашата система", каза той. "И тези прагматични, логистични реалности все още доминират проблема."

Dunning оспорва някои от високо маркетинговите предложения на някои софтуерни компании. „Никой от вълшебните AI неща дори не адресира това“, каза той. Той има съвет, който предприятията трябва да разгледат. Според него един от начините за осигуряване на добри практики е наемането на конкретен бизнес анализатор AI, така че да накарате някой във вашата компания да идентифицира аспекти на вашия бизнес, които могат да бъдат подобрени с помощта на ML технологията.

„В някои случаи това може да бъде разширяване на вашия бизнес към нови възможности“, обясни Дънинг. Но в повечето случаи той подчерта, че наемането на някой, който да разбере нуждите на вашата организация и да използва тази информация, за да ръководи вашата стратегия за МЛ, е от решаващо значение.