У дома Мненията Как ai, ml ще трансформира реч в текст, езикови преводи | Тим баджарин

Как ai, ml ще трансформира реч в текст, езикови преводи | Тим баджарин

Видео: Dame Tu cosita ñ (Септември 2024)

Видео: Dame Tu cosita ñ (Септември 2024)
Anonim

Една от най-впечатляващите демонстрации в Google I / O беше Duplex, изкуствен интелект, който осъществяваше обаждания към места на работа - в случая фризьорски салон и ресторант - за да резервирате срещи. Хората от другия край на линията на пръв поглед не бяха по-мъдри и Duplex се справяше с предизвикателства с лекота, като когато ресторантът заяви, че не приема резервации за малки партита.

Това конкретно AI съобщение получи голямо покритие в I / O Google, но AI и машинното обучение бяха разпространени във всички продукти и услуги, показани на конференцията за разработчици. Просто погледнете тази диаграма, която Google показва на AI фокусирано аналитично събитие ден преди отварянето на I / O.

На това събитие бяха показани още две неща, които считам за потенциални смяна на играта.

Първият е как AI се прилага при превод от глас в текст. Целта е да се постигне точност до 99 процента с помощта на AI и ML през следващите няколко години. Въпреки това, демонстрациите, в които те диктуваха коментари в различни приложения на G-Suite, вече бяха доста точни. Видяхме и по-задълбочена демонстрация на Smart Compose, при която човек пише изречение в Gmail, а Smart Compose пише следващото изречение за вас въз основа на контекста на първото изречение.

Различни продукти за разпознаване на глас, като Dragon Dictate, са на пазара от години. Но тези програми разчитаха на локализиран софтуер и се възползваха от текущата мощност на обработка, налична по време на всяко издание. Тези програми станаха по-добри през годините, но ако рекламирате AI и ML, точността на точността непременно ще стане по-добра.

Google разбира важността на речта в текст, тъй като е свързана с ежедневието ни. Точният интерфейс между глас и текст е от решаващо значение при отговор на съобщение по време на шофиране. Това е смислен начин да се отговори на имейл или текстово съобщение на носими или смартфони. В крайна сметка това ще стане ценен принос при използване на очила със смесена реалност, където използването на глас като част от навигационния процес и глас към текст е необходимо за различни видове AR приложения.

Второто е как AI и ML се използват в Google Translate, което ще бъде наистина трансформативно, когато преводите се случват в реално време. Като международен пътешественик, който говори само английски, този вид превод би бил богатство. Има някои ръчни устройства, които се опитват да преведат това, което казвате, на местен език, но в момента те имат много ограничения.

Google има окото върху този тип превод, така че е безопасно да се каже, че скоро можем да видим някои истински пробиви в по-точния езиков превод на телефони с Android. Apple също така провежда AI и ML изследвания, които се занимават с различни аспекти на превода на глас и текст, така че той също, заедно с потенциални партньори, могат да доставят решение за превод на мобилен език в iOS някой ден.

AI и ML ще имат драматично въздействие върху превода между глас и текст и най-забележимият му ефект може да е част от потребителския интерфейс в очилата за AR и VR или смесена реалност. Лично езиковите преводи ме вълнуват най-много, тъй като това би улеснило пътуванията ми по света.

Как ai, ml ще трансформира реч в текст, езикови преводи | Тим баджарин