У дома Мненията Свещеният граал на превода на глас, сега в скайп | Джон c. Дворжак

Свещеният граал на превода на глас, сега в скайп | Джон c. Дворжак

Видео: Анна Седокова Между нами кайф (Ноември 2024)

Видео: Анна Седокова Между нами кайф (Ноември 2024)
Anonim

Ако следвате компютърната революция от създаването на микропроцесора, ще знаете, че има редица ранни обещания, които все още не са изпълнени.

Едно от тях е преведената реч в движение, където казвате нещо на английски и се повтаря на друг език, като испански, в почти реално време. Въпреки че все още се работи, Microsoft вече е с една стъпка по-близо до Skype Translator, първата фаза на която мина през тази седмица.

Ако това е близо до работа и не е шега, това е продукт на десетилетието. В момента Skype Translator поддържа преводи от испански на английски и от английски на испански, но са настроени да следват още езици.

Типичният проблем с подобни неща е възмутителното ниво на трудност. Все още не виждам приличен пакет за превод, който прави преводи от текст в текст, които работят добре. Преводът на речта има съвсем различно ниво на трудност, особено в реално време.

Microsoft има филм, показващ две деца, които говорят на испански и английски, което го прави да изглежда, че работи добре. Но видях подобна система, демонстрирана от IBM преди почти 20 години, която никога не видя светлината на деня. Версията на IBM е разработена през 90-те години на миналия век, когато имаше мания за разпознаване на реч, ръководена от Lernout & Hauspie, компания, която се счупи - преди да се счупи за скандал с измами през 2001 г. Преди това обаче купуваше всяка технология за реч компания, която би могла, включително Dragon Systems, Berkeley Speech Technologies, Fonix, Dictaphone и други. Microsoft имаше 8-процентов дял в L&H и завърши с някои от технологиите като подарък за раздяла с фалит.

Сега внезапно се появява Skype Translator. Съвпадение? Какъвто и да е случаят, цялата тази технология отне твърде много време, за да стигнем до този момент.

Вижте нещастните компютърни преводи от текст в текст, направени от Google и други. Текстът не може и не може да избегне най-очевидните грешки. Нищо от това не се доближава до сложността на превода на реч, което води до тежка обработка на сигнала.

Аз съм колекционер на вино и често посещавам уебсайтове на френски винарни. Френският ми е само наред, затова често включвам превода, за да ускоря четенето на сайта. Ето ни през 2014 г. и никой от преводачите не може да разбере, че преводът на Château Margaux е Château Margaux, а не Castle Margaux. Колко е трудно да се въздържате и да не превеждате често използваната дума, използвана в правилното име, като château, обикновено отнасяща се до конкретна винарна, в думата замък? Явно е невъзможно. Всички го правят.

Колко е трудно да напишете някакво изключение в кода, който казва на преводача, че е на уебсайт за виното от Бордо? Докато на този сайт думата château не означава замък. Често преводачът се опитва да декодира и останалото име на замъка със смешни резултати. Най-доброто, което най-общо можете да направите с превода на текст, е да получите дублиране на това, което сайтът казва.

Запитайте се: ако текстът е толкова труден, как Microsoft ще управлява речта?

Това е до невъзможно дори на същия език. Вземете телефонната услуга Google Voice. Той има функция за приемане на реч в текст. Никога не съм получавал гласово в текстово съобщение, което дори се доближава до това, което човекът всъщност е казал. Не веднъж.

Ще призная, че в тиха стая, когато говориш отчетливо и ясно, разпознаването на глас се справя добре. Използвам го за текстови съобщения на моя телефон с Android. Но в истински разговор никой не говори така. Възхищавам се на Microsoft, че разгърна това. Но няма да работи както се рекламира.

Това каза, че е най-малко нещо, с което да се играе. Това може дори да предизвика ново поколение изследвания. Така че няма да се оплаквам твърде много.

Всички искат това. Да се ​​върнем да работим над това.

Свещеният граал на превода на глас, сега в скайп | Джон c. Дворжак