Saturday, July 18, 2009

Lost In Google Translation

I dropped by the bookstore the other day, and after threading carefully through the hordes of excited middle-school kids clustered around the Twilight and Naruto sections (even though I did consider joining them…) I inevitably wound up in some variant of the Computers / Business / Economics / Reading Material for Intellectual Elitists aisle. The manager must have been addicted to Gmail or something because nearly all the books on the first display shelves were about Google – about how revolutionary it is, about how it’s changing our world, about how Google is demonstrating that the technological singularity is near. Admittedly, I do use Google about twenty-six hours a day, but I still have my doubts about how advanced Google’s machine-learning, artificial intelligence, and (insert computing buzzword here) technologies really are.

So I’ve devised a test to find out if Google’s juggernaut A.I. lives up to its hype. Using its automatic translation software, I will play the Rumor Game with these two paragraphs. If you’ve never played, the Rumor Game is simple: you have, say, ten people in a line, and the first person starts a rumor that he whispers into the next person’s ear. This continues down the line until the rumor is transmitted to the last person, who then says it out loud, and everyone has a good laugh at how distorted the original message has become. Instead of whispering, though, I will translate the text into a different language each time, and then finally translate it back to English where we’ll see how much of the original content is still understandable. Here we go,

To Chinese:
我扔掉的书店有一天,经过仔细线程通过成群的兴奋初中的孩子围绕黄昏和火影忍者节(即使我没有考虑加入他们... )我不可避免地清盘在一些版本的计算机/商业/经济/阅读材料的知识精英过道。经理必须是Gmail或上瘾的东西,因为几乎所有的书的第一展示货架左右谷歌-如何革命,这是关于它如何改变我们的世界,如何表明,谷歌是技术奇异接近。诚然,我不使用谷歌关于二十六小时一天,但我仍然有我怀疑谷歌如何先进的机器学习,人工智能,以及(在这里插入计算机行话)技术真的。
所以,我已经制定了一项测试,以找出如果谷歌的主宰人工智能辜负其炒作。利用其自动翻译软件,我将发挥的传闻游戏这两个段落。如果您从来没有打过,谣言游戏很简单:你有,比如说, 10人一行,并以第一人称开始传言,他悄悄进入下一个人的耳朵。这种情况持续下去,直到下线的传闻是转交给最后一个人,谁然后大声说,每个人都具有良好的笑如何歪曲原始邮件已成为。相反的窃窃私语,不过,我将翻译文本不同的语言,每次,然后把它终于回到英国,我们会看到有多少的原始内容仍然是可以理解的。在这里,我们走,

To Serbian:
И бацају књиге једног дана, након пажљиво нарезано кроз тхронгс загрејани децу од око јуниор средњој школи вечери и Наруто секција (чак и ако нисам размислите придружио им ...) И неизбежно ликвидација у неким верзију рачунара / пословни / економског / читање материјала пролаз у елитне образовани. Водитељ мора бити Гмаил или зависност, јер су скоро све књиге по полицама први приказ Гоогле - Како до револуције, то је како се мењају наш свет, како то показују да је Гоогле је технологија у близини једнину. Тацно је да не користе Гоогле 26 сата на дан, али ја још увек има моје сумње о томе како се Гоогле Напредна машински учење, вештачке интелигенције, те (овде убаците рачунар жаргон) технологију стварно.
Стога сам развио тест да ли Гоогле вештачка интелигенција је кључ да живе и до његових хыпе. Користите аутоматско превођење својих софтверских ћу играти игру гласина две тачке. Ако још нисте играли, гласине о игри је једноставна: ви сте, на пример, 10 особа, а његова странка на прву особу за покретање гласина, он је тихо у следећој лицу ухо. То се наставља све док се линија је пребачен у последњих гласина, који је тада рекао гласно, свако има добру смијати о томе оригиналну поруку је постала искривљен. Уместо шапутање, а ја ћу превести текст на различитим језицима, сваки пут, а онда напокон вратио у Великој Британији, ми ћемо видети колико је изворни садржај је још схватљиво. Идемо,

To Arabic:
يلقي الكتاب الأول في يوم من الأيام ، وبعد narezano بدقة ساخنة خلال حشود الأطفال في جميع أنحاء المدارس الاعدادية ، وأمسيات Naruto القسم (حتى لو لم أكن النظر في الانضمام لهم...) والتي لا مفر منها تصفية بعض الصيغة الكمبيوتر / العمل / الاقتصادية / مواد للقراءة في مرور النخبة المتعلمة. ويجب أن يكون الزعيم Gmail أو الإدمان ، لأنها كلها تقريبا رفوف الكتاب الأول عن طريق جوجل -- كيفية قيام الثورة هو تغيير في عالمنا ، وكيف تبين أن غوغل للتكنولوجيا في القريب المفرد. وصحيح أن غوغل لا تستخدم 26 ساعة في اليوم ، ولكن لا يزال امامي بلدي شكوك بشأن كيفية جوجل متقدمة آلة التعلم ، الذكاء الاصطناعي ، و (هنا تضاف بلغة الكمبيوتر) التكنولوجيا حقا.
ولذلك ، فإنني وضعت لاختبار الذكاء الاصطناعي جوجل هو المفتاح لترقى إلى مستوى الضجيج. استخدام الترجمة الآلية لبرامجك الشائعات تلعب لعبة نقطتين. إذا لم تكن قد لعبت حتى الآن ، ما تردد عن لعبة بسيطة : كنت ، على سبيل المثال ، 10 شخصا ، والوفد المرافق له لأول شخص لبدء شائعة ، فهو هادئ في مواجهة المقبلة الأذن. ولا تزال حتى هذا الخط الذي ينقل الى الشائعات ، ثم قال بصوت عال ، والجميع يضحكون جيدا الرسالة الأصلية أصبحت مشوهة. بدلا من أن يهمس ، وأنا لن ترجمة النص في لغات مختلفة ، في كل مرة ، ثم عاد إلى المملكة المتحدة ، وسنرى كيف المحتوى الأصلي لا يزال على البال. يذهب ،

To Finnish:
Kirja on ensimmäinen päivä, kun narezano huolellisesti lämmitetty kautta väkijoukkoja lasten kouluissa kaikkialla keskellä, ja iltaisin Naruto osa (vaikka en ole sitä mieltä, yhdistämällä ne ...) ja väistämätön selvitystilaan joidenkin kielen tietokone / business / taloudellinen / käsittelyssä materiaalia läpipääsy on koulutettu eliitti. Johtajan on oltava Gmail-tai riippuvuutta, koska ne ovat lähes ensimmäinen kirja hyllyt Google - kuinka vallankumous on muuttaa maailmassa, ja miten se osoittaa, että Googlen tekniikka on lähellä yksikössä. On totta, että Google ei käytä 26 tuntia vuorokaudessa, mutta minulla on silti omat epäilykseni siitä, miten Googlen kehittynyttä Machine Learning, tekoälyä ja (tässä lisätä kielellä tietokone)-tekniikka todellakin.
Siksi olen kehittänyt testi tekoälyä on avain Googlen aihetta melutaso. Käyttö machine translation ohjelmistoja huhuja, pelata peliä kaksi pistettä. Jos se ei ole ollut tähän mennessä huhuja siitä, että peli on yksinkertainen: te, esimerkiksi 10 ihmistä, ja valtuuskunnan hänen ensimmäinen henkilö aloittaa huhu, se on hiljainen, kun vastassa on seuraava korvalla. Ja jatkaa tätä linjaa siirretään huhuja, hän sanoi ääneen, ja nauraa makeasti kaikki alkuperäisen viestin on tullut vääristynyt. Sen sijaan, että kuiskaamalla, ja aion kääntää tekstin eri kielellä, ja jokainen kerta, palasi Yhdistyneeseen kuningaskuntaan, ja näemme, miten alkuperäinen sisältö jää mieleen. Mennä,

Finally, to English:
"The book is the first day, when narezano thoroughly heated through crowds of children in schools across the middle, and in the evening Naruto part (although I do not think a combination of them ...) and the inevitable liquidation of some of the language of computer / business / economic / reading material for the passage has been trained in the elite . The director must have a Gmail or a dependency, because they are close to first bookshelves Google - how the revolution is to change the world, and how it shows that Google's technology is close to the unit. It is true that Google does not use 26 hours a day, but I still have my doubts about how Google's advanced machine learning, artificial intelligence, and (here insert the language of computer) technology indeed.

Therefore, I have developed a test for artificial intelligence is the key to Google's rise to the noise level. The use of machine translation software to rumors, to play a game of two points. If it is not so far been rumors that the game is simple: you, for example, 10 people, and his delegation to the first person to start a rumor, it is silent in the face of the next ear. And to continue this line moved to the rumors, he said aloud, and a good laugh at all of the original message has become distorted. Instead of whispering by, and I intend to translate the text in different languages, and each time I returned to the UK, and we see how the original content remains to mind. Go,"

(Insert a good laugh here! This is also unsurprisingly similar to some of the stuff at engrish.com)

Highlights:

Original: “the manager must have been addicted to Gmail or something”
Mistranslated: “the director must have a Gmail or a dependency”
Google is implying that Gmail and dependencies are mutually exclusive. So forget rehab, just get a Gmail account instead!

Original: “Admittedly, I do use Google twenty-six hours a day…”
Mistranslated: “It is true that Google does not use 26 hours a day…”
That is indeed true.

Original: “but I still have my doubts about how advanced Google’s machine-learning…”
Translated Quite Well, Actually: “but I still have my doubts about how Google’s advanced machine learning…”

Case in point: Though Google might be very well capable of taking over the English-speaking countries of the world right now, it doesn’t seem like it’s quite ready to take on the rest. Just imagine if “surrender, now” was mistranslated into “all your base are belong to us” all over again.


Google CEO Eric Schmidt has his eyes on the prize. He also likes to wear that pimp-cape to work on casual Fridays.