דובי קננגיסר – לא מעודכן ולא במקרה

גוגל קוראת מחשבות (שוב)


בבלוג של גוגל הודיעו על שירות חדש לדוברי הינדי: תרגום אוטומטי מ”הינדגליש” לכתב הינדי. מכר שעסק בכתיבת תוכנות עבור קהלים אסיאתיים הסביר לי פעם כמה זה מסובך לכתוב על מחשב רגיל ולהפוך את הטקסט לכתב סיני (במקרה ההוא, אבל זה נכון לכל כתב שיש לו הרבה יותר מדי סימנים): איך שזה היה אצלם, האדם כותב טקסט באותיות אנגליות, לפי שיטת תעתוק מסויימת, ובסוף כל מילה המחשב מנסה להפוך את המילה לפיקטוגרמה הנכונה. לפעמים יש כמה אפשרויות, אז המחשב מציע את כולן (בשאיפה), והכותב צריך לבחור את הנכונה. זה נשמע מייגע להפליא, ואני מאוד מקווה שמאז ששמעתי את ההסבר הזה (לפני עשור וחצי בערך), חל שיפור בשיטה.

עכשיו גוגל מציעה משהו חדש, תוך שימוש באותם עקרונות טכנולוגיים שאפשרו לגוגל לספק כל כך הרבה שירותים מצליחים. המשתמש מתבקש לכתוב הינדית באותיות אנגליות, כפי שהם נוהגים לעיתים קרובות בצ’אטים (פשוט כי זה קל). הוא לא נדרש להשתמש בתעתיק מסויים אחד. אפשר לתעתק באופן פונטי לפי מה שנראה לך טוב. גוגל תנסה “לתרגם” את המילה שכתבת לכתב הינדי. עכשיו מתחיל הקטע המעניין: אם תתקן את התרגום של גוגל (בגלל שהתעתוק הניח הנחה שגויה לגבי הכללים שהמצאת לעצמך), גוגל תזכור את התיקון הזה, ותשתמש בידע הזה לגבי תרגומים עתידיים — של כלל המילים. כלומר, למעשה, המנוע של גוגל ייצור מנוע תרגום ספציפי עבור צורת הכתיב שלך. אני מניח שהם גם יידעו לקשר בין מנועים בעלי מאפיינים “דומים” כדי לשפר ניחושים ראשונים.

אני תוהה אם עקרון דומה יכול לפעול גם לגבי תעתיקים של “היבליש”. אמנם אין בעיה משמעותית בכתיבה בעברית על מחשב (היי – לנו יש פחות אותיות מאשר לאנגלית!), אבל זה נשמע ניסוי מעניין.

אגב, אחד היישומים המעניינים ביותר של העקרון הטכנולוגי שמאחורי השירות החדש של גוגל הוא תרגום מכונה המבוסס על למידה עצמית של המנוע. גם על זה גוגל עובדים, באמצעות עשרות “אבני רוזטה” מודרניות, כגון התרגומים הרשמיים של האו”ם למגוון מסמכים שהם מפרסמים בכל השפות הרשמיות של הארגון. בפעם האחרונה ששמעתי, התוצאות שלהם היו מדהימות, ביחס ליכולות של מנועי תרגום מוכרים.

,

2 תגובות על “גוגל קוראת מחשבות (שוב)”

  1. גוגל לא ממציאים פה שום דבר חדש, לפחות לא בנוגע לשיטות הקלדת שפות אסייתיות במחשב. אישית, אני עובד עם יפנית, ואכן – השיטה השתפרה מאוד בעשור האחרון. העקרון זהה: אתה מקליד בתעתיק לועזי, והמחשב מתרגם לסימניות סיניות (ומבקש הבהרות כשצריך). המחשב מנחש בצורה אינטליגנטית – ע”פ המבנה הדקדוקי של השפה (פעלים יכולים לבוא במקומות מסויימים, תארים באחרים), ובעיקר על פי מנהגיו של המשתמש. לאחר אימון לא ארוך, הקלדת יפנית מהירה ממש כמו הקלדת אנגלית או עברית.

  2. :roll: ;) :x :!: :!: :!: :( :x :o ;) :P :idea: