פסיקה | המגזין | חקיקה | כתבי טענות | טפסים | TV | משאלים | שרותים משפטיים | פורום
חיפוש עורכי דין
מיקומך באתר: עמוד ראשי >> חדשות >> הסכנות שבגוגל טרנסלייט - פירצה או הפרה?

הסכנות שבגוגל טרנסלייט - פירצה או הפרה?

מאת: פרנק מאיר (מאיירס), עו"ד ונוטריון | תאריך פרסום : 11/09/2012 12:00:00 | גרסת הדפסה

מבוא

מאז ומתמיד היווה עיקרון הסודיות מרכיב מרכזי וחשוב בפרקטיקה המקצועית הנוהגת, ואפילו כיום, בעידן ה- Wikileaks והפריצות למחשבים, ממשיך עיקרון זה לגלם תפקיד מרכזי וחשוב (ואולי אף חשוב יותר) בעבודתם של אנשי מקצוע רבים. מקורה של חובת הסודיות יכול שיהיה מכוח החוק, האתיקה המקצועית או  מכוח הפרקטיקה הנוהגת, ובין החובות המוכרות ניתן למנות את חיסיון עורך הדין-לקוח, סודיות רפואית, חיסיון המקור העיתונאי, כומר קתולי בתא הווידוי, סודיות בנקאית ועוד.

לאור כל זאת, עולה השאלה האם השימוש ב'גוגל טרנסלייט' על ידי אדם או גוף שחלה עליו חובת סודיות או  חיסיון, עלול להוות הפרה של חובה זו?

על מנת לענות על שאלה זו, עלינו להבין תחילה: א) כיצד פועל גוגל טרנסלייט ו-ב) מהם תנאי השימוש בגוגל טרנסלייט.

כיצד פועל גוגל טרנסלייט?

בספרו על אודות התרגום, Is That a Fish in Your Ear? – Translation and the Meaning of Everything1, דיוויד בלוס (David Bellos) מסביר כי "אין שום עיסוק במשמעות. במקום להתייחס לביטוי לשוני כדבר מה הדורש פיענוח, גוגל טרנסלייט מתייחס אליו כאל משהו שכנראה נאמר בעבר [כלומר, בתרגום אנושי]. הוא משתמש בכוח המחשוב העצום שלו כדי לסרוק את האינטרנט בהינד עפעף ולחפש את הביטוי בטקסט כלשהו שכבר קיים, לצד התרגום הצמוד אליו".

פירוש הדבר, למעשה, הוא שטקסט, משפט או ביטוי המוזנים לגוגל טרנסלייט עוברים חלוקה ליחידות (סגמנטים או 'יחידות זיכרון תרגומי') באמצעות שימוש בסטנדרט מוכר בתוכנות תרגום הידועה בשם 'XLIFF'. לאחר השלמת החלוקה ליחידות, גוגל טרנסלייט 'מתרגם' את אותה יחידה- לא בניסיון להבין חוקי דקדוק מורכבים כלשהם  - אלא במטרה להתאים אותה בצורה האופטימלית ביותר ליחידה דומה המצויה בבסיס הנתונים העצום שלו.

על פי רוב, ההתאמה המתקבלת אינה מלאה אלא קרובה ככל הניתן, וזה נקרא התאמה 'מעורפלת' (‘fuzzy’). מאגר הזיכרון גדל עוד יותר בשימוש בשפות ציר או שפות 'מתווכות'. לכן, משפט שתורגם מעברית לאנגלית עשוי למצוא דרכו לספרדית אם למאגר הנתונים של גוגל יש א) תרגום של המשפט, או משפט דומה לו, מעברית לאנגלית ו-ב) תרגום של המשפט, או משפט דומה לו, מאנגלית לספרדית.

ברור אם כן, שבמסגרת תהליך זה הופך התרגום למעורפל עוד יותר. ערפול זה אף ממחיש ביתר שאת את אינסופיותה הממשית של השפה ואת הניסיונות הקלושים לבצע תרגום מדויק באמצעות שימוש במכונה מתוחכמת דוגמת גוגל טרנסלייט (ותוכנות דומות לה) אשר, חרף בסיס הנתונים 'הכמעט אינסופי' של תרגומים ידי בני אדם שיש לגוגל גישה אליו – השימוש בה עודנו שקול להטלת מטבע.

מהיכן שואב גוגל טרנסלייט את מאגר יחידות התרגום הללו?

ובכן – בעיקרון, מאתנו. אנחנו 'משלמים' במידע על זכות השימוש בשירות החינמי של גוגל. אפשר שהדבר נעשה מרצון, למשל כאשר אנו מעלים לרשת את כל מסמכי החקיקה של האיחוד האירופאי על שלל השפות המדוברות בו (משמע, מסמכים מתורגמים בהיקף נרחב), וניתן גם למסרו באופן לא מכוון (כפי שנראה להלן).

אם נעיין בתנאי השימוש של גוגל טרנסלייט, נמצא כי תנאים אלה קובעים כי: "כאשר אתה מעלה או יוצר את התוכן שלך דרך השירות, אתה מעניק לגוגל זכות להשתמש בתוכן שלך...", אולם ישנו סייג הקובע כי "... גוגל לא תחשוף את נושא התוכן שלך או תעניק גישה לתוכן שלך על בסיס עצמאי לכל צד שלישי ללא הסכמתך".

למה כוונתה של גוגל בביטוי "על בסיס עצמאי..."? את התשובה לכך ניתן למצוא מיד בהמשך המסמך, לפיו: "אם גוגל תציג את התוכן שלך למשתמש קצה, היא תעשה כן אך ורק לפי כללי השיתוף להלן, ורק על בסיס יחידת תרגום". המונח 'יחידת תרגום' – המבואר לעיל – מוגדר בתנאים של גוגל טרנסלייט לפי המשמעות הניתנת לו ב"סטנדרט ה-XLIFFהנ"ל".

כך לדוגמה, הביטוי "החתול ישב על השטיח" מהווה יחידת תרגום. הביטוי "החתול ישב על השטיח. החתול ראה טלוויזיה", יהווה שתי יחידות תרגום, שבמקרה זה מפרידה ביניהן נקודה. "החתול ישב על השטיח, בזמן שראה טלוויזיה" יהווה אף הוא יחידת תרגום אחת, אולם "בזמן שישב על השטיח, החתול ראה: טלוויזיה" ככל הנראה יהווה שתי יחידות תרגום המופרדות בנקודתיים.

לפי תפיסתי, מדובר למעשה במה שניתן לכנות כ"אפקט המגרסה". הרשו לי להסביר:

אף על פי שניתן להזין לגוגל טרנסלייט מסמך שלם לתרגום (דוגמת הסכם), גוגל טרנסלייט לא ישמור את המסמך במתכונתו המלאה, אלא יחלק (או "יגרוס") את המסמך על יחידות התרגום הרבות שבו, ויאחסן את יחידות התרגום במאגר הנתונים שלו, בצורה 'גרוסה ומעורבבת'.

בתוכנת תרגום, זה עשוי להיראות בערך כך:

(יש לציין כי הטקסט שמוצג בתרשים לעיל המהווה חלק מתנאי הפרטיות העדכניים ביותר של גוגל ל-APIs (תכניות ממשק מיושם), עלול להיחשב כשלעצמו כפרצה משמעותית יותר להפרת סודיות בהשוואה לתנאים הספציפיים האמורים לשימוש בגוגל טרנסלייט (שהנו בעצמו תכנית ממשק מיושם).

כך למשל – אילו הייתי מזין את המאמר הזה בנוסחו המלא לגוגל טרנסלייט, וזאת בהנחה שלא קיים תרגום (אנושי) כלשהו של מסמך זה בגוגל טרנסלייט, היינו מוצאים כי משפטים רבים תורגמו באופן מעורפל ואחרים לא תורגמו כלל, ולעומת זאת, משפט נפוץ כמו "החתול ישב על השטיח" יתורגם במרבית המקרים במדויק.

יחד עם זאת – אם 'אשלח' לגוגל את המאמר בעברית ובאנגלית, ולאחר מכן אבקש לתרגם את אחד המשפטים (אשר מופיע במאמר) מעברית לאנגלית, ההתאמה שתתקבל תהיה מושלמת. כך למשל, תנאי השימוש של גוגל טרנסלייט הנזכרים לעיל, יתורגמו עם התאמות מושלמות, מאחר שהמידע, מן הסתם, כבר קיים בבסיס הנתונים של גוגל, לאחר שתורגם במקור על ידי גורם אנושי.

לכן, אף על פי שגוגל לא מציגה מסמך שנשלח אליה במלואו, היא תדע כיצד 'להרכיב מחדש' את המסמך ולהדביק את החלקים ש'נגרסו' יחדיו (משל הייתה אוליבר נורת').

מהו הסיכון אם כן אליו חשוף איש מקצוע אשר מזין את התוצרים שלו בגוגל טרנסלייט?

הסיכון עשוי להיות מזערי, מבחינה זו שפלוני עלול להיתקל על דרך מקרה בקטע או תרגום שהוזן לבסיס הנתונים של גוגל, שהנו חסוי ובר זיהוי כאחד. במילים אחרות, המשתמש מזהה את החומר החסוי. אולם – עד כמה סיכון מזערי זה הוא אכן בגדר האפשר?

השימוש הנרחב בנוסחים סטנדרטיים והשימוש הנרחב והמקובל באפשרות 'גזור והדבק', כאשר נערכים רק שינויים בסיסיים בטקסט, למשל שינויי שמות, הופך את הסיכוי להיתקל ביחידת תרגום מוכרת או בקטע סודי לפחות קלוש משחושבים.

נכון הדבר שבעתיים כאשר מדובר בתרגום מעברית, שאינה שגורה באופן יחסי בפי רוב.

הבה נביט בדוגמאות הבאות: עורך דין כלשהו עשוי לתרגם (בעזרת גוגל טרנסלייט), בין השאר, את המשפט הבא מתוך צוואה סודית:

"אני, גברת כהן, מורישה את כל רכושי עלי אדמות לילדי – ג'ון, ג'ורג', פול ופיטר."

לעומתו, עורך דינו של אדון כהן, שדבר צוואתה ה'סודית' של גב' כהן כלל לא הובא לידיעתו, מתרגם אף הוא את צוואתו של מר כהן בעזרת גוגל טרנסלייט ואולם, שלא כמו גברת כהן, מר כהן לא שכח את בת זוגו בצוואה וכתב את הדברים הבאים:

"אני, מר כהן, מוריש את כל רכושי עלי אדמות לילדי ג'ון, ג'ורג', פול ופיטר; ולאשתי, גברת כהן".

במקרה זה, לאור הדמיון הרב בין שני המשפטים בשפת המקור (לדוגמה – עברית), ישנו סיכוי שהתרגום המעורפל שיתקבל לטקסט של מר כהן יהיה תרגום צוואתה של גב' כהן –בה היא שכחה להזכיר את בעלה!

כמו כן, ראוי לציין שעצם העברת המידע לצד שלישי שאינו מורשה (במקרה זה גוגל), במלואו או בחלקו, ללא הסכמת הלקוח/המטופל/מוסר המידע, עלולה כשלעצמה להוות הפרה של הסודיות כאמור, בהתעלם מהשאלה האם כל חלק במסמך האמור עשוי 'לקפוץ' בעתיד בחיפוש כלשהו. אם ננסח זאת במונחים פשוטים – 'כשזה יוצא זה בחוץ לנצח'. במילים אחרות – כשהמידע מוזן לרשת האינטרנט בכל צורה שהיא, לנותן המידע אין שליטה עליו.

האיום מודגש ביתר שאת כאשר מתרגמים רבים משתמשים בתוכנות זיכרון תרגומי עם בסיסי זיכרון ציבוריים, ולעתים קרובות נעזרים בגוגל טרנסלייט עצמו כגיבוי. כתוצאה מכך, אפילו במקרה שבו איש מקצוע שולח למתרגם עבודה בתום לב, מבלי לבצע הפרה (כצד שלישי מורשה), אותו מתרגם עלול לגלות חוסר אחריות ולהשתמש בבסיס נתונים ציבורי ולהפיץ את המידע בציבור ובכך לסכן את איש המקצוע שכלל אינו מודע (בעקיפין) לעצם הפרת סודיות / חיסיון.

סיכום

בעולם של פתיחות רבה באמצעות אתרים כמו Wikileaks, גוגל ודומיהם ישנו עדיין צורך לשמור על סודיות ובין היתר חסיון עורך דין לקוח. שימוש בגוגל טרנסלייט הפופלרי עלול לסכן את החובה לשמור על סודיות זו.

בניגוד לתוכנת תרגום בעבר אשר ניסו "לפענח" את השפות דרך ניתוח הדקדוק וכו', גוגל טרנסלייט עושה שימוש במאגר הנתונים העצום שלו בנסיון להביא משפט דומה אשר כבר תורגם בעבר. מסיבה זו – חוסר היציבות באיכות התרגום.

אמנם שימוש בגוגל טרנסלייט הינו חינם כסף אך ישנו "תשלום" באמצעות מסירת המידע לגוגל טרנסלייט. תנאי השימוש של גוגל טרנסלייט מאפשרים לגוגל לעשות שימוש במידע שנמסר להם, אומנם בצורה "גרוסה" – כלומר, לא את המסמך כולו אלא החלקים או "סגמנטים" אשר בו. האם מסירת המידע בצורה "גרוסה" מהווה הפרה של חובת שמירה על סודיות, כולל חובת חיסיון עורך דין לקוח.

* המחבר הינו עו"ד העוסק בתרגום משפטי ועבודות נוטריוניות. בעל תואר בשפות (BA) ותואר במשפטים (LlB) מיהוסנבורג, דרום אפריקה.

** כל המוצג במאמר זה הינו מידע כללי בלבד ואין בו כדי להוות יעוץ ו/או חוות דעת משפטית כלשהי. המחבר ו/או המערכת אינם נושאים באחריות כלשהי כלפי הקוראים ואלה נדרשים לקבל עצה מקצועית לפני כל פעולה המסתמכת על הדברים האמורים.

David Bellos, Is That A Fish in Your Ear? – Translation and the Meaning of Everything (Faber & Faber, New York, Kindle Edition, 2012.)

שאל את המשפטן
יעוץ אישי שלח את שאלתך ועורך דין יחזור אליך
* *   
   *
קוד אבטחה
נא להקיש קוד אבטחה*
  


תגובות

הוסף תגובה
אין תגובות
שירותים משפטיים





חיפוש עורך דין לפי עיר :
ערים נוספות
ערים נוספות
ערים נוספות









כתבות נוספות

כל הזכויות שמורות לפסקדין - אתר המשפט הישראלי הוקם ע"י מערכות מודרניות בע"מ