09301921680
طراحی سایت از ایده پردازی تا بازاریابی اینترنتی | نمونه کارها | قیمت طراحی سایت

ترجمه گوگل

در علم کامپیوتر مبحثی وجود دارد به نام ترجمه ماشینی. دانشمندان علم کامپیوتر به دنبال تولید برنامه‌هایی هستند که بتواند با کیفیتی معادل یک مترجم انسانی، متون را ترجمه کنند.

هیچ کس از آنها یادی نمی‌کند ولی به جرأت می‌توان گفت که مترجمان از افراد بسیار مؤثر تاریخ هستند. ترجمه آثار ادبی، علمی و فلسفی ملل دیگر سرآغاز تحولات عظیمی در تاریخ بوده‌اند. از جمله این موارد می‌توان به ترجمه آثار یونانیان باستان به زبان عربی و ترجمه آثار مسلمانان به زبان‌های اروپایی اشاره کرد. تا پیش از اختراع صنعت چاپ، تعداد آثار نوشتاری بسیار محدود بود و به طبع آن، تعداد مترجمین هم کم بود. اما انقلابی که صنعت چاپ به پا کرد، موجب شد که تعداد مترجمین به سرعت افزوده شود و افراد زیادی به یادگیری زبان‌های دیگر بپردازند تا جایی که وجود افراد دوزبانه به امری عادی بدل گردید و ترجمه تبدیل به یک رشته دانشگاهی شد.

می‌دانیم که امروزه کار از چاپ و نشر گذشته است و با انقلاب دیجیتال روبرو هستیم. کامپیوترها به تمامی زمینه‌های زندگی ما وارد شده‌اند و همه چیز را خودکار کرده‌اند. حال سؤال اینجاست که آیا کامپیوترها می‌توانند ترجمه هم بکنند؟ پاسخ به این سؤال مثبت است. در حال حاضر سایت‌های زیادی وجود دارند که عمل ترجمه را انجام می‌دهند. یکی از معروف‌ترین نمونه‌های آن، ترجمه گوگل است. سرویس ترجمه گوگل به آدرس translate.google.com یک سرویس رایگان است و برای استفاده از آن نیاز به ساخت اکانت هم نیست.

در این نوشتار قصد داریم نگاهی به سرویس ترجمه گوگل بیندازیم و ببینیم که عملکرد این سیستم ترجمه چگونه است و در آینده به چه شکل خواهد بود.

ترجمه گوگل چگونه کار می‌کند؟

در علم کامپیوتر مبحثی وجود دارد به نام ترجمه ماشینی یا Machine Translation. دانشمندان علم کامپیوتر به دنبال تولید برنامه‌هایی هستند که بتواند با کیفیتی معادل یک مترجم انسانی، متون را ترجمه کنند. تلاش‌های دانشمندان موجب به وجود آمدن چندین روش برای ترجمه ماشینی شده است:

1. روش مستقیم

در روش مستقیم، ماشین کلمه به کلمه بر روی متن مبدأ حرکت کرده و هر کلمه را به کلمه معادل در زبان مقصد ترجمه می‌کند. ایده اصلی این روش اینست که متن مبدأ به صورت تدریجی به متن مقصد ترجمه شود. این روش دیگر مورد استفاده قرار نمی‌گیرد زیرا کیفیت ترجمه در این روش بسیار پایین است ولی ایده آن پایه و اساس سایر روش‌های ترجمه را تشکیل می‌دهد.

2. روش انتقالی

زبان‌ها علاوه بر تفاوت در کلمات، در ساختارهای نحوی هم با یکدیگر متفاوتند. در روش انتقالی به این تفاوت توجه می‌شود و ساختار جمله مبدأ به ساختار زبان مقصد تبدیل می‌گردد. روش‌های انتقالی غالباً سه مرحله دارند: مرحله تحلیل، مرحله انتقال و مرحله تولید.

پس از اینکه درخت اشتقاق جمله مبدأ به دست آمد، از قوانین انتقالی نحوی و لغوی استفاده می‌شود. قوانین نحوی درخت اشتقاق زبان مبدأ را به درخت اشتقاق زبان مقصد تبدیل می‌کنند. قوانین انتقال لغوی همانند روش مستقیم کلمات را به زبان مقصد ترجمه می‌کنند.

در برخی موارد از ترکیب دو روش مستقیم و انتقالی استفاده می‌شود. به عنوان مثال روش ارائه شده در سیسترن، شامل مراحل زیر است:

– تحلیل

  • تحلیل ریخت‌شناسی و تعیین نقش دستوری لغات
  • خرد کردن عبارات اسمی و فعلی
  • ایجاد درخت اشتقاق با استفاده از روش وابستگی

– انتقال

  • ترجمه اصطلاحات
  • رفع ابهام لغات
  • تخصیص پیشوندهای مناسب به افعال

– تولید

  • استفاده از دیکشنری غنی شده دو زبانه که در آن اطلاعات نحوی هم گنجانده شده است.
  • اصلاح ترتیب لغات
  • تولید ریخت‌های صحیح

این روش همانند روش مستقیم، به دیکشنری دوزبانه وابسته است. دیکشنری که در این روش استفاده می‌شود حاوی اطلاعات نحوی و معنایی هم می‌باشد. شباهت دیگر این روش به روش مستقیم، در تصحیح ترتیب لغات در مرحله پیش‌پردازش است. از طرف دیگر در تمامی مراحل روش سیسترن، همانند روش انتقالی، اطلاعات نحوی گنجانده شده است.

3. روش زبان میانی

اشکال روش انتقالی اینست که برای هر جفت زبان، نیازمند یک مجموعه جدا از قوانین انتقال نحوی هستیم. در شرایطی که نیاز به ترجمه بین زبان‌های مختلف باشد، استفاده از این روش چندان بهینه نیست. ایده روش زبان میانی اینست که به جای ترجمه کلمه به کلمه، ابتدا مفهوم جملات زبان مبدأ استخراج شده و در قالبی مشخص ریخته شود. به این قالب مشخص، زبان میانی می‌گویند. در مرحله بعد مفاهیم از زبان میانی به زبان مقصد ترجمه می‌شوند.

چالش اصلی در این روش استخراج مفاهیم و انتخاب شیوه صحیح نمایش آنهاست. یعنی باید زبان میانی به درستی انتخاب شود. به همین دلیل روش زبان میانی از دو روش قبلی تحلیل بیشتری نیاز دارد. این روش ایراداتی هم دارد. به عنوان مثال زمانی که دو زبان شبیه به یکدیگر بوده و مفاهیم مشترک زیادی داشته باشند، تبدیلات غیرضروری فراوانی انجام می‌شود. هم‌چنین این روش تنها در حوزه‌هایی که آنتولوژی پیچیده‌ای ندارند قابل استفاده است. مانند رزرو هتل، پیشنهاد رستوران و غیره.

4. ترجمه ماشینی آماری

ترجمه ماشینی آماری بهترین روش ترجمه ماشینی است که ارائه شده است. در این روش دو دسته متن وجود دارد. دسته اول به زبان مبدأ و دسته دوم به زبان مقصد. این مجموعه در اختیار کامپیوتر است. هر گاه کامپیوتر بخواهد متن جدیدی را ترجمه کند، کل متونی که ترجمه آنها را دارد را جستجو کرده و سعی می‌کند عباراتی مشابه با عباراتی که در متن جدید هست را بیابد. بدین ترتیب با بررسی دفعات تکرار هر ترجمه و قوانین آمار و احتمالات، بهترین معادل را برای هر عبارت یا جمله می‌یابد. مشخص است که هر چقدر متونی که به عنوان راهنما در اختیار کامپیوتر قرار دارد بیشتر باشند، نتیجه کار بهتر خواهد بود.

ترجمه گوگل

روش ترجمه گوگل کدام است؟

گوگل در سال 2006 سرویس ترجمه خود را راه‌اندازی کرد و از همان ابتدا، روش ترجمه آماری را برگزید. این یعنی که ترجمه گوگل هیچ درکی از دستور زبان مبدأ و مقصد ندارد. ترجمه گوگل در مجموعه متونی که در دسترسش است جستجو کرده و با قوانین آمار و احتمال، بهترین ترجمه را برای هر عبارت یا جمله می‌یابد. مثلاً فرض کنید عبارت I want to go to the bank to get some money را به ترجمه گوگل داده‌اید. کلمه bank در زبان انگلیسی دو معنا دارد. یکی ساحل رودخانه و دیگری بانکی که در آن پول می‌ریزید. در اینجا ترجمه گوگل با جستجو در متونی که در اختیارش است، در می‌یابد که هر گاه کلمه bank با money همراه باشد، به احتمال زیاد باید بانک ترجمه شود و نه ساحل رودخانه. بدین ترتیب ترجمه صحیح را انجام می‌دهد.

حتماً سؤال می‌پرسید که چه متونی در اختیار ترجمه گوگل است؟ رئیس سابق بخش ترجمه گوگل بیان می‌کند که برای اینکه یک مترجم آماری خوب داشته باشیم، باید دو مجموعه متن با 150 تا 200 میلیون کلمه است که یک مجموعه باید ترجمه مجموعه دیگر باشد. گوگل این متون را از سازمان ملل گرفته است. سازمان ملل تمامی بیانیه‌ها و اسناد مهم خود را به شش زبان منتشر می‌کند. این اسناد و مدارک پایه و منبع مترجم آماری گوگل هستند. به همین دلیل است که کیفیت ترجمه گوگل بین زبان‌های اروپایی بسیار بالاست.

نکته جالب دیگر اینکه ترجمه گوگل در بیشتر موارد مستقیماً عمل ترجمه را انجام نمی‌دهد، بلکه ابتدا متن را از زبان مبدأ به انگلیسی ترجمه کرده و سپس آن را به زبان مقصد ترجمه می‌کند.

چرا ترجمه گوگل مثل مترجم انسانی نمی‌شود؟

این سؤالی که در ذهن خیلی از افراد وجود دارد. چرا ترجمه گوگل اینقدر بد است و خیلی از اوقات پرت و پلا تحویل می‌دهد؟ اگر مطالب را بالا را مطالعه کرده باشید، جواب این سؤال را خواهید یافت. حقیقت اینست که ترجمه گوگل هیچ درکی از متن ندارد. مفهوم کلی را درک نمی‌کند. تنها کاری که این مترجم انجام می‌دهد، جستجو در یک سری متون ترجمه شده است. ترجمه گوگل در تمام متونی که در اختیارش است می‌گردد و با بررسی موارد بسیار زیادی، نزدیک‌ترین ترجمه برای متن ورودی شما را پیدا می‌کند. البته این جستجو هم با کمک الگوریتم‌های پیچیده‌ای انجام می‌شود و به هیچ عنوان کار راحتی نیست ولی به هر حال ترجمه گوگل درکی از مفهوم متن ندارد.

این در حالی است که یک مترجم انسانی خوب ابتدا متن را می‌خواند، درک می‌کند و سپس نزدیک‌ترین کلمات و جملات زبان مقصد را برای ترجمه برمی‌گزیند. بسیاری از دانشمندان علم کامپیوتر معتقدند تا زمانی که مسأله فهم زبان برای کامپیوترها حل نشود، امکان دستیابی به ترجمه ماشینی با کیفیت وجود ندارد و باید به همین ترجمه‌های کلی و درهم بسنده کرد.

اما یک خبر خوب هم داریم. در سپتامبر 2016، تیم ترجمه گوگل اعلام کردند که روش جدیدی برای ترجمه ماشینی ابداع کرده‌اند که می‌تواند با کیفیت بالاتری متون را ترجمه کند. اگر پیگیر اخبار فناوری باشید، حتماً می‌دانید که گوگل مدتی است چندین پروژه موفق در زمینه هوش مصنوعی به راه انداخته است. نمونه مشهور و پر سر و صدای آن، هوش مصنوعی بود که قهرمان بازی GO را شکست داد.

پایه همه‌ی این پروژه‌ها، فناوری است به نام یادگیری عمیق. توضیحات فنی این فناوری از حوصله این مقاله بیرون است و نیازمند دانش زیادی در زمینه هوش مصنوعی و شبکه‌های عصبی است. فقط در همین حد بدانید که این فناوری می‌تواند سطوح بالایی از انتزاع را درک کند. یعنی چه؟ یعنی اینکه اگر یک عکس را به هوش مصنوعی گوگل بدهید. ابتدا نقاط را شناسایی می‌کند. سپس خطوط را درک می‌کند، سپس اشکال هندسی ساده را می‌یابد. با قرار دادن اشکال هندسی ساده به اشکال پیچیده می‌رسد و در نهایت کل یک تصویر را درک می‌کند.

آینده ترجمه گوگل در دست همین فناوری است. امید است که این فناوری بتواند مفهوم عبارات، جملات یا حتی پاراگراف‌ها را هم درک کند. در این سیستم هم ابتدا کامپیوتر میلیون‌ها متن ترجمه شده را بررسی می‌کند. در این بررسی به صورت خودکار فن ترجمه و مفهوم جملات را در می‌یابد و در نهایت کل یک جمله را ترجمه می‌کند.

این سیستم جدید در حال حاضر ترجمه بین انگلیسی و زبان‌های اسپانیایی، فرانسوی و چینی را انجام می‌دهد. افرادی که به هر دوی این زبان‌ها مسلط بوده‌اند، عملکرد سیستم جدید ترجمه گوگل را ارزیابی کرده و در بسیاری از موارد آن را معادل با مترجم انسانی دانسته‌اند.

کلام آخر

هنر و فن ترجمه در طول تاریخ پل میان تمدن‌ها بوده است. کاری که یک سیستم ترجمه ماشینی خوب با تمدن بشر می‌کند، فراتر از هر تصور است. به این بیاندیشید که هر مقاله علمی و صفحه اینترنتی را بتوانید به زبان فارسی روان بخوانید و هر فیلمی را زیرنویس فارسی ببینید. امید است که فناوری جدید ترجمه گوگل بتواند شروعی برای قدم نهادن در این راه باشد.

2 اسفند 1395

دیدگاه های این مقاله