本站小編為你精心準備了談機器翻譯和計算機輔助翻譯參考范文,愿這些范文能點燃您思維的火花,激發您的寫作靈感。歡迎深入閱讀并收藏。
摘要:本文簡要分析了翻譯技術在現代生活不同領域的重要性,介紹了機器翻譯和計算機輔助翻譯的歷史,探討了計算機輔助翻譯中使用的主要工具及新技術對專業翻譯的影響,旨在使譯者認識到機器翻譯及計算機輔助翻譯在翻譯過程中不可忽視的作用,提高新技術的應用能力,不斷提升翻譯的高效性和競爭力。
關鍵詞:翻譯技術;機器翻譯;計算機輔助翻譯;翻譯策略
一、翻譯技術的需求
信息技術的進步與現代通信要求相結合,促進了翻譯自動化。技術和翻譯之間關系的歷史可以追溯到冷戰的開始,因為在20世紀50年代,美國和蘇聯在各個層面的競爭非常激烈,成千上萬的文件被從俄語翻譯成英語,反之亦然。然而,如此高的需求顯示了翻譯過程的低效,尤其是在專業知識領域,增加了人們對翻譯機器的興趣。盡管冷戰現在已經結束,盡管全球化具有重要意義,全球化往往會打破文化、經濟和語言障礙,但翻譯并沒有過時,因為各國都希望保持其獨立和文化特征,特別是通過自己的語言表達的獨立和文化特征。這一現象在歐洲聯盟內可以清楚地看到,在那里翻譯仍然是一項至關重要的活動。信息技術產生了一種屏幕文化,它傾向于取代打印文化,不再需要打印文檔,直接通過計算機訪問和傳遞信息。這些計算機文檔可以立即獲得,并且可以比印刷品更靈活地打開和處理,結果信息本身的狀態發生了變化,根據需要變成臨時的或永久的。在過去的二十年里,我們見證了信息技術的迅速發展,與此同時,隨著全球市場的發展,工商業比以往任何時候都在國際范圍內發揮作用,在產品和服務交換方面更加自由和靈活。翻譯的性質和功能也不可避免地受到這些變化的影響。各國需要在許多領域進行合作,如生態(綠色和平)、經濟(自由貿易協定)、人道主義(醫生無國界)和教育(交流方案)等。盡管英語很重要,但人們普遍認為,人們有權使用自己的語言,然而語言的多樣性不應成為相互理解的障礙。必須找到解決語言問題的辦法,以便讓信息自由流通,并促進雙邊和多邊關系。因此,現代生活的不同方面導致了對更有效翻譯方法的需求。
二、機器翻譯簡史
直到二十世紀,創建自動詞典的想法才作為語言障礙問題的解決方案出現。20世紀30年代,法國學者亞美尼亞喬治•阿特斯魯尼和俄羅斯學者彼得•斯米爾諾夫•特羅揚斯基獨立地為同一目標而努力。后者是兩者中更重要的一個,因為他提出了自動翻譯系統需要三個階段的觀點:首先,了解源語言的編輯分析單詞,并根據它們的句法功能將其轉換成基本形式;然后機器將基本形式組織成目標語言的等價序列;最后,這個粗略的版本被熟悉目標語言的第二個編輯器修正。盡管特羅揚斯基的工作意義重大,但直到20世紀50年代末,它仍然普遍不為人知。計算機的發明很快使人們試圖用它來翻譯自然語言。1947年3月,瓦倫•韋弗給計算機專家諾伯特•維納的一封信標志著這一進程的開始。兩年后,1949年7月,韋弗公布了他關于計算機應用于翻譯的想法,不久之后,美國的一些大學開始了機器翻譯領域的研究。1954年,第一次可行性試驗作為IBM和喬治敦大學的聯合項目進行。盡管規模非常有限,但這次示威被認為是成功的,促成美國和世界其他地區其他項目的融資。機器翻譯程序的第一個版本是基于詳細的雙語詞典,這些詞典為源語言中列出的每個單詞提供了許多目標語言中的等價單詞,以及一系列的詞序規則。任務的復雜性使得開發人員有必要繼續改進程序,因為需要更系統的語法焦點。項目基于語言學的進步,特別是轉換生成語法模型的發展,這似乎為機器翻譯提供了新的可能性。然而,最初的樂觀情緒很快消失了。研究人員開始認為語義障礙是不可逾越的,并且不再認為機器翻譯問題的解決方案近在咫尺。IBM和華盛頓大學生產了一種叫做馬克2號的操作系統,但是結果令人失望。到1964年,美國政府對機器翻譯程序的低效越來越擔心,以至于成立了自動語言處理咨詢委員會來評估它們。1966年,該委員會發表了一份高度批評性的報告,聲稱機器翻譯速度慢、效率低,而且成本是人類翻譯的兩倍,結論是不值得在這一領域投資研究。盡管如此,報告強調需要鼓勵開發有助于翻譯過程的工具。盡管ALPAC報告因缺乏客觀性和遠見而受到批評,但它導致美國對機器翻譯的研究凍結了十多年。然而,加拿大、法國和德國的研究仍在繼續,幾年后出現了兩個機器翻譯系統:歐洲聯盟委員會使用的Systran和蒙特利爾大學創建的Taum-météo,用于將天氣預報從法語翻譯成英語。1980年代取得了重大進展。多語種社區的行政和商業需求刺激了對翻譯的需求,導致法國、德國、加拿大和日本等國開發了新的機器翻譯系統。研究在20世紀80年代也恢復了,因為大規模訪問個人電腦和文字處理程序為較便宜的機器翻譯系統創造了市場。20世紀90年代初,機器翻譯取得了重大發展,從基于語法規則的翻譯策略徹底轉變為基于大量文本和例子的翻譯策略(例如逆向計劃)。語言不再被視為受固定規則支配的靜態實體,而是一個根據使用和用戶而變化的動態語料庫,隨著時間演變并適應社會和文化現實。直到今天,機器翻譯仍在繼續發展。大公司現在越來越多地使用它,這也增加了對公眾的軟件銷售。這種情況導致了在線機器翻譯服務的產生。以及多語言詞典、百科全書和免費、直接訪問的術語數據庫的可用性。
三、機器翻譯策略
(一)直接策略直接策略是第一個用于機器翻譯系統的策略,涉及最少的語言學理論。這種方法基于預定義的源語言-目標語言二項式,其中源語言語法的每個單詞直接鏈接到目標語言中具有單向相關性的相應單元,例如從英語到西班牙語,而不是相反。這種方法最著名的代表是喬治敦大學創建的系統,該系統于1964年首次在俄語到英語的翻譯上進行測試。喬治敦大學的系統,像所有現有的系統一樣,是基于一個直接的方法,有很強的詞匯成分。形態分析機制高度發達,詞典極其復雜,但句法分析和消歧過程有限,因此文本需要人工翻譯的第二階段。
(二)轉移策略轉移戰略側重于“代表水平”的概念,包括三個階段。分析階段用語言描述源文檔,并使用源語言詞典。轉移階段轉換分析階段的結果,并建立兩種語言之間的語言和結構對等。它使用從源語言到目標語言的雙語詞典。生成階段借助于目標語言詞典基于源語言的語言數據生成目標語言的文檔。
(三)中樞語言策略中樞語言策略是基于獨立于任何特定語言創建文本表示的思想。這種表達作為一個中性的、通用的中心軸,不同于源語言和目標語言。理論上,這種方法將機器翻譯過程簡化為兩個階段:分析和生成。對源文本的分析產生了一個概念表示,其不同的組成部分由生成模塊與目標語言中的對應部分相匹配。對這一策略的研究涉及到人工智能和知識的表示。基于中樞語言思想的系統旨不在直接翻譯,而是從基本信息中重構源文本。目前,機器翻譯領域對遷移和中樞語言策略的研究最多。
四、計算機輔助翻譯
在實踐中,計算機輔助翻譯是一個復雜的過程,涉及適應譯者需要的特定工具和技術,譯者參與整個過程,而不僅僅是編輯階段。計算機變成了一個工作站,譯者可以在這里訪問各種文本、工具和程序:例如,單語和雙語詞典、平行文本、各種源語言和目標語言的翻譯文本以及術語數據庫。每個翻譯都可以創造一個個人的工作環境,并根據具體任務的需要進行轉換。因此,計算機輔助翻譯為譯者提供了現場的靈活性和行動自由,同時還能立即獲得最新信息,以便節省大量時間。以下是翻譯工作中最重要的計算機輔助工具,從最基本的到最復雜的:
(一)電子詞典、詞匯表和術語數據庫在電腦上查閱電子或數字詞典起初看起來與使用紙質詞典沒有什么根本不同。然而,優勢很快變得明顯。在電腦上輸入一個單詞并得到答案所花的時間要比翻看紙質詞典少得多;通過鏈接可以立即訪問相關數據;并且通過處理多個文檔,可以同時使用多個詞典。電子詞典有幾種形式:可以安裝在計算機上的軟件;作為光盤,最重要的是通過互聯網。例如,搜索引擎谷歌讓我們可以使用多種語言的各種單語和雙語詞典,盡管有時有必要成為在線用戶,比如牛津英語詞典。在線詞典從它們的語料庫中為我們組織材料,因為它們不僅僅是孤立的單詞集合。例如,我們可以要求與一個關鍵字相關的所有單詞,或者來自特定語言的所有單詞。也就是說,它們允許即時交叉訪問信息。互聯網上有各種各樣的詞典、詞匯表和數據庫,可以幫助了解具體的術語。
(二)索引計算機并不取代字典和詞匯表等工具,而是為翻譯提供了一種額外的文本處理方法。它們是文字處理程序,在一個已定義的語料庫中產生一串字母的所有出現的列表,目的是建立不清楚的模式。這些字母可以構成單詞的一部分,例如前綴或后綴,或者完整的單詞,或者一組單詞。一致性的具體功能包括給出關于詞或命題數量的統計數據,對詞進行分類等。就頻率或字母順序而言,最重要的可能是,確定單詞出現的確切上下文。隨著越來越多的文本被翻譯,信息可以被積累和存儲,產生一個隨時可以以非順序方式查閱的數據庫。索引對于翻譯具有固定詞匯和表達的專業文本特別有價值,這些詞匯和表達具有明確的含義。它們確保了術語的一致性,為譯者提供了對文本的更多控制,而不考慮文本的長度和復雜性。然而,它們對文學翻譯者來說并沒有多大幫助,因為文學翻譯者經常面臨與語言的多義性和隱喻性使用有關的問題。盡管如此,一些文學翻譯家還是使用協和語,因為它們在各種翻譯中都有潛在的作用。
(三)在線雙語文本雙語語料庫通常由源文本及其翻譯組成,以前是由人類譯者完成的。這種以電子方式存儲的文檔稱為雙文本。它通過為固定表達式提供現成的解決方案來方便以后的翻譯,從而自動化了部分過程。翻譯市場的增長導致公司和國際組織對以不同語言系統存儲并可立即查閱的文本或語料庫的興趣增加。
(四)翻譯記憶翻譯記憶是在線雙語文本最重要的應用之一,可以追溯到20世紀80年代初,當時的阿爾卑斯山(ALPS)的TSS系統處于領先地位。這在90年代初被翻譯經理、翻譯工作臺、優化器、情欲亂碼、特拉多斯和歐朗等項目所成功。在最簡單的形式中,翻譯記憶庫是一個數據庫,譯者在其中存儲翻譯以備將來重復使用,無論是在同一文本中還是在其他文本中。該程序基本上記錄雙語對:一個源語言段(通常是一個句子)和一個目標語言段。如果后來出現了相同或相似的源語言段,翻譯記憶程序將找到先前翻譯的段,并自動將其推薦給新的翻譯。譯者可以自由地接受它而不做任何修改,或者編輯它以適應當前的上下文,或者完全拒絕它。大多數程序不僅能找到完全匹配的片段,還能找到部分匹配的片段。
五、結論
機器翻譯和計算機輔助翻譯能否將譯者轉變成純粹的編輯,使他們不如計算機程序重要,這一直是一個熱議的話題。對這種情況的擔心導致了譯者對新技術的某種程度上的拒絕,這不僅是因為可能失去工作和專業聲望,也是因為擔心生產質量下降。一些翻譯者完全拒絕機器翻譯,因為他們把機器翻譯與這樣一種觀點聯系起來,即基于對投資和利潤的計算,翻譯僅僅是一種更有市場價值的產品。他們把翻譯定義為一門藝術,它有自己的審美標準,與利潤和損失無關,而是與創造力和想象力有關。然而,這主要適用于特定類型的翻譯。即使對于其他類型的文本,我們對機器翻譯和計算機輔助翻譯的角色和能力的分析表明,兩者都不夠高效和準確,不足以消除對人工翻譯的需求。事實上,所謂的機器翻譯也被更準確地描述為計算機輔助翻譯。譯者應該認識到并學會利用新技術的潛力,幫助他們更嚴格、更一致、更高效,而不感到受到威脅。有些人問新技術是否創造了一個新的職業。可以說,通過信息技術為譯者提供的資源意味著譯者與文本之間關系的改變,也就是說,一種新的翻譯方式,但這并不意味著結果是一種新的職業。然而,顯然有新能力的發展,這導致我們指出當前局勢的一些基本方面。借助計算機進行翻譯絕對不同于只在紙上工作和使用紙質產品,例如傳統的詞典,因為計算機工具為我們提供了一種與文本的關系,這種關系比純粹的線性閱讀要靈活得多。
【參考文獻】
[1]張翠吉.計算機對人類語言的影響[J].淄博師專論叢,2019(1):28-32.
[2]方明之.自然語言處理技術發展與未來[J].科技傳播,2019,11(6):143-144.
[3]劉波.計算機搜索引擎智能化技術探析[J].現代信息科技,2019,3(5):102-104.
作者:袁美琳 單位:大連海洋大學