阿里國際 Marco 翻譯大模型發(fā)布 支持多種主流語言
10月16日,阿里國際 AI 團(tuán)隊(duì) AIDC-AI 宣布,最新研發(fā)的多語言翻譯大模型 Marco 正式上線,支持包括中文、英語、日語、韓語、西班牙語、法語在內(nèi)的 15 種全球主流語言。Marco 以其高效準(zhǔn)確的翻譯性能,迅速引發(fā)行業(yè)關(guān)注。
根據(jù)官方消息,Marco 采用了 FLORES 等開源評測數(shù)據(jù)集進(jìn)行訓(xùn)練,并在 BLEU 評測指標(biāo)上超過了目前市面上的標(biāo)桿翻譯產(chǎn)品,如 Google 翻譯、DeepL 和 GPT-4。這一成果表明,Marco 在處理復(fù)雜語境和多語言翻譯時,展現(xiàn)出了更高的準(zhǔn)確性和自然度。
例如,常見的翻譯誤差“Your baby is on the way”被準(zhǔn)確調(diào)整為更符合語境的表達(dá)。此外,像“尊嘟喜歡”這樣具有互聯(lián)網(wǎng)文化背景的表達(dá),Marco 也能夠自然地翻譯為“I really like it”,避免了機(jī)械翻譯的問題。
Marco 通過多語種混合語料甄別、多維度數(shù)據(jù)質(zhì)量評估等技術(shù),確保不同語言間的翻譯質(zhì)量得到提升,同時保持主導(dǎo)語言(如中、英)性能的穩(wěn)定。對于個人用戶,Marco 可以根據(jù)不同的需求提供高質(zhì)量、上下文精準(zhǔn)的翻譯,并支持多樣化的翻譯風(fēng)格,滿足日益增長的個性化翻譯需求。