速来体验!基于有道子曰的翻译大模型2.0正式上线

自2022年11月30日ChatGPT问世,大语言模型在全球掀起热潮,众多高校、科研机构及AI企业纷纷投身其中,探索其在各行业的应用潜力与创新模式。

作为国内机器翻译领域深耕多年的技术团队,我们曾率先成功推出统计机器翻译及神经网络机器翻译服务,并持续迭代。
1、凭借丰富的业务生态与深厚的技术积累,2023年伊始,有道迅速开启以“应用落地” 为导向的翻译大模型自研之路。
2、经过持续的技术攻关和优化迭代,2023年6月,“子曰翻译大模型1.0”正式推出;
3、2024年5月,实现“子曰翻译大模型1.5”上线部署,至今已过去七个月。期间有道翻译的用户们积极使用我们的服务,并且慷慨地分享了众多极具价值的反馈与建议。

如今,子曰翻译大模型2.0已正式与大家见面,这象征着我们在语言翻译技术的征途上又迈出了坚实而重要的一步,相信能够为我们的用户带来更加出色的翻译体验。

从1.5到2.0, 质的飞跃

整体性能上,子曰翻译大模型 2.0 相较于1.5版本实现了质的飞跃。这背后,是我们从数据、算法以及评估三个关键维度所展开的深入探索与系统性升级。

在数据层面,为训练面向翻译任务的基座模型,我们精心收集了并严格清洗了数千万高质量的翻译数据。不仅确保了数据的准确性与适配性,为模型训练打下了牢固的根基,更极大地丰富了数据资源库,让模型在多样化翻译场景中游刃有余。此外,我们基于海量的翻译提示进行了精细化的人工标注,有效地提升了数据标注的质量,为模型执行翻译任务提供了精准的指导。

在算法层面,以子曰教育大模型为基础,我们进行了二次预训练,成功打造出了更具专业性与针对性的翻译基座大模型,显著提升了翻译性能。这其中,我们运用了先进的大模型蒸馏技术,让模型在精简参数的同时,运行效率与推理速度大幅提升;创新性地使用了大模型融合技术,将多个模型优势进行整合,进一步增强了翻译的准确性与稳定性;我们还实现了基于人类偏好的翻译数据自动获取,并以此进行强化学习;通过引入Online DPO技术,动态调整模型生成策略,保证了译文的质量与流畅度的提升。此外,多任务联合学习的开展,让模型能够在多个翻译任务中协同进步,综合翻译能力得到了显著增强。

在评估层面,我们人工标注了覆盖各个领域的开发集和盲测集,严格确保了测试数据的全面性和代表性。我们对算法团队所使用的开发集和盲测数据集实行严格分离、相互独立,以确保评估的客观性与准确性,模型最终效果以盲测集效果为准。在自动指标评估上,除了基于comet的自动化指标,我们还自主训练了超越comet准确率的基于大模型的翻译评估模型,为性能评估提供更可靠依据。同时,我们设计并执行了更完善的人工评估方案,从多维度对模型的翻译结果进行细致地分析和评价。

正是通过这三个层面的全方位优化与升级,子曰翻译大模型2.0在翻译质量、效率以及鲁棒性等方面实现了质的飞跃,能够为用户带来更优质、精准的翻译服务。

性能远超国内外通用大模型及专用翻译模型

为了展示子曰翻译大模型 2.0 的性能,我们在WMT以及Flores200的测试集上进行了中英互译的基准测试。
微信图片_20250114103215
微信图片_20250114104558
(采用测试集测试的结果)

为精准、客观地评估子曰翻译大模型2.0中英互译能力在行业中的表现,我们与多个国内外领先通用大模型及专业翻译器如DeepL Pro,进行了人工评估对比。

通过严谨的人工采集流程,我们构建了涵盖人文学科、商学、生活服务、医疗、科学等多个领域的数据样本集,并制定了全面精细的MQM评测方案,从专业性、准确性、语言惯例和风格等维度打分。

最终,五位资深翻译专家独立评估的结果汇总如下:

微信图片_20250114104606

以上对比,凸显了子曰翻译大模型2.0在专有闭源模型中的竞争优势——在翻译准确性和流畅度上,远优于国内外通用大模型及专用翻译模型。

该测试不仅客观地呈现了我们的优势,也精准地指明了未来有待优化和改进的方向,坚定了我们在机器翻译领域持续推进改进与创新的决心。

但我们深知仍面临诸多挑战,在后续的工作中,我们将全力去推进支持更长文本输入、拓展更多模态的输入,以及增加更多语种的支持工作,我们期待在不久之后下一代子曰翻译大模型能跟大家见面。

在此欢迎各位持续关注更多有道AI技术的进展与突破,也诚邀大家前来体验“子曰翻译大模型 2.0”,期待您的反馈。

附:可体验入口

1、有道词典APP-首页入口

微信图片_20250114104613

2、有道翻译桌面版-首页入口

微信图片_20250114104621

3、有道翻译网页端-AI翻译入口

微信图片_20250114104626

阅读全文
智心顾问:为心智障碍家庭带来温暖与专业支持

关爱从心开始 —— 理解心智障碍

在这个世界上,有这样一群特殊的群体——心智障碍者。他们通常伴随着个体认知、社会互动和学习能力的障碍。这些障碍可能源于遗传、环境或未知因素,但不应成为他们照护者获得信息和支持的阻碍。心智障碍者的家庭是更需要提供帮助的群体。从小家到大家: 让心智障碍者家庭不孤单、不绝望!

用心倾听,用爱解答 —— "智心顾问"为心智障碍者提供专业咨询服务

通常心智障碍者获得帮助的渠道比较有限,一些机构的资源和能力又不太足够。"智心顾问"是一个温暖的平台,专为解答心智障碍群体有关的问题,旨在以温柔、简明的方式,搭建起理解与支持的桥梁。无论是解决日常照护的困惑,还是寻求专业教育的建议,只需轻敲键盘,“智心顾问”便能即时提供量身定制的答案。

心智1xin

连接你我,解答疑惑 —— 以QAnything为技术支撑提供更智能的服务

QAnything为“智心顾问”提供了底层技术支撑,将各种心智障碍者家庭支持资源手册、收集的网址服务链接通通喂给它,QAnything都可以消化并转化为知识,提供专业精准的问答服务。QAnything不仅有领先的RAG引擎,而且简单易用,几步操作即可完成专属bot的搭建,同时支持发布分享,为更多人提供帮助和支持。

心智2xin

欢迎体验 —— 让爱传递

我们诚邀您体验“智心顾问”,无论您是心智障碍者的家庭成员、教育工作者还是社会支持者,您都可以参与体验,相信在体验的过程中您也会对心智障碍者产生更多的包容和理解。您可以通过点击网址链接或扫描二维码来参与,如果喜欢,请您点一个赞,同时请您参加我们的满意度调查,真诚欢迎您的使用。

网址:https://ai.youdao.com/saas/qanything/#/bots/C9FAF5FC1824461C/share

二维码:

微信图片_20231110190256

阅读全文
网易有道上线“易魔声” 开源语音合成引擎 用户可免费下载使用

刚刚,我们上线了「易魔声」开源语音合成(TTS)引擎!

「易魔声」,是一款有道自研TTS引擎,目前支持中英文双语,包含2000多种不同的音色,更有特色的情感合成功能,支持合成包含快乐、兴奋、悲伤、愤怒等广泛情感的语音。

「易魔声」中文 网易有道 17秒

(我们用「易魔声」将以上这段话进行了技术合成,点击试听 )

用户可免费在开源社区GitHub进行下载使用
地址:https://github.com/netease-youdao/EmotiVoice

通过我们提供的web界面、及批量生成结果的脚本接口,轻松实现音色的情感合成与应用。

640
GitHub开源界面,点击红色字可跳转)

在你过往的回忆里,是不是也有一些特别的声音,比如:偶像的声音激励人心、妈妈的声音让我们一秒回忆起小时候……声音,作为语言维度的一种,总是蕴含着人类充沛的情感表达。而富有情感的合成语音,是能够为应用和内容增色的AI功能。

现在通过「易魔声」,简单通过在文本中加入情感的描述提示,开发者或者内容创作者就可以自由合成符合自己需求的带有情感的语音,比传统TTS更加自然逼真!

「易魔声」,是有道AI团队今年开发的一个项目。随着基于GAN等现代AI技术的语音能力越来越成熟,实现一个质量较高的TTS系统的门槛越来越低。但即使如此,中英双语的高质量、现代TTS模块还是不容易找到,要在自己的应用与内容中加入高逼真度且高度可控的语音,特别是中英双语的语音,依然比较麻烦。

这也是我们将这个项目开源的初衷,希望能帮助有需求的开发者与内容创作者,并不断扩大高质量TTS的应用范围。目前该项目还处于初期阶段,期待大家在开源网站给予我们更多反馈,我们非常希望听到大家的使用体验与建议,欢迎各位进群交流~

微信图片_20231110171247

如果若二维码失效,可添加我们工作人员的企业微信申请进群~
微信图片_20231110190256

借此机会,我们也邀请您了解和探索有道的更多酷炫AI技术

  • 您可以尝试我们的声音定制和声音复刻功能(点击红字即可试用)。从用户录制到试听整个过程只需5分钟,即可完成个性化的声音定制。

  • 您也可以和Hi Echo虚拟人口语私教(点击红字即可跳转)聊一聊。通过有道的「子曰」教育大模型、语音和虚拟人技术,Echo可以陪你轻松练习地道的英语口语。每天练习10分钟,口语水平快速提高哦。

  • 您还可以微信搜索“有道智云体验中心”小程序。在这里,可以访问我们已经对开发者通过API等形式开放的文本和图像翻译、文字和各类图片识别、作文批改等各类AI技术。

关于有道智云

有道智云AI开放平台,是网易有道旗下一站式人工智能服务提供商,为开发者、企业和政府机构等提供自然语言翻译、文字识别、OCR、语音识别等服务以及行业解决方案,致力于提供安全、可靠和高效的云服务。

联系电话:010-8255-8901;商务合作:AIcloud_Business@corp.youdao.com.

想了解更多关于有道人工智能的内容,可访问“有道智云”官网https://ai.youdao.com.

阅读全文
测试在项目流程中的那些事儿

前言

测试作为整个项目中的一环,在项目流程中起着不可或缺的作用。部分团队是缺少项目管理角色的,这个时候,测试对项目流程的推进、项目质量的保证显得尤为重要。好的测试,能在整个项目流程中以QA角度做好项目管理和及时的风险预警,让项目如期上线且保障质量。业界一直强调测试前置,那么测试在项目中,如何根据项目情况做前置工作推进项目流程,让大家都开心工作呢?本文以自己所在的项目组为例讲述项目流程中的一些事,希望可以与大家一同探讨~

阅读全文
程序设计优化之管道数据流

摘要

计算机基础的同学估计对管道这个词都不陌生了,尤其是在Linux系统当中,管道操作符已经被广泛的使用,并给我们的变成带来了极大的便利。前端领域比较注明的脚手架“gulp”也是以其管道操作著称。
今天我们就来一步步抽丝剥茧,看看在前端领域的“管道数据流”要如何设计。

阅读全文
js几种网络请求方式梳理——摆脱回调地狱

摘要
本文介绍了基于 XMLHttpRequest、Promise、async/await 等三种异步网络请求的写法,其中async/await 写法允许我们以类似于同步的方式编写异步程序,摆脱繁琐的回调函数。

阅读全文
剖析react核心设计原理–异步执行调度

JS的执行通常在单线程的环境中,遇到比较耗时的代码时,我们首先想到的是将任务分割,让它能够被中断,同时在其他任务到来的时候让出执行权,当其他任务执行后,再从之前中断的部分开始异步执行剩下的计算。所以关键是实现一套异步可中断的方案。那么我们将如何实现一种具备任务分割、异步执行、而且还能让出执行权的解决方案呢。React给出了相应的解决方案。

阅读全文
LiveVideoStackCon | 面向在线教育业务的流媒体分发演进

几年前,很多人对在线网课还非常陌生。随着移动设备的普及和音视频技术的发展,如今在线教育产品百花齐放。而在线教育产品能服务千万学子离不开流媒体分发技术的支撑。本次LiveVideoStackCon
2021 音视频技术大会北京站邀请到了网易有道研发工程师周晓天,为我们分享网易有道在线教育业务的流媒体分发相关内容。

文 | 周晓天
整理 | LiveVideoStack

阅读全文
前端技术分享:页面性能优化问题复盘

项目背景

在 code_pc 项目中,前端需要使用 rrweb 对老师教学内容进行录制,学员可以进行录制回放。为减小录制文件体积,当前的录制策略是先录制一次全量快照,后续录制增量快照,录制阶段实际就是通过 MutationObserver 监听 DOM 元素变化,然后将一个个事件 push 到数组中。

为了进行持久化存储,可以将录制数据压缩后序列化为 JSON 文件。老师会将 JSON 文件放入课件包中,打成压缩包上传到教务系统中。学员回放时,前端会先下载压缩包,通过 JSZip 解压,取到 JSON 文件后,反序列化再解压后,得到原始的录制数据,再传入 rrwebPlayer 实现录制回放。

阅读全文
有道技术团队入选 2021 思否中国技术先锋年度评选两项榜单

2022 年 1 月 13 日,中国技术先锋年度评选 | 2021 SegmentFault
思否技术先锋年度榜单正式发布。网易有道技术团队同时登榜思否年度技术团队榜单中国技术品牌影响力企业

阅读全文