有道技术沙龙博客-分享有道人的技术思考

发表于: 2025/01/14 | 阅读数: 1

自2022年11月30日ChatGPT问世，大语言模型在全球掀起热潮，众多高校、科研机构及AI企业纷纷投身其中，探索其在各行业的应用潜力与创新模式。

作为国内机器翻译领域深耕多年的技术团队，我们曾率先成功推出统计机器翻译及神经网络机器翻译服务，并持续迭代。
1、凭借丰富的业务生态与深厚的技术积累，2023年伊始，有道迅速开启以“应用落地” 为导向的翻译大模型自研之路。
2、经过持续的技术攻关和优化迭代，2023年6月，“子曰翻译大模型1.0”正式推出；
3、2024年5月，实现“子曰翻译大模型1.5”上线部署，至今已过去七个月。期间有道翻译的用户们积极使用我们的服务，并且慷慨地分享了众多极具价值的反馈与建议。

如今，子曰翻译大模型2.0已正式与大家见面，这象征着我们在语言翻译技术的征途上又迈出了坚实而重要的一步，相信能够为我们的用户带来更加出色的翻译体验。

从1.5到2.0, 质的飞跃

整体性能上，子曰翻译大模型 2.0 相较于1.5版本实现了质的飞跃。这背后，是我们从数据、算法以及评估三个关键维度所展开的深入探索与系统性升级。

在数据层面，为训练面向翻译任务的基座模型，我们精心收集了并严格清洗了数千万高质量的翻译数据。不仅确保了数据的准确性与适配性，为模型训练打下了牢固的根基，更极大地丰富了数据资源库，让模型在多样化翻译场景中游刃有余。此外，我们基于海量的翻译提示进行了精细化的人工标注，有效地提升了数据标注的质量，为模型执行翻译任务提供了精准的指导。

在算法层面，以子曰教育大模型为基础，我们进行了二次预训练，成功打造出了更具专业性与针对性的翻译基座大模型，显著提升了翻译性能。这其中，我们运用了先进的大模型蒸馏技术，让模型在精简参数的同时，运行效率与推理速度大幅提升；创新性地使用了大模型融合技术，将多个模型优势进行整合，进一步增强了翻译的准确性与稳定性；我们还实现了基于人类偏好的翻译数据自动获取，并以此进行强化学习；通过引入Online DPO技术，动态调整模型生成策略，保证了译文的质量与流畅度的提升。此外，多任务联合学习的开展，让模型能够在多个翻译任务中协同进步，综合翻译能力得到了显著增强。

在评估层面，我们人工标注了覆盖各个领域的开发集和盲测集，严格确保了测试数据的全面性和代表性。我们对算法团队所使用的开发集和盲测数据集实行严格分离、相互独立，以确保评估的客观性与准确性，模型最终效果以盲测集效果为准。在自动指标评估上，除了基于comet的自动化指标，我们还自主训练了超越comet准确率的基于大模型的翻译评估模型，为性能评估提供更可靠依据。同时，我们设计并执行了更完善的人工评估方案，从多维度对模型的翻译结果进行细致地分析和评价。

正是通过这三个层面的全方位优化与升级，子曰翻译大模型2.0在翻译质量、效率以及鲁棒性等方面实现了质的飞跃，能够为用户带来更优质、精准的翻译服务。

性能远超国内外通用大模型及专用翻译模型

为了展示子曰翻译大模型 2.0 的性能，我们在WMT以及Flores200的测试集上进行了中英互译的基准测试。

（采用测试集测试的结果）

为精准、客观地评估子曰翻译大模型2.0中英互译能力在行业中的表现，我们与多个国内外领先通用大模型及专业翻译器如DeepL Pro，进行了人工评估对比。

通过严谨的人工采集流程，我们构建了涵盖人文学科、商学、生活服务、医疗、科学等多个领域的数据样本集，并制定了全面精细的MQM评测方案，从专业性、准确性、语言惯例和风格等维度打分。

最终，五位资深翻译专家独立评估的结果汇总如下：

以上对比，凸显了子曰翻译大模型2.0在专有闭源模型中的竞争优势——在翻译准确性和流畅度上，远优于国内外通用大模型及专用翻译模型。

该测试不仅客观地呈现了我们的优势，也精准地指明了未来有待优化和改进的方向，坚定了我们在机器翻译领域持续推进改进与创新的决心。

但我们深知仍面临诸多挑战，在后续的工作中，我们将全力去推进支持更长文本输入、拓展更多模态的输入，以及增加更多语种的支持工作，我们期待在不久之后下一代子曰翻译大模型能跟大家见面。

在此欢迎各位持续关注更多有道AI技术的进展与突破，也诚邀大家前来体验“子曰翻译大模型 2.0”，期待您的反馈。

附：可体验入口

1、有道词典APP-首页入口

2、有道翻译桌面版-首页入口

3、有道翻译网页端-AI翻译入口

主题: 未分类 | 标签:

阅读全文

智心顾问：为心智障碍家庭带来温暖与专业支持

发表于: 2024/06/24 | 阅读数: 1

关爱从心开始 —— 理解心智障碍

在这个世界上，有这样一群特殊的群体——心智障碍者。他们通常伴随着个体认知、社会互动和学习能力的障碍。这些障碍可能源于遗传、环境或未知因素，但不应成为他们照护者获得信息和支持的阻碍。心智障碍者的家庭是更需要提供帮助的群体。从小家到大家: 让心智障碍者家庭不孤单、不绝望!

用心倾听，用爱解答 —— "智心顾问"为心智障碍者提供专业咨询服务

通常心智障碍者获得帮助的渠道比较有限，一些机构的资源和能力又不太足够。"智心顾问"是一个温暖的平台，专为解答心智障碍群体有关的问题，旨在以温柔、简明的方式，搭建起理解与支持的桥梁。无论是解决日常照护的困惑，还是寻求专业教育的建议，只需轻敲键盘，“智心顾问”便能即时提供量身定制的答案。

连接你我，解答疑惑 —— 以QAnything为技术支撑提供更智能的服务

QAnything为“智心顾问”提供了底层技术支撑，将各种心智障碍者家庭支持资源手册、收集的网址服务链接通通喂给它，QAnything都可以消化并转化为知识，提供专业精准的问答服务。QAnything不仅有领先的RAG引擎，而且简单易用，几步操作即可完成专属bot的搭建，同时支持发布分享，为更多人提供帮助和支持。

欢迎体验 —— 让爱传递

我们诚邀您体验“智心顾问”，无论您是心智障碍者的家庭成员、教育工作者还是社会支持者，您都可以参与体验，相信在体验的过程中您也会对心智障碍者产生更多的包容和理解。您可以通过点击网址链接或扫描二维码来参与，如果喜欢，请您点一个赞，同时请您参加我们的满意度调查，真诚欢迎您的使用。

网址：https://ai.youdao.com/saas/qanything/#/bots/C9FAF5FC1824461C/share

二维码：

主题: 未分类 | 标签:

阅读全文

网易有道上线“易魔声” 开源语音合成引擎用户可免费下载使用

发表于: 2023/11/10 | 阅读数: 1

刚刚，我们上线了「易魔声」开源语音合成（TTS）引擎！

「易魔声」，是一款有道自研TTS引擎，目前支持中英文双语，包含2000多种不同的音色，更有特色的情感合成功能，支持合成包含快乐、兴奋、悲伤、愤怒等广泛情感的语音。

「易魔声」中文网易有道 17秒

（我们用「易魔声」将以上这段话进行了技术合成，点击试听）

用户可免费在开源社区GitHub进行下载使用
地址：https://github.com/netease-youdao/EmotiVoice

通过我们提供的web界面、及批量生成结果的脚本接口，轻松实现音色的情感合成与应用。

（GitHub开源界面，点击红色字可跳转）

在你过往的回忆里，是不是也有一些特别的声音，比如：偶像的声音激励人心、妈妈的声音让我们一秒回忆起小时候……声音，作为语言维度的一种，总是蕴含着人类充沛的情感表达。而富有情感的合成语音，是能够为应用和内容增色的AI功能。

现在通过「易魔声」，简单通过在文本中加入情感的描述提示，开发者或者内容创作者就可以自由合成符合自己需求的带有情感的语音，比传统TTS更加自然逼真！

「易魔声」，是有道AI团队今年开发的一个项目。随着基于GAN等现代AI技术的语音能力越来越成熟，实现一个质量较高的TTS系统的门槛越来越低。但即使如此，中英双语的高质量、现代TTS模块还是不容易找到，要在自己的应用与内容中加入高逼真度且高度可控的语音，特别是中英双语的语音，依然比较麻烦。

这也是我们将这个项目开源的初衷，希望能帮助有需求的开发者与内容创作者，并不断扩大高质量TTS的应用范围。目前该项目还处于初期阶段，期待大家在开源网站给予我们更多反馈，我们非常希望听到大家的使用体验与建议，欢迎各位进群交流~

如果若二维码失效，可添加我们工作人员的企业微信申请进群~

借此机会，我们也邀请您了解和探索有道的更多酷炫AI技术

您可以尝试我们的声音定制和声音复刻功能（点击红字即可试用）。从用户录制到试听整个过程只需5分钟，即可完成个性化的声音定制。
您也可以和Hi Echo虚拟人口语私教（点击红字即可跳转）聊一聊。通过有道的「子曰」教育大模型、语音和虚拟人技术，Echo可以陪你轻松练习地道的英语口语。每天练习10分钟，口语水平快速提高哦。
您还可以微信搜索“有道智云体验中心”小程序。在这里，可以访问我们已经对开发者通过API等形式开放的文本和图像翻译、文字和各类图片识别、作文批改等各类AI技术。

关于有道智云

有道智云AI开放平台，是网易有道旗下一站式人工智能服务提供商，为开发者、企业和政府机构等提供自然语言翻译、文字识别、OCR、语音识别等服务以及行业解决方案，致力于提供安全、可靠和高效的云服务。

联系电话：010-8255-8901；商务合作：AIcloud_Business@corp.youdao.com.

想了解更多关于有道人工智能的内容，可访问“有道智云”官网https://ai.youdao.com.

主题: 未分类 | 标签:

阅读全文

周枫：当我们谈论大模型时，应该关注哪些新能力？

发表于: 2023/04/24 | 阅读数: 1

基于大语言模型技术的ChatGPT推出已经有4个月了，更多同类产品还在快速出现。比如，前天谷歌更新了Bard，将辅助编程能力支持的语言数量扩展到20种。

然而，对大模型技术的重要性也出现了质疑，前段时间，吴军老师就评价ChatGPT不算新技术革命，带不来什么新的机会，他认为大模型仍然存在很多限制，不像大家追捧的那样有吸引力。这篇文章发布后，网上也出现了多篇反驳文章。我不太关注这些争论，但我认为有一个问题没有被充分讨论，那就是大模型带来的新能力中，哪些是最为关键的，最有可能带来长期影响的。

我认为，与之前众多的自然语言处理技术相比，大语言模型至少具有三项根本性新能力，这些新能力在学术界已经被广泛讨论，甚至被视为常识，但是在产业界和产品团队中却缺乏足够的关注。实际上，这些大模型技术的特点已经改变了我们对业务和产品规划的思考方式，也会改变很多产品的经济模型。因此，产品经理和业务负责人需要更多地关注和深入思考这些新能力的应用场景。

能力一：涌现能力（emergent abilities）

涌现能力指的是在小型模型中并不存在，但在大模型中“突然出现”的能力，其中包括常识推理、问答、翻译、数学、摘要等（详见下图）。如果仅依靠小型模型的能力做线性外推，往往无法预测出涌现能力的出现和其强度。OpenAI的首席技术官Ilya Sutskever在接受采访时反复强调，尽管表面上看来，语言模型只是在预测下一个词元（token），但当模型足够大，transformer技术的建模能力足够强时，基于内部表示的推理能力就会出现。因此，模型会呈现出与规模较小时完全不同的行为，涌现全新的能力。

涌现能力之所以重要，不仅因为它们是大模型出现后才有的新能力，而且由大模型涌现出来的多数是非常重要的能力。例如，常识推理能力一直是AI领域的重大难题，而大模型的出现使得常识推理取得了重大进展。此外，大模型还有机会进一步获得更多能力。例如，一旦“推理”能力涌现，“思维链提示”（Chain of Thought Prompting）策略就可以用来解决多步推理的难题。因此，涌现能力的出现，是大模型带来的一项根本性变化。

能力二：作为基座模型支持多元应用的能力
在2021年，斯坦福大学等多所高校的研究人员提出了基座模型（foundation model）的概念，这更清晰地描述了之前学界所称的预训练模型的作用。这是一种全新的AI技术范式，借助于海量无标注数据的训练，获得可以适用于大量下游任务的大模型（单模态或者多模态）。这样，多个应用可以只依赖于一个或少数几个大模型进行统一建设。

上图展示了基座模型的结构，基座模型集中化了多模态数据，并且可以适配多元化的下游任务。

大语言模型是这个新模式的典型例子，使用统一的大模型可以极大地提高研发效率，相比于分散的模型开发方式，这是一项本质上的进步。大型模型不仅可以缩短每个具体应用的开发周期，减少所需人力投入，也可以基于大模型的推理、常识和写作能力，获得更好的应用效果。因此，大模型可以成为AI应用开发的大一统基座模型，这是一个一举多得、全新的范式，值得大力推广。

能力三：支持对话作为统一入口的能力

让大语言模型真正火爆的契机，是基于对话聊天的ChatGPT。事实上，业界很早就发现了用户对于对话交互的特殊偏好，陆奇在微软期间2016年就推进“对话即平台（conversation as a platform）”的战略。此外，苹果Siri、亚马逊Echo等基于语音对话的产品也非常受欢迎，反映出互联网用户对于聊天和对话这种交互模式的偏好。虽然之前的聊天机器人存在各种问题，但大型语言模型的出现再次让聊天机器人这种交互模式可以重新想像。用户愈发期待像钢铁侠中“贾维斯”一样的人工智能，无所不能、无所不知。这引发我们对于智能体（Agent）类型应用前景的思考，Auto-GPT、微软Jarvis等项目已经出现并受到关注，相信未来会涌现出很多类似的以对话形态让助手完成各种具体工作的项目。

图为微软最新项目Jarvis的工作流程，Jarvis将通过任务规划、模型选择、任务执行、生成响应四个步骤，结合HuggingFace上的众多模型，完成多模态的复杂AI任务。

随着大型语言模型技术越来越受欢迎，我们可以期待它带来更多的惊喜，特别是考虑到上面讨论的这些大型模型带来的关键新能力，周明等人所预测的语言智能黄金十年（2020-2030）很可能会成为现实，这正是一个令人兴奋的时代。

主题: 技术分享 | 标签:

阅读全文

测试在项目流程中的那些事儿

发表于: 2022/03/17 | 阅读数: 1 作者: 有道技术团队

前言

测试作为整个项目中的一环，在项目流程中起着不可或缺的作用。部分团队是缺少项目管理角色的，这个时候，测试对项目流程的推进、项目质量的保证显得尤为重要。好的测试，能在整个项目流程中以QA角度做好项目管理和及时的风险预警，让项目如期上线且保障质量。业界一直强调测试前置，那么测试在项目中，如何根据项目情况做前置工作推进项目流程，让大家都开心工作呢？本文以自己所在的项目组为例讲述项目流程中的一些事，希望可以与大家一同探讨~

主题: 未分类 | 标签:

阅读全文

程序设计优化之管道数据流

发表于: 2022/03/10 | 阅读数: 1 作者: 有道技术团队

摘要

计算机基础的同学估计对管道这个词都不陌生了，尤其是在Linux系统当中，管道操作符已经被广泛的使用，并给我们的变成带来了极大的便利。前端领域比较注明的脚手架“gulp”也是以其管道操作著称。
今天我们就来一步步抽丝剥茧，看看在前端领域的“管道数据流”要如何设计。

主题: 未分类 | 标签:

阅读全文