网易有道龙虾 NAS 服务器部署与实战指南

网易有道近期开源了桌面级 Agent——“LobsterAI”(有道龙虾)。作为一款定位为“7×24 小时全天候全场景个人助理”的智能体,它一经发布便备受开发者瞩目,开源首周 GitHub Star 数即突破 3K 。

项目开源地址https://github.com/netease-youdao/LobsterAI

本教程将以全新的 飞牛 FN EVO 2 NAS 服务器为例,为你提供一份“保姆级”的实操指南。我们将从零开始,带你走通 LobsterAI 在 NAS 上的环境构建与安装全流程,并深度解锁核心高阶玩法——如何在手机端通过 IM 工具,随时随地远程操控你的 NAS 专属 AI 助理。

一、NAS 初始化

1.1 硬件连接与开机

将飞牛 EVO 2 接入电源和网线,确保与你的电脑处于同一局域网。

按下电源按钮开机,等待系统就绪(指示灯稳定)。

1.2 网络认证(企业/校园网络)

如果在公司网络、校园网等需要登录认证才能联网的环境下:

请提前将飞牛 EVO 2 的 MAC 地址加入网络白名单,或联系网络管理员完成设备注册,确保 NAS 能正常联网。

MAC 地址可在设备背面标签或路由器管理页面中找到。

1.3 系统初始化

参照飞牛官方初始化教程完成系统安装与初始配置:

官方教程https://help.fnnas.com/articles/v1/devices/fnnas.md

主要步骤包括:

  • 在浏览器中访问 http://find.fnnas.com 或通过局域网扫描发现设备。
  • 按照引导完成管理员账户创建存储池配置(建议使用默认存储方案)。
  • 完成初始化后进入飞牛 OS 管理界面。

初始化后可以在「系统设置 → 设备信息」中查看设备配置:

本教程使用的飞牛 EVO 2 硬件配置:

项目 规格
设备名称 FN-EVO2-7653
CPU Intel(R) N150 / 4 核 4 线程
内存 16 GB DDR4 3200MHz
GPU Intel Alder Lake-N [Intel Graphics]
系统盘 SSD 91.92 GB

1.4 开启 SSH 远程访问

初始化完成后,需要开启 SSH 以便通过终端管理 NAS 系统:

  • 登录飞牛 OS Web 管理界面。
  • 进入「系统设置 → SSH」。
  • 将「SSH 功能」开关打开,确认端口为 22
  • 确保管理员账户(如 luna-fnos)的 SSH 权限为「允许登录」。

SSH 设置

1.5 SSH 连接测试

在你的电脑终端中执行:

ssh luna-fnos@

首次连接时输入 yes 确认指纹,然后输入管理员密码即可登录。

登录后可以查看系统版本信息:

cat /etc/os-release

SSH 连接测试

飞牛 OS 基于 Debian GNU/Linux 12 (bookworm),这意味着可以直接使用 apt 包管理器安装软件。


二、NAS 环境配置

2.1 安装 XFCE 桌面环境

LobsterAI 是基于 Electron 构建的桌面应用程序,需要图形化桌面环境才能运行。推荐安装 XFCE 桌面环境。

为什么选择 XFCE?

桌面环境 内存占用 适合场景 说明
XFCE(推荐) ~300 MB NAS / 低配设备 极其轻量,响应快,对 Intel N150 等低功耗 CPU 友好
LXDE / LXQt ~250 MB 极低配设备 比 XFCE 更轻但功能和美观度略逊
MATE ~400 MB 中等配置 传统桌面风格,比 XFCE 稍重
GNOME ~800 MB+ 高配设备 功能丰富但资源占用大,不适合 NAS
KDE Plasma ~600 MB+ 高配设备 高度可定制但偏重,不建议在 NAS 上使用

飞牛 EVO 2 搭载 Intel N150 + 16 GB 内存,XFCE 是最佳平衡选择——轻量且功能完整。

完整安装步骤:

# 1. 更新软件包索引
sudo apt update

# 2. 安装 XFCE 桌面环境(核心组件 + 常用工具)
sudo apt install -y xfce4 xfce4-goodies

# 3. 安装显示管理器(用于图形化登录)
sudo apt install -y lightdm

# 4. 设置 lightdm 为默认显示管理器(安装过程中如弹出选择框,选择 lightdm)
sudo dpkg-reconfigure lightdm

# 5. 安装中文字体(避免界面出现方块乱码)
sudo apt install -y fonts-noto-cjk

# 6. 重启系统,进入图形化桌面
sudo reboot

重启后系统会自动进入 LightDM 登录界面,使用管理员账户登录即可进入 XFCE 桌面。

2.2 安装 Node.js(v24.x)

LobsterAI 要求 Node.js >=24 < 25。Debian 12 默认源中的 Node.js 版本较低,需要通过 NodeSource 官方源安装。

# 1. 安装必要工具
sudo apt install -y curl ca-certificates gnupg

# 2. 添加 NodeSource v24.x 官方源
curl -fsSL https://deb.nodesource.com/setup_24.x | sudo -E bash -

# 3. 安装 Node.js(自带 npm)
sudo apt install -y nodejs

# 4. 验证安装版本
node --version && npm --version

Node.js 版本

确认输出版本满足要求:

  • Node.js: v24.14.0 ✓(>=24 < 25)
  • npm: 11.9.0 ✓

2.3 安装构建依赖

Electron 应用构建过程中需要一些原生编译工具:

# 安装构建工具链
sudo apt install -y build-essential python3 git

# 安装 Electron 运行所需的系统库
sudo apt install -y libgtk-3-0 libnotify4 libnss3 libxss1 libxtst6 \
    libatspi2.0-0 libdrm2 libgbm1 libasound2

三、LobsterAI 构建 & 测试

3.1 克隆项目

# 进入存储卷目录
cd /vol1

# 克隆 LobsterAI 仓库
git clone https://github.com/netease-youdao/LobsterAI.git

# 进入项目目录
cd LobsterAI

3.2 安装依赖

npm install

注意:首次安装依赖可能需要几分钟,期间会下载 Electron 二进制文件和原生模块。如果网络较慢,可以配置 npm 镜像。

3.3 构建生产版本

# TypeScript 编译 + Vite 打包
npm run build

# 构建 Linux 安装包(.AppImage 和 .deb)
npm run dist:linux

构建完成后,产物输出到 release/ 目录:

构建产物

构建产物说明:

文件 大小 说明
lobsterai_0.1.24_amd64.deb ~138 MB Debian 安装包(推荐使用)
LobsterAI-0.1.24.AppImage ~226 MB 免安装可执行文件
linux-unpacked/ 解压后的完整应用目录

3.4 安装 .deb 包

sudo apt install ./lobsterai_0.1.24_amd64.deb

apt install 会自动处理依赖关系。安装完成后可以通过以下方式启动:

桌面启动:在 XFCE 应用菜单中找到 LobsterAI 图标点击启动。

3.5 配置模型 & 运行测试

启动 LobsterAI 后,需要配置 AI 模型才能正常使用:

  • 打开 LobsterAI 应用,点击左下角「设置」。
  • 在模型配置区域填入你的 API Key 和模型选择(如 claude-sonnet-4-5-20250929)。
  • 回到主界面,创建一个新任务进行测试。

LobsterAI 运行效果

如图所示,LobsterAI 已在飞牛 EVO 2 的 XFCE 桌面上成功运行,界面显示正常,模型连接成功,可以正常对话。


四.手机端远程控制 NAS LobsterAI 实战案例

在上文中介绍了如何在飞牛 NAS 服务器中部署 LobsterAI,本章节聚焦手机端通过 IM 远程操控部署在 NAS 的 LobsterAI,给出了 5 类场景的多个实验案例。

远程控制核心机制

远程控制核心机制

LobsterAI 支持通过飞书、钉钉等 IM 平台进行远程控制。用户在手机上发一条消息,家里/公司部署了 LobsterAI 的 NAS 就会自动执行任务,执行完毕后将结果推送回 IM,实现 7×24 小时无人值守的 AI 助理体验。

下面介绍 4 类常见场景的实验案例:

一、信息流自动化

痛点:

每天手动刷各种新闻网站、社交媒体找有用信息,浪费大量时间精力。信息分散在多个平台,难以系统整理;对于追踪特定事件(如国际局势、行业动态),需要不间断关注多语种、多来源的报道,人力根本跟不上。

使用案例:每日新闻定时聚合推送

指令示例: 在飞书上给 LobsterAI 发送一条消息:

"每天下午17点总结当天的美伊战争最新新闻消息。精选10篇新闻文章,要求来源可信度要高,最好是各个国家的官方新闻,中英文新闻均可。要求总结为中文,生成Word文档,发送到我的指定邮箱 head_hand@163.com"

执行过程:

执行过程

第一步:LobsterAI 接收指令并自动拆解任务

收到飞书消息后,LobsterAI 自动将任务拆解为:创建定时任务 → 多源搜索 → 筛选排序 → 生成文档 → 邮件发送。

任务拆解

定时任务创建

第二步:定时触发,自动搜索多语种新闻,智能筛选与结构化整理

每天下午 17:00,LobsterAI 自动启动浏览器,针对"美伊战争""Iran US conflict""伊朗局势"等多组中英文关键词进行搜索,覆盖路透社、新华社、BBC、半岛电视台等国际主流媒体。

从数十条搜索结果中,按来源可信度、时效性、内容相关性进行排序,筛选出 10 篇高质量报道。对英文报道自动翻译为中文,每篇提炼一句话摘要 + 核心要点。

新闻搜索

第三步:生成 Word 文档并发送邮件

将整理结果生成排版美观的 Word 文档,包含:日期标题、10 篇文章的标题/来源/摘要/核心要点,以及整体局势简评。自动发送到指定邮箱。

邮件文档

邮件发送

最终效果:

用户每天下班时打开邮箱,当天的国际局势动态已经整理好了——10 篇精选报道、中文摘要、来源标注,全程零操作。不用自己去搜、不用自己去翻译、不用自己去整理,定时自动执行。通勤路上打开飞书还能看到摘要速览。

其他案例

  • Reddit 每日精选 + 偏好自学习: 安装 Reddit Skill 后,LobsterAI 每天自动抓取指定 subreddit 的热帖进行摘要推送,并在每次推送后询问反馈,持续迭代偏好记忆,越用越懂你。
  • 109+ 信息源科技新闻聚合: 安装 tech-news-digest Skill,内置 109 个信息源 + 自动去重,每日定时推送到 Discord 频道和邮箱,彻底替代手动刷新闻。
  • 邮件自动筛选分类 + 摘要推送: 每天早上自动读取新邮件,过滤广告和垃圾邮件,提炼重要邮件的核心结论,生成结构化摘要报告推送到 IM。
  • 社区需求挖掘 → 自动生成 Mini App: 让 LobsterAI 调研 Reddit/X 上过去 30 天的社区讨论,发现真实需求痛点后,直接生成一个 Mini App 网页来解决问题,跑通"发现需求→做出产品"的完整链路。

二、远程办公协作

痛点

在外面(通勤、出差、吃饭)时突然接到工作需求——老板要文件、要报告、要会议记录,但电脑不在身边。传统流程是先回到电脑前,搜资料、整理文档、做图表、排版,多步骤多工具耗时耗力。手机上操作效率极低,很多专业工具根本没有移动端。

使用案例:飞书一句话生成竞品分析 PPT

指令示例: 晚上打车回家,掏出手机在飞书上发一条消息:

"帮我做一份 AI 编程工具的竞品分析报告,输出为 PPT"

执行过程:

指令接收

第一步:LobsterAI 自动拆解为五步执行计划

收到指令后,LobsterAI 不需要追问,自动拆解任务:搜索竞品信息 → 整理对比文档 → 生成数据可视化 → 制作 PPT → 推送到飞书。

第二步:多轮搜索,逐个产品深挖

LobsterAI 启动浏览器,跑了十几轮 Google 搜索,对 Cursor、GitHub Copilot、Windsurf、Bolt 等 6 款 AI 编程工具分别搜索定价、功能特性、用户评测。

第三步:整合结构化对比文档

将搜索结果整合为结构化的 Markdown 竞品对比文档,覆盖 6 款产品的功能对比、定价策略、优劣势分析、市场定位。

第四步:生成交互式图表 + PPT

生成 HTML 数据可视化图表(功能雷达图、价格对比柱状图),再将全部内容写入 11 页 PPT。第一次构建报错后,LobsterAI 自动诊断修复,第二次成功通过。

第五步:推送完成通知和文件

向飞书发送消息卡片,附上报告摘要和核心发现,PPT 文件直接可下载。

PPT 生成过程

飞书推送结果

最终效果:

PPT 效果展示

从发出指令到收到完整 PPT,全程约 15 分钟。中间整个任务调用了五六十次工具,遇到一次构建错误自动修复,全程没问用户一句。到家打开电脑,一份可以直接拿去汇报的 10 页竞品分析 PPT 已经在飞书里等着了。

其他案例

  • 远程发送文件给同事/老板: 周末在外面吃火锅,老板钉钉要文件,给 LobsterAI 发消息"把桌面上的’销售数据.xlsx’发给张总",30 秒搞定,老板以为你在加班。
  • 地铁上远程整理会议记录: 通过钉钉发"把昨天的会议录音转成文字,整理出要点",不到 2 分钟整理好传到手机。
  • 通勤路上远程下载文件: 飞书发消息"去 Chrome 官网下载最新版安装包",到公司后直接安装。
  • 定时生成工作日报: 设置定时任务,每天下班前自动整理文档生成工作日报推送到飞书。

三、文件与系统管理

痛点:

下载文件夹常年不整理变成"垃圾场",桌面文件乱成一片;微信 PC 端每次转发文件都会生成新副本,常年累月几百 G 硬盘空间被吃掉。手动分类整理枯燥无聊,一不小心还可能删错东西。特别是在外面的时候,想远程整理家里电脑的文件根本没有好办法。

使用案例:远程清理重复文件

指令示例: 在手机飞书上给 NAS 上的 LobsterAI 发消息:

"列出下载目录中的文件,并删除重复的文件"

执行过程:

第一步:LobsterAI 扫描目标文件夹

LobsterAI 首先对下载文件夹进行全量扫描,统计文件数量等信息。

扫描文件夹

第二步:智能分类,确认待删除文件,发给用户确认

判断文件是否重复,列出重复待删除文件给用户。

重复文件列表

第三步:执行删除危险操作,再次发给用户确认

判断删除为危险操作,再次发给用户确认。

删除确认

第四步:最终确认删除,返回相关信息给飞书

最终效果:

文件清理完成

其他案例

  • 图片文件批量重命名: 把目录中图片按日期重命名并分类到对应日期文件夹。
  • 微信文件夹查重清理: LobsterAI 自己写 Bash 脚本,通过计算 MD5 哈希值精准识别重复文件。清理时不直接删除,而是移到带时间戳的备份目录,安全可回退。

四、生活与个人场景

痛点:

出行规划需要跨多个网站搜索航班、酒店、景点、签证政策,手机上来回切换效率低下,生活杂事虽然不复杂,但零碎耗时,占用大量碎片时间。

使用案例:手机远程研究出行攻略 + 同步 Obsidian 笔记

指令示例: 在手机飞书上给 NAS 上的 LobsterAI 发消息:

"帮我研究一个五一节去日本的出行计划并且保存到本地的 Obsidian。"

执行过程:

指令接收

第一步:LobsterAI 启动浏览器多维度搜索

NAS 上的 LobsterAI 自动打开浏览器,从机票比价、酒店推荐、景点攻略、签证政策、当地交通、汇率等多个维度搜索整理。

浏览器搜索

第二步:整理结构化出行计划

将搜索结果整合为结构化的出行计划,包含:行程概览(Day 1 ~ Day N)、每日安排(景点+交通+用餐建议)、预算估算表、必备物品清单、注意事项。

第三步:生成 Obsidian 格式笔记并保存

将出行计划转为 Obsidian 兼容的 Markdown 格式(包含双链、标签、折叠区块),自动保存到本地 Obsidian vault 目录。

Obsidian 笔记保存

第四步:推送完成通知

保存完成后,在飞书上回复用户,告知出行计划已保存到 Obsidian,并附上计划摘要供手机上快速浏览。

飞书推送通知

最终效果:

用户在手机上发了一条消息,回到家打开 Obsidian,一份完整的日本出行计划已经在笔记库里等着了——行程规划、预算估算、注意事项一应俱全,还是 Obsidian 原生格式,方便后续修改和关联其他笔记。手机上也能通过飞书消息快速浏览旅行计划。

其他案例

  • 手机远程搜索影视资源: 发消息"帮我找大侦探第 11 季的夸克或阿里云盘下载链接",LobsterAI 自动搜索网盘资源并返回有效链接。

关键优势总结

特性 说明
IM 远程控制 飞书、钉钉等平台全覆盖,手机发消息即触发
免内网穿透 飞书长连接方案,无需公网域名或 Ngrok
定时任务 支持 cron 定时,到点自动执行并推送结果
沙箱安全 优先沙箱运行,数据不出本地,防止误删系统文件
自主纠错 执行出错时自动诊断修复,无需人工介入
记忆系统 长记忆跨 session 复用,学习用户偏好,越用越懂你
本地部署 NAS 上 7×24 不间断运行

附录

常见问题

Q: 构建时报错 node-gyp 编译失败?
确保已安装构建工具链:sudo apt install -y build-essential python3

Q: 启动 LobsterAI 后界面白屏?
可能缺少 GPU 驱动或 Electron 渲染所需的系统库,尝试以 --no-sandbox 参数启动:

lobsterai --no-sandbox

Q: SSH 连接被拒绝?
检查飞牛 OS 的 SSH 开关是否已开启,端口是否为 22,防火墙是否放行。

环境信息汇总

项目 版本 / 信息
NAS 设备 飞牛 FN EVO 2 (FN-EVO2-7653)
操作系统 Debian GNU/Linux 12 (bookworm)
桌面环境 XFCE 4
Node.js v24.14.0
npm 11.9.0
LobsterAI v0.1.24

本教程基于 2026 年 3 月实际部署记录编写。如有问题请访问 LobsterAI GitHub Issues 反馈。

阅读全文
速来体验!基于有道子曰的翻译大模型2.0正式上线

自2022年11月30日ChatGPT问世,大语言模型在全球掀起热潮,众多高校、科研机构及AI企业纷纷投身其中,探索其在各行业的应用潜力与创新模式。

作为国内机器翻译领域深耕多年的技术团队,我们曾率先成功推出统计机器翻译及神经网络机器翻译服务,并持续迭代。
1、凭借丰富的业务生态与深厚的技术积累,2023年伊始,有道迅速开启以“应用落地” 为导向的翻译大模型自研之路。
2、经过持续的技术攻关和优化迭代,2023年6月,“子曰翻译大模型1.0”正式推出;
3、2024年5月,实现“子曰翻译大模型1.5”上线部署,至今已过去七个月。期间有道翻译的用户们积极使用我们的服务,并且慷慨地分享了众多极具价值的反馈与建议。

如今,子曰翻译大模型2.0已正式与大家见面,这象征着我们在语言翻译技术的征途上又迈出了坚实而重要的一步,相信能够为我们的用户带来更加出色的翻译体验。

从1.5到2.0, 质的飞跃

整体性能上,子曰翻译大模型 2.0 相较于1.5版本实现了质的飞跃。这背后,是我们从数据、算法以及评估三个关键维度所展开的深入探索与系统性升级。

在数据层面,为训练面向翻译任务的基座模型,我们精心收集了并严格清洗了数千万高质量的翻译数据。不仅确保了数据的准确性与适配性,为模型训练打下了牢固的根基,更极大地丰富了数据资源库,让模型在多样化翻译场景中游刃有余。此外,我们基于海量的翻译提示进行了精细化的人工标注,有效地提升了数据标注的质量,为模型执行翻译任务提供了精准的指导。

在算法层面,以子曰教育大模型为基础,我们进行了二次预训练,成功打造出了更具专业性与针对性的翻译基座大模型,显著提升了翻译性能。这其中,我们运用了先进的大模型蒸馏技术,让模型在精简参数的同时,运行效率与推理速度大幅提升;创新性地使用了大模型融合技术,将多个模型优势进行整合,进一步增强了翻译的准确性与稳定性;我们还实现了基于人类偏好的翻译数据自动获取,并以此进行强化学习;通过引入Online DPO技术,动态调整模型生成策略,保证了译文的质量与流畅度的提升。此外,多任务联合学习的开展,让模型能够在多个翻译任务中协同进步,综合翻译能力得到了显著增强。

在评估层面,我们人工标注了覆盖各个领域的开发集和盲测集,严格确保了测试数据的全面性和代表性。我们对算法团队所使用的开发集和盲测数据集实行严格分离、相互独立,以确保评估的客观性与准确性,模型最终效果以盲测集效果为准。在自动指标评估上,除了基于comet的自动化指标,我们还自主训练了超越comet准确率的基于大模型的翻译评估模型,为性能评估提供更可靠依据。同时,我们设计并执行了更完善的人工评估方案,从多维度对模型的翻译结果进行细致地分析和评价。

正是通过这三个层面的全方位优化与升级,子曰翻译大模型2.0在翻译质量、效率以及鲁棒性等方面实现了质的飞跃,能够为用户带来更优质、精准的翻译服务。

性能远超国内外通用大模型及专用翻译模型

为了展示子曰翻译大模型 2.0 的性能,我们在WMT以及Flores200的测试集上进行了中英互译的基准测试。
微信图片_20250114103215
微信图片_20250114104558
(采用测试集测试的结果)

为精准、客观地评估子曰翻译大模型2.0中英互译能力在行业中的表现,我们与多个国内外领先通用大模型及专业翻译器如DeepL Pro,进行了人工评估对比。

通过严谨的人工采集流程,我们构建了涵盖人文学科、商学、生活服务、医疗、科学等多个领域的数据样本集,并制定了全面精细的MQM评测方案,从专业性、准确性、语言惯例和风格等维度打分。

最终,五位资深翻译专家独立评估的结果汇总如下:

微信图片_20250114104606

以上对比,凸显了子曰翻译大模型2.0在专有闭源模型中的竞争优势——在翻译准确性和流畅度上,远优于国内外通用大模型及专用翻译模型。

该测试不仅客观地呈现了我们的优势,也精准地指明了未来有待优化和改进的方向,坚定了我们在机器翻译领域持续推进改进与创新的决心。

但我们深知仍面临诸多挑战,在后续的工作中,我们将全力去推进支持更长文本输入、拓展更多模态的输入,以及增加更多语种的支持工作,我们期待在不久之后下一代子曰翻译大模型能跟大家见面。

在此欢迎各位持续关注更多有道AI技术的进展与突破,也诚邀大家前来体验“子曰翻译大模型 2.0”,期待您的反馈。

附:可体验入口

1、有道词典APP-首页入口

微信图片_20250114104613

2、有道翻译桌面版-首页入口

微信图片_20250114104621

3、有道翻译网页端-AI翻译入口

微信图片_20250114104626

阅读全文
智心顾问:为心智障碍家庭带来温暖与专业支持

关爱从心开始 —— 理解心智障碍

在这个世界上,有这样一群特殊的群体——心智障碍者。他们通常伴随着个体认知、社会互动和学习能力的障碍。这些障碍可能源于遗传、环境或未知因素,但不应成为他们照护者获得信息和支持的阻碍。心智障碍者的家庭是更需要提供帮助的群体。从小家到大家: 让心智障碍者家庭不孤单、不绝望!

用心倾听,用爱解答 —— "智心顾问"为心智障碍者提供专业咨询服务

通常心智障碍者获得帮助的渠道比较有限,一些机构的资源和能力又不太足够。"智心顾问"是一个温暖的平台,专为解答心智障碍群体有关的问题,旨在以温柔、简明的方式,搭建起理解与支持的桥梁。无论是解决日常照护的困惑,还是寻求专业教育的建议,只需轻敲键盘,“智心顾问”便能即时提供量身定制的答案。

心智1xin

连接你我,解答疑惑 —— 以QAnything为技术支撑提供更智能的服务

QAnything为“智心顾问”提供了底层技术支撑,将各种心智障碍者家庭支持资源手册、收集的网址服务链接通通喂给它,QAnything都可以消化并转化为知识,提供专业精准的问答服务。QAnything不仅有领先的RAG引擎,而且简单易用,几步操作即可完成专属bot的搭建,同时支持发布分享,为更多人提供帮助和支持。

心智2xin

欢迎体验 —— 让爱传递

我们诚邀您体验“智心顾问”,无论您是心智障碍者的家庭成员、教育工作者还是社会支持者,您都可以参与体验,相信在体验的过程中您也会对心智障碍者产生更多的包容和理解。您可以通过点击网址链接或扫描二维码来参与,如果喜欢,请您点一个赞,同时请您参加我们的满意度调查,真诚欢迎您的使用。

网址:https://ai.youdao.com/saas/qanything/#/bots/C9FAF5FC1824461C/share

二维码:

微信图片_20231110190256

阅读全文
网易有道上线“易魔声” 开源语音合成引擎 用户可免费下载使用

刚刚,我们上线了「易魔声」开源语音合成(TTS)引擎!

「易魔声」,是一款有道自研TTS引擎,目前支持中英文双语,包含2000多种不同的音色,更有特色的情感合成功能,支持合成包含快乐、兴奋、悲伤、愤怒等广泛情感的语音。

「易魔声」中文 网易有道 17秒

(我们用「易魔声」将以上这段话进行了技术合成,点击试听 )

用户可免费在开源社区GitHub进行下载使用
地址:https://github.com/netease-youdao/EmotiVoice

通过我们提供的web界面、及批量生成结果的脚本接口,轻松实现音色的情感合成与应用。

640
GitHub开源界面,点击红色字可跳转)

在你过往的回忆里,是不是也有一些特别的声音,比如:偶像的声音激励人心、妈妈的声音让我们一秒回忆起小时候……声音,作为语言维度的一种,总是蕴含着人类充沛的情感表达。而富有情感的合成语音,是能够为应用和内容增色的AI功能。

现在通过「易魔声」,简单通过在文本中加入情感的描述提示,开发者或者内容创作者就可以自由合成符合自己需求的带有情感的语音,比传统TTS更加自然逼真!

「易魔声」,是有道AI团队今年开发的一个项目。随着基于GAN等现代AI技术的语音能力越来越成熟,实现一个质量较高的TTS系统的门槛越来越低。但即使如此,中英双语的高质量、现代TTS模块还是不容易找到,要在自己的应用与内容中加入高逼真度且高度可控的语音,特别是中英双语的语音,依然比较麻烦。

这也是我们将这个项目开源的初衷,希望能帮助有需求的开发者与内容创作者,并不断扩大高质量TTS的应用范围。目前该项目还处于初期阶段,期待大家在开源网站给予我们更多反馈,我们非常希望听到大家的使用体验与建议,欢迎各位进群交流~

微信图片_20231110171247

如果若二维码失效,可添加我们工作人员的企业微信申请进群~
微信图片_20231110190256

借此机会,我们也邀请您了解和探索有道的更多酷炫AI技术

  • 您可以尝试我们的声音定制和声音复刻功能(点击红字即可试用)。从用户录制到试听整个过程只需5分钟,即可完成个性化的声音定制。

  • 您也可以和Hi Echo虚拟人口语私教(点击红字即可跳转)聊一聊。通过有道的「子曰」教育大模型、语音和虚拟人技术,Echo可以陪你轻松练习地道的英语口语。每天练习10分钟,口语水平快速提高哦。

  • 您还可以微信搜索“有道智云体验中心”小程序。在这里,可以访问我们已经对开发者通过API等形式开放的文本和图像翻译、文字和各类图片识别、作文批改等各类AI技术。

关于有道智云

有道智云AI开放平台,是网易有道旗下一站式人工智能服务提供商,为开发者、企业和政府机构等提供自然语言翻译、文字识别、OCR、语音识别等服务以及行业解决方案,致力于提供安全、可靠和高效的云服务。

联系电话:010-8255-8901;商务合作:AIcloud_Business@corp.youdao.com.

想了解更多关于有道人工智能的内容,可访问“有道智云”官网https://ai.youdao.com.

阅读全文
周枫:当我们谈论大模型时,应该关注哪些新能力?

基于大语言模型技术的ChatGPT推出已经有4个月了,更多同类产品还在快速出现。比如,前天谷歌更新了Bard,将辅助编程能力支持的语言数量扩展到20种。

然而,对大模型技术的重要性也出现了质疑,前段时间,吴军老师就评价ChatGPT不算新技术革命,带不来什么新的机会,他认为大模型仍然存在很多限制,不像大家追捧的那样有吸引力。这篇文章发布后,网上也出现了多篇反驳文章。我不太关注这些争论,但我认为有一个问题没有被充分讨论,那就是大模型带来的新能力中,哪些是最为关键的,最有可能带来长期影响的

我认为,与之前众多的自然语言处理技术相比,大语言模型至少具有三项根本性新能力,这些新能力在学术界已经被广泛讨论,甚至被视为常识,但是在产业界和产品团队中却缺乏足够的关注。实际上,这些大模型技术的特点已经改变了我们对业务和产品规划的思考方式,也会改变很多产品的经济模型。因此,产品经理和业务负责人需要更多地关注和深入思考这些新能力的应用场景。

能力一:涌现能力(emergent abilities)

涌现能力指的是在小型模型中并不存在,但在大模型中“突然出现”的能力,其中包括常识推理、问答、翻译、数学、摘要等(详见下图)。如果仅依靠小型模型的能力做线性外推,往往无法预测出涌现能力的出现和其强度。OpenAI的首席技术官Ilya Sutskever在接受采访时反复强调,尽管表面上看来,语言模型只是在预测下一个词元(token),但当模型足够大,transformer技术的建模能力足够强时,基于内部表示的推理能力就会出现。因此,模型会呈现出与规模较小时完全不同的行为,涌现全新的能力。

涌现能力之所以重要,不仅因为它们是大模型出现后才有的新能力,而且由大模型涌现出来的多数是非常重要的能力。例如,常识推理能力一直是AI领域的重大难题,而大模型的出现使得常识推理取得了重大进展。此外,大模型还有机会进一步获得更多能力。例如,一旦“推理”能力涌现,“思维链提示”(Chain of Thought Prompting)策略就可以用来解决多步推理的难题。因此,涌现能力的出现,是大模型带来的一项根本性变化。

能力二:作为基座模型支持多元应用的能力
在2021年,斯坦福大学等多所高校的研究人员提出了基座模型(foundation model)的概念,这更清晰地描述了之前学界所称的预训练模型的作用。这是一种全新的AI技术范式,借助于海量无标注数据的训练,获得可以适用于大量下游任务的大模型(单模态或者多模态)。这样,多个应用可以只依赖于一个或少数几个大模型进行统一建设。

640
上图展示了基座模型的结构,基座模型集中化了多模态数据,并且可以适配多元化的下游任务。

大语言模型是这个新模式的典型例子,使用统一的大模型可以极大地提高研发效率,相比于分散的模型开发方式,这是一项本质上的进步。大型模型不仅可以缩短每个具体应用的开发周期,减少所需人力投入,也可以基于大模型的推理、常识和写作能力,获得更好的应用效果。因此,大模型可以成为AI应用开发的大一统基座模型,这是一个一举多得、全新的范式,值得大力推广。

能力三:支持对话作为统一入口的能力

让大语言模型真正火爆的契机,是基于对话聊天的ChatGPT。事实上,业界很早就发现了用户对于对话交互的特殊偏好,陆奇在微软期间2016年就推进“对话即平台(conversation as a platform)”的战略。此外,苹果Siri、亚马逊Echo等基于语音对话的产品也非常受欢迎,反映出互联网用户对于聊天和对话这种交互模式的偏好。虽然之前的聊天机器人存在各种问题,但大型语言模型的出现再次让聊天机器人这种交互模式可以重新想像。用户愈发期待像钢铁侠中“贾维斯”一样的人工智能,无所不能、无所不知。这引发我们对于智能体(Agent)类型应用前景的思考,Auto-GPT、微软Jarvis等项目已经出现并受到关注,相信未来会涌现出很多类似的以对话形态让助手完成各种具体工作的项目。
640 (1)
图为微软最新项目Jarvis的工作流程,Jarvis将通过任务规划、模型选择、任务执行、生成响应四个步骤,结合HuggingFace上的众多模型,完成多模态的复杂AI任务。

随着大型语言模型技术越来越受欢迎,我们可以期待它带来更多的惊喜,特别是考虑到上面讨论的这些大型模型带来的关键新能力,周明等人所预测的语言智能黄金十年(2020-2030)很可能会成为现实,这正是一个令人兴奋的时代。

阅读全文
测试在项目流程中的那些事儿

前言

测试作为整个项目中的一环,在项目流程中起着不可或缺的作用。部分团队是缺少项目管理角色的,这个时候,测试对项目流程的推进、项目质量的保证显得尤为重要。好的测试,能在整个项目流程中以QA角度做好项目管理和及时的风险预警,让项目如期上线且保障质量。业界一直强调测试前置,那么测试在项目中,如何根据项目情况做前置工作推进项目流程,让大家都开心工作呢?本文以自己所在的项目组为例讲述项目流程中的一些事,希望可以与大家一同探讨~

阅读全文